09. Проверка гипотез в двухвыборочных задачах

Область применения. Рассмотрим часто встречающуюся на практике задачу сравнения двух выборочных совокупностей. В духе основной статистической предпосылки мы будем рассматривать эти совокупности как случайные. Например, нас может интересовать сравнение двух методов обработки, т. е. двух разных действий, направленных к одной цели: двух лекарств, двух рационов питания, двух методик обучения или профессиональной подготовки и т. д.

Данные. Для исследования нужны однородные объекты, разделенные на две группы. Взаимные влияния и взаимодействия объектов должны быть исключены. Для каждого объекта регистрируется некоторая его числовая характеристика. Возникающие при этом две группы чисел можно рассматривать как две независимые выборки.

Постановка задачи. Рассмотрим вопрос о том, какие задачи целесообразно рассматривать при сравнении двух выборок. Вспомним, что обычно две выборки получаются как характеристики двух обработок, то есть как результаты применения различных условий эксперимента к двум группам однородных объектов. Опыт применения статистики показывает, что изменение условий эксперимента обычно сказывается прежде всего на изменении положения распределения измеряемой числовой характеристики на числовой прямой. Масштаб и форма распределения при малых изменениях условий эксперимента обычно остаются практически неизменными. При больших различиях в условиях эксперимента наряду с изменением положения распределения изменяется и его разброс (дисперсия). И совсем редко происходит изменение самой формы распределения. Поэтому при исследовании различий в двух выборках часто предполагают, что законы рАСпределения двух анализируемых выборок отличаются только сдвигом, т. е. принадлежат Сдвиговому семейству распределений.

Определение. Распределение G(X) принадлежит сдвиговому семейству распределений F, задаваемому распределением F(X), если существует такая Q, что для любого .

Другими словами, если случайная величина X имеет распределение F(X), то распределение G(X) случайной величины H принадлежит сдвиговому семейству F тогда и только тогда, когда для некоторого неслучайного числа Q распределения случайных величин H и совпадают.

Для некоторых сдвиговых семейств (например, для семейства, порожденного нормальным распределением) построены весьма эффективные критерии для проверки гипотезы Н против альтернатив сдвига . Однако эти критерии предполагают, что F и G принадлежат определенному семейству, а поэтому могут давать неправильные результаты при невыполнении этого условия. Другой класс критериев — непараметрические критерии, — не требует этого предположения. Такие критерии не зависят от распределений F и G (если эти распределения непрерывны), и эффективно работают при более широком классе альтернатив. В частности, с их помощью можно найти различия в случайных величинах при альтернативах и . Дадим определения этих понятий.

Определение. Мы говорим, что , где F и G — функции распределения, если для любого числа х выполняется . Мы говорим, что , если для любого числа х выполняется .

Смысл этого определения состоит в том, что при случайная величина X, имеющая закон распределения F, имеет тенденцию принимать меньшие значения, чем случайная величина Y с законом распределения G, т. е. для любого Х выполняется .

Методы. Ниже мы расскажем, как проверить однородность двух выборок с помощью Критерия Манна-Уитни или Критерия УилкокСона.

© 2011-2024 Контрольные работы по математике и другим предметам!