05.3. Определение параметров выборки с помощью теоремы Ляпунова

В предыдущем параграфе выяснено, что применение теоремы Чебышева позволяет решать вопросы о достижении требуемого предела отклонения выборочной средней от генеральной и, в частности, о степени надежности, т. Е. вероятности соблюдения этого предела при данном объеме выборки, а также о необходимом объеме выборки при заданной границе надежности. Но ответы на все эти вопросы выражаются в виде неравенств.

Так, искомая вероятность дается неравенством , или ; требуемый объем (N) выборки определяется неравенством , предел отклонения устанавливается неравенством .

Такое выражение параметров выборки лишено нужной точности, так как применение теорем закона больших чисел дает слишком грубую оценку вероятности и поэтому остается неизвестным, насколько искомая вероятность превышает найденную границу.

Возможность устранить эту неопределенность возникла на основании доказанной А. М. Ляпуновым центральной предельной теоремы. Она устанавливает, что сумма П независимых случайных величин, заданных произвольным распределением, но удовлЕТворяющих определенным условиям, при достаточно большом П подчиняется закону, сколь угодно близкому к нормальному распределению. Это позволяет применить для вычисления вероятности выполнения неравенства функцию Лапласа

.

Искомая вероятность определяется по формуле

(здесь вместо принятого в теореме Лапласа обозначения A мы вводим T для сопоставления результата с оценкой по теореме Чебышева).

Сравнение результатов вычисления Р для ряда значений дает:

Значения T

По теореме Чебышева

По результатам теоремы Ляпунова

1

2

3

4

5

Р > 0

Р > 0,75

Р > 0,898

Р > 0,9375

Р > 0,96

Р= 0,68269

Р= 0,95450

Р= 0,99730

Р= 0,999993

Р= 0,999999

Величина T влияет на значение предельной ошибки, которая как указано выше, определяется в виде

.

Выбор T связывается с той вероятностью, с которой требуется гарантировать результаты выборки.

Обычно ограничиваются значением T=3, поскольку ему соответствует граница ошибки , и тогда

.

Этот результат, известный в виде «правила трех сигм», означает: «с вероятностью, близкой к достоверности, можно утверждать, что абсолютное отклонение средней выборочной от генеральной средней не превзойдет трехкратную среднюю ошибку выборки».

Основной задачей применения выборочного метода является определение по данным выборочного обследования признаков, Характеризующих генеральную совокупность. В частности, выборочное наблюдение проводится для определения границ, в которых должна находиться генеральная средняя, а также для определения по данным о выборочной доле границ, в которых должна находиться генеральная доля.

Такая постановка вопросов требует применения теоремы Лапласа в виде

.

Здесь Генеральная средняя, Выборочная средняя, А M — средняя Квадратическая ошибка выборки.

Пользуясь этой формулой, можно получить ответы на такие вопросы:

1) какова вероятность того, что отклонение генеральной среДНей (доли) от выборочной не превышает заданного значения ;

2) в каких границах заключена генеральная средняя, если изВЕстна вероятность того, что отклонение генеральной средней (доли) от выборочной не нарушает соответствующего предела отклонения;

3) при каком объеме выборки выполнима заданная надежность того, что отклонение генеральной средней (доли) от выборочной не превышает определенного числа.

При решении всех таких вопросов требуется применение величины M, выражающей среднюю ошибку репрезентативности.

Значения этой ошибки определяются по четырем формулам:

Для СЛучайной повторной выборки при определении среднеЙ Признака

; (1)

Для случайной повторной выборки при определении доли признака

(2)

Для случайной бесповторной выборки при определении средней

(3)

Для случайной бесповторной выборки при определенИИ доли

. (4)

Опуская вывод этих формул, дадим некоторые пояснения к ним.

А) обозначает дисперсию средней в выборке, причем ГеНеральная дисперсия заменяется дисперсией случайной Величины В вЫБорке (поскольку генеральная дисперсия неизвестна);

Б) W и обозначают доли данного и противоположного признака в выборке;

В) обозначает необследованную часть генеральной Совокупности. При малом объеме выборки П правильная дробь приближается к 1, а поэтому значения M, при бесповторной вЫБорке обычно меньшие, чем при повторной выборке, оказываются Приближенно равными между собой.

© 2011-2024 Контрольные работы по математике и другим предметам!