2.05. Нормальная множественная регрессия: доверительные интервалы . для коэффициентов

Рассматривая нормальную модель линейной множественной регрессии

С ~ I. i. d. , мы установили, что оценка наименьших квадратов неизвестного истинного значения коэффициента при — ой объясняющей переменной имеет нормальное распределение, причем

Рассмотрим теперь случайную величину

Получаемую путем вычитания из случайной величины ее математического ожидания и деления полученной разности на корень из дисперсии (т. е. путем Центрирования и Нормирования Случайной величины ). При совершении этих двух действий мы не выходим из семейства нормальных случайных величин, получая опять же Нормальную случайную величину, но только уже с другими математическим ожиданием и дисперсией. Используя упомянутые ранее свойства математического ожидания и дисперсии, находим:

Так что

~

Иными словами, в результате центрирования и нормирования случайной величины мы получили случайную величину, имеющую Стандартное нормальное распределение, т. е. Нормальное распределение с нулевым математическим ожиданием и единичной дисперсией. Функцию распределения и функцию плотности распределения такой случайной величины обозначают, соответственно, как и :

Для каждого значения , определим символом число, для которого , так что если случайная величина имеет стандартное нормальное распределение, то тогда

Такое число называется Квантилью уровня p Стандартного нормального распределения.

 zp1-p

Заштрихованная площадь под графиком плотности стандартного нормального распределения находится Правее квантили уровня ;

Эта квантиль равна . Поэтому площадь под кривой, лежащая Левее точки , равна , а Заштрихованная площадь равна . Последняя величина есть вероятность того, что случайная величина , имеющая стандартное нормальное распределение, примет значение, Превышающее .

Если мы возьмем какое-нибудь число в пределах от до , , и выделим интервал

То получим следующую картину:

Из симметрии функции плотности нормального распределения вытекает равенство площадей областей, заштрихованных на последнем рисунке. Но площадь правой заштрихованной области равна ; следовательно, такова же и площадь левой заштрихованной области. Это, в частности, означает, что вероятность того, что случайная величина примет значение, не превышающее , равна , так что

Часть площади под кривой стандартной нормальной плотности, лежащая в Пределах выделенного интервала, меньше единицы на сумму площадей заштрихованных областей («Хвостов»), т. е. равна

Эта величина равна Вероятности того, что случайная величина , имеющая Стандартное нормальное распределение, примет значение в пределах указанного интервала[2]:

Но ранее мы установили, что стандартное нормальное распределение имеет случайная величина

Поэтому для этой случайной величины справедливо соотношение

Так что с вероятностью, равной , выполняется двойное неравенство

Т. е.

Иными словами, С вероятностью, равной 1-a, Случайный интервал

Накрывает истинное значение коэффициента Q j. Такой интервал называется Доверительным интервалом для Q j с уровнем доверия (доверительной вероятностью) 1-a, Или (1-a)-Доверительным интервалом, Или 100(1-a)-Процентным доверительным интервалом для Q j.

Последний рисунок был получен при значении A = 0.05. Поэтому площади заштрихованных областей («Хвосты») равны 0.025, сумма этих площадей равна 0.05 , и площадь области под кривой в пределах интервалаРавна 1-0.05 = 0.95. Остается заметить, что

Так что случайный интервал

Является 95%-доверительным интервалом для Q j. Его Длина

Пропорциональна Среднеквадратической ошибке (среднеквадратическому отклонению) Оценки коэффициента Q j.

Хотелось бы, конечно, прямо сейчас построить доверительные интервалы для коэффициентов линейной модели по каким-нибудь реальным статистическим данным. Однако этому препятствует то обстоятельство, что в выражения для дисперсий

Входит Не известное нам Значение S 2.


[1] В литературе по эконометрике математическое ожидание случайной величины X Обозначают иногда символом M(X), а для дисперсии случайной величины X Используют также обозначения Var(X) и V(X).

[2] Заметим, что в этом и других подобных выражениях знак £ можно свободно заменять знаком < , а знак ³ знаком > (и обратно), поскольку мы Всегда предполагаем существование функции плотности распределений рассматриваемых случайных величин.

Яндекс.Метрика