1.06. Пропорциональная связь между переменными

Хотя на практике не рекомендуется отказываться от включения свободного члена в уравнение подбираемой прямолинейной связи, если только его отсутствие не обосновывается надежной теорией (как в физике — закон Ома), мы все же иногда сталкиваемся с необходимостью подбора прямой, проходящей через начало координат. Позднее мы приведем соответствующие примеры.

Итак, пусть мы имеем наблюдения , и предполагаем, что гипотетическая линейная связь между переменными и имеет вид

(Пропорциональная связь между переменными), так что ей соответствует модель наблюдений

.

Применение метода наименьших квадратов в этой ситуации сводится к минимизации суммы квадратов невязок

По всем возможным значениям . Последняя сумма квадратов является функцией Единственной переменной (при известных значениях ), и точка минимума этой функции легко находится. Для этого мы приравниваем нулю производную по :

(нормальное уравнение)

Откуда получаем:

Или

Отсюда видно, что при таком подборе

И точка уже Не лежит, как правило, на подобранной прямой

Более того, в такой ситуации

Где

И поэтому использовать для вычисления коэффициента детерминации выражение

Не имеет смысла. В этой связи полезно рассмотреть следующий искусственный пример.

Пример

Пусть переменные и принимают в четырех наблюдениях значения, приведенные в следующей таблице

I

1

2

3

4

Xi

10

3

–10

-3

Yi

11

3

-9

-3

Соответствующей диаграмме рассеяния

И мы предполагаем Пропорциональную связь между этими переменными, что соответствует модели наблюдений Для этих данных

Так что При этом,

RSS = (11—10)2 + (3-3)2+ (-9+10)2+ (-3+3)2 = 2,

TSS = (11-0.5)2+ (3-0.5)2+ (-9-0.5)2+ (-3-0.5)2 = 219,

ESS = (10-0.5)2+ (3-0.5)2+ (-10-0.5)2+ (-3-0.5)2 = 219,

Так что здесь , и вычисление по формуле

Приводит к значению . Но последнее возможно только если все точки лежат на одной прямой, а у нас это не так. Заметим также, что в этом примере сумма остатков , что невозможно в модели с включением в правую часть постоянной составляющей.

Можно, конечно, попытаться справиться с возникающим при оценивании модели без постоянной составляющей затруднением, попросту игнорируя нарушение соотношения и определяя коэффициент детерминации соотношением

,

И именно такое значение приводится в протоколах некоторых пакетов программ анализа статистических данных, например пакета ECONOMETRIC VIEWS (TSP). Для нашего иллюстративного примера с четырьмя наблюдениями использование последнего приводит к значению , которое не противоречит интуиции и представляется разумным. Однако, к сожалению, и такой подход к определению коэффициента детерминации не решает проблемы, поскольку, в принципе, при оценивании модели без постоянной составляющей возможны ситуации, когда , что приводит к Отрицательным значениям .

Пример

Пусть переменные и принимают в четырех наблюдениях значения, приведенные в следующей таблице

I

1

2

3

4

Xi

0

0.2

0.4

3

Yi

0.5

0.8

1.2

2

Что соответствует диаграмме рассеяния

И мы предполагаем пропорциональную связь между этими переменными, что соответствует модели наблюдений Для этих данных . При этом, , , и вычисление по формуле приводит к Отрицательному значению

Преодолеть возникающие затруднения можно, если определить в модели наблюдений без постоянной составляющей формулой

,

В которой используется сумма квадратов Нецентрированных значений переменной (отклонений значений переменной от «нулевого уровня»). При таком определении, неотрицательность коэффициента Гарантируется наличием соотношения

Которое отражает Геометрическую сущность метода наименьших квадратов (аналог знаменитой теоремы Пифагора для многомерного простанства) и выполняется Как для модели без постоянной составляющей, так и для модели с наличием постоянной составляющей в правой части модели наблюдений. Деля обе части последнего равенства на приходим к соотношению

Из которого непосредственно следует, что

(Доказать заявленное равенство не сложно. Действительно,

Но

..

(см. нормальное уравнение), что и приводит к искомому результату.)

В последнем примере использование определения с Не центрированными Дает .

© 2011-2024 Контрольные работы по математике и другим предметам!