3.2.1. Одномерный дисперсионный анализ

Как было сказано выше, одномерный дисперсионный анализ исследует влияние одной или нескольких независимых переменных на одну зависимую. Одномер­ный дисперсионный анализ может быть однофакторным (one-way ANOVA) или многофакторным (n-way ANOVA). В первом случае есть только одна независимая переменная; во втором — несколько.

Однофакторный одномерный дисперсионный анализ можно проводить двумя спо­собами: при помощи специальной процедуры One-way ANOVA (меню Analyze ► Compare Means ► One-way ANOVA) или посредством обобщенной линейной модели (меню Analyze ► General Linear Model ► Univariate). Второй прием является более универсальным и обладает полным объемом функциональности первого, поэтому да­лее мы рассмотрим только GLM (использование первого метода аналогично GLM). Необходимо отметить, что для проведения одномерного дисперсионного анализа на практике (в маркетинговых исследованиях) существует одно весьма существен­ное ограничение. При увеличении количества факторов (то есть независимых пере­менных) в модели сложность интерпретации результатов расчета возрастает много­кратно. Так, однофакторный анализ является наиболее простым. Его результаты понятны сразу при взгляде на итоговую таблицу. Двухфакторный анализ намного сложнее в интерпретации — чтобы понять его результаты, приходится потратить много времени, разбираясь в таблицах и графиках. Для интерпретации результатов трехфакторного анализа необходимо обладать некоторым опытом в его проведе­нии. Четырех - и мультифакторные модели в большинстве своем могут успешно интерпретироваться только квалифицированными исследователями. Таким об­разом, для практических целей лучше воздержаться от исследования большого числа взаимодействий между факторами и ограничиться несколькими наиболее важными. В настоящем разделе мы последовательно рассмотрим одно-, двух - и трехфакторные модели одномерного дисперсионного анализа. При этом будут использовать­ся следующие исходные данные:

Исследуется покупательское поведение потребителей глазированных сырков. Респонденты разделяются на целевые группы в зависимости от их пола (q3), возраста (q4) и количе­ства членов семьи (q72). Одним из вопросов анкеты является: «Какое количество глази­рованных сырков в среднем Вы покупаете за одно посещение магазина?» (q6) с варианта­ми ответа: 1 шт., 2 шт., 3 шт., 4 шт., 5 шт., 6-7 шт., 8-10 шт. и более 10 шт. Требуется выяснить, различается ли кратность покупок глазированных сырков различными целевы­ми группами респондентов (половыми, возрастными и по количеству членов семьи).

Прежде всего мы проведем однофакторный одномерный дисперсионный анализ и установим, насколько значимо различается кратность покупок в различных воз­растных группах респондентов (1 — младше 18 лет; 2 — 19-35 лет; 3 — 36-60 лет; 4 — старше 60 лет).

Диалоговое окно одномерного дисперсионного анализа запускается при помощи меню Analyze ► General Linear Model ► Univariate (рис. 3.9). Из левого списка всех до­ступных переменных переместите в поле для зависимой переменной Dependent Variable переменную q6 (Кратность покупок). Как видите, в качестве зависимой пере­менной в дисперсионном анализе выступает основание сегментирования респон­дентов по группам, то есть та переменная, которая и определяет различия между категориями независимой переменной. (Это замечание достаточно сложно осоз­нать, так как при проведении дисперсионного анализа как бы стираются границы в трактовке зависимых и независимых переменных — по крайней мере, по сравне­нию с другими видами статистического анализа, например регрессионного.)


В область для независимых переменных Fixed Factor(s) поместите Возраст (q4). Об­ратите внимание на разницу между областями Fixed Factor(s) (факторы с фиксиро­ванными эффектами) и Random Factor(s) (факторы со случайными эффектами). Фиксированными факторами называют переменные, уровни которых охватыва­ют все возможные состояния этой переменной. Например, пол может быть только мужской или женский, а возраст, например, младше 30 лет, от 30 до 60 лет и стар­ше 60 лет. Случайные факторы представляют переменные, уровни которых охватывают лишь часть из всего многообразия возможных состояний. Так как в нашем случае переменная q4 (Возраст) содержит все возможные возрастные группы рес­пондентов, мы поместили ее в область фиксированных факторов.

Рис. 3.9. Диалоговое окно Univariate

 

Если после этого вы щелкнете на кнопке ОК, то получите только одну таблицу, из которой можно узнать лишь о наличии/отсутствии значимых различий между воз­растными группами. Однако останется неизвестным, какие именно группы отли­чаются от других.

Для того чтобы определить это, существуют дополнительные статистические тес­ты, задаваемые при помощи кнопки Post Hoc. Соответствующее диалоговое окно представлено на рис. 3.10. Перенесите из области Factor(s) в область Post Hoc Tests for те независимые переменные (факторы), которые необходимо подвергнуть тес­тированию на предмет установления различий между их группами. В нашем слу­чае есть всего одна факторная переменная q4, которую и следует перенести в об­ласть тестирования. Далее укажите релевантные дополнительные тесты для указанной переменной. При этом, как видно на рисунке, SPSS выводит различные тесты для равных и неравных дисперсий (Equal Variances Assumed и Equal Variances Not Assumed соответственно).

Установить равенство/неравенство дисперсий позволяет тест Levene, вывод кото­рого на экран мы покажем ниже. В общем случае мы не знаем, равны ли дисперсии и, соответственно, какую группу статистических тестов следует использовать. По­этому рекомендуется сразу вывести тесты для равных и неравных дисперсий, что­бы сократить количество итераций при проведении дисперсионного анализа. SPSS предлагает много различных дополнительных тестов, помогающих определить различия между группами исследуемых переменных. Однако использовать их все нецелесообразно. Мы рекомендуем ограничиться наиболее популярным и универ­сальным тестом Scheffe для равных дисперсий и тестом Tamhane's T2 — для нерав­ных дисперсий. Теперь можно закрыть описываемое диалоговое окно щелчком на кнопке Continue.


Рис. 3.10. Диалоговое окно Univariate: Post Hoc Multiple Comparisons for Observed Means

 


Выше мы упомянули о специальном тесте, позволяющем установить равенство/ неравенство дисперсий. На необходимость проведения данного теста (так же как и многих других) можно указать в диалоговом окне Options, вызываемом одноимен­ной кнопкой в главном диалоговом окне Univariate (рис. 3.11). Для однофакторного дисперсионного анализа можно ограничиться только одним тестом Levene на равенство дисперсий (параметр Homogeneity tests).

Рис. 3.11. Диалоговое окно Univariate: Options

 

Следует отметить, что если исследуемая независимая переменная имеет всего две ка­тегории (дихотомия), апостериорные тесты для нее не проводятся. Установить на­правление различия между категориями позволяет вывод средних значений зависи­мой переменной в каждой из двух категорий. Для этого перенесите исследуемую независимую дихотомическую переменную из области Factor(s) and Factor Interactions

В область Display Means for. В нашем случае единственная независимая переменная Воз­раст имеет больше двух категорий (4), и поэтому специально выводить для нее сред­ние значения нет смысла (они будут выведены в таблице Homogenous Subsets).

Остальные кнопки главного диалогового окна Univariate предназначены для мно­гофакторного анализа, рассматриваемого ниже. Теперь щелкните на кнопке О К, что­бы запустить процедуру дисперсионного анализа. В окне SPSS Viewer будут выве­дены результаты расчетов.

Первой практически значимой таблицей является результат теста на равенство дисперсий зависимой и независимых переменных Levene's Test of Equality of Error Variances (рис. 3.12). В столбце Sig. данной таблицы содержится единственное ин­тересующее нас значение — это статистическая значимость тестовой статистики F. Если значение в данном столбце показывает незначимость F — значит, дисперсии равны, и в дальнейшем мы будем анализировать результаты расчета теста Scheffe (предполагающего равенство дисперсий). В противном случае, если F-статистика значима, — дисперсии не равны, и при анализе различий между группами следует использовать тест Tamhane's T2 (предполагающий неравенство дисперсий). Как вы видите на рисунке, статистика F незначима (Sig. = 0,433) — и, следовательно, можно сделать вывод о равенстве дисперсий.

Рис. 3.12. Таблица Levene's Test of Equality of Error Variances

 

Следующая таблица — это Tests of Between-Subjects Effects (рис. 3.13). Данная таб­лица является центральной в выводимых результатах дисперсионного анализа и показывает наличие/отсутствие значимых различий между категориями исследу­емых переменных. Первое, на что следует обратить внимание при анализе описы­ваемой таблицы, — это величина R2, отражающая долю совокупной дисперсии в зависимой переменной, описываемой статистической моделью. Другими словами, это та часть вариации зависимой переменной, которую можно объяснить на осно­вании независимой переменной. Естественно, что чем меньше независимых пере­менных, тем меньше величина R2, и наоборот.

Так, в нашем случае есть только одна независимая переменная q4 (Возраст), и при этом R2 весьма мала (0,019). Для дисперсионного анализа значения R2 можно про­сто проигнорировать, так как они не важны для практического использования по­лученной модели'. Второе, на что обращают внимание исследователи при интер­претации таблицы Tests of Between-Subjects Effects, — это собственно значимость различия между группами независимой переменной. Этот вывод следует из значения на пересечении строки, содержащей соответствующую независимую перемен­ную, и столбца Sig.. Как вы видите на рисунке, имеет место статистически высоко значимое различие между различными возрастными группами респондентов по кратности покупок глазированных сырков (значимость F-статистики у перемен­ной q4 < 0,001). Обратите внимание, что если тест Levene выявил факт неравен­ства дисперсий независимых и зависимых переменных, следует поднять по


рог зна­чимости со стандартного значения 0,05 до 0,01.

Рис. 3.13. Таблица Tests of Between-Subjects Effects

 
 

После того как мы установили наличие статистически значимого различия между возрастными группами респондентов на основании кратности покупок сырков, необходимо определить, какие из четырех имеющихся возрастных групп отлича­ются от остальных и каким образом (в большую или в меньшую сторону).

Давайте сделаем это при помощи таблицы Multiple Comparisons, представленной на рис. 3.14. При интерпретации данной таблицы прежде всего вспомните результа­ты теста Levene. Так, в нашем случае на основании данного теста дисперсии оказа­лись равными, и поэтому в данной таблице мы будем рассматривать только ту ее часть, в которой приведены расчеты по методу Scheffe (напомним, что тест Tamhane мы бы применяли только если бы дисперсии были неравны).

Итак, в первой части таблицы (Scheffe) мы видим сравнение различий между каж­дой из четырех возрастных категорий с остальными категориями. На основе этих данных и определяются та или те группы, которые значимо отличаются от других. Так, из столбца Sig. (статистическая значимость) мы видим, что только группа рес­пондентов старше 60 лет статистически значимо отличается от всех остальных. Остальные целевые группы не отличаются друг от друга. При этом из столбца Mean Difference можно видеть, насколько отличается среднее значение той или иной груп­пы от среднего значения других групп (звездочками отмечены значимые различия при 95%-ном доверительном уровне)1.

Наконец, в последней таблице Homogeneous Subsets (рис. 3.15) представлена однознач­ная картина различий между группами независимой переменной. Здесь все возрастные группы разделены на две категории на основании различий в кратности покупок. В первую категорию входит целевая группа респондентов старше 60 лет; во вторую — все остальные возрастные группы (то есть респонденты младше 60 лет). Если бы ока­залось, что статистически значимых различий в кратности покупок глазированных сырков различными возрастными группами респондентов не наблюдается, все груп­пы независимой переменной были бы отнесены к одной категории (Subset был бы толь­ко 1). Иногда возникает ситуация, при которой одна и та же группа респондентов мо­жет относиться сразу к нескольким группам. В таком случае следует поднять порог значимости со стандартных 0,05, скажем, до 0,01 (или любого другого значения).

Рис. 3.14. Таблица Multiple Comparisons

 

Также из рассматриваемой таблицы можно сделать вывод о направлении различия между выделенными категориями. Так, в нашем случае мы можем заключить, что респонденты старше 60 лет покупают глазированные сырки в меньших объемах, чем респонденты младше 60 лет. В точности определить размер или величину раз­личия можно, только если в качестве зависимой переменной выступает интерваль­ная переменная. Так как у нас переменная q6 Кратность покупок относится к поряд­ковой шкале, мы не можем сделать точный вывод о величине различия. Если стоит такая задача, можно преобразовать зависимую порядковую переменную к интер­вальному виду (например, при помощи перекодирования кодов групп в средние значения данных групп: 1 (от 16 до 18 лет) —> 17 и пересчитать дисперсионный анализ. Это даст хотя бы приблизительную оценку величины различия. Нам достаточно только установленной статистической значимости (то есть существова­ния) различия и его направления (респонденты старше 60 лет покупают меньше сырков, чем более молодые).


Рис. 3.15. Таблица Homogeneous Subsets

 

Рассмотрим теперь ситуацию, когда необходимо исследовать сразу две независи­мые переменные (и взаимодействия между ними), то есть выполнить двухфактор-ный одномерный дисперсионный анализ.

Исходные данные останутся такими же, как в предыдущем примере, однако те­перь мы будем устанавливать различие в кратности покупок сырков возрастными и половыми группами (переменная q3). Для этого вновь откроем диалоговое окно Univariate (рис. 3.9) и добавим в область для фиксированных факторов (независи­мых переменных с фиксированными эффектами) переменную Пол. При проведении многофакторного анализа (двухфакторной и более) кнопка Model позволяет задать исследование либо всех возможных взаимодействий между неза­висимыми переменными (в нашем случае будет установлено различие не только меж­ду четырьмя возрастными и двумя половыми группами по отдельности, но и между каждой половозрастной группой), либо только каких-то конкретных взаимодействий. В диалоговом окне Model можно задать и другие значения, но для большинства задач маркетинговых исследований достаточно оставлять все эти значения по умолчанию. Иными словами, кнопкой Model лучше не пользоваться. То же самое касается и кнопки Contrasts (исследование взаимодействий между уровнями независимых переменных), а также кнопки Save, позволяющей сохранять некоторые значения. В большинстве практических случаев, встречающихся в маркетинговых исследованиях, при прове­дении дисперсионного анализа вам не потребуется ничего сохранять. При проведении многофакторного дисперсионного анализа в диалоговом окне Post Нос (рис. 3.10) следует добавить к списку исследуемых переменных все независи­мые факторы, кроме дихотомических. В нашем случае переменная Пол является

Дихотомической, так что добавлять ее в область Post Hoc Tests for (дополнительно к переменной Возраст) не следует. Таким образом, все параметры этого диалогово­го окна останутся неизменными по сравнению с предыдущим примером.

В диалоговом окне Options (рис. 3.11) необходимо добавить дихотомическую пере­менную q3 (Пол), а также ее взаимодействие с переменной q4 (Возраст) — q3*q4 — в область Display Means for, что позволит вывести средние значения по каждой группе мужчин и женщин при определении направления различия между ними. После этого можно запускать процедуру дисперсионного анализа на выполнение.

В окне SPSS Viewer будут выведены результаты расчетов. Они будут отличаться от результатов предыдущего примера. Во-первых, как видно из рис. 3.16, тест Levene те­перь является значимым (Sig. = 0,033), из чего следует вывод о неравенстве дисперсий.


Рис. 3.16. Таблица Levene's Test of Equality of Error Variances

 

Во-вторых, в таблице Tests of Between-Subjects Effects появились результаты расчета значимости F-статистики для переменной Пол (q3), а также для взаимодействия q3*q4. Как видно из рис. 3.17, мужчины и женщины не имеют статистически зна­чимых различий по кратности покупок глазированных сырков. То же относится и к взаимодействию q3*q4: оно не является статистически значимым. При этом, не­смотря на неравенство дисперсий (порог значимости возрос до 0,01), переменная q4 (Возраст) сохранила свое значимое влияние на зависимую переменную (Sig. = 0,011), то есть возрастные группы по-прежнему различаются по кратности поку­пок сырков. Необходимо также отметить, что с добавлением переменной q3 доля совокупной дисперсии в зависимой переменной, объясняемая построенной моде­лью, несколько возросла (R2 = 0,022).

После таблицы Tests of Between-Subjects Effects следуют расчеты средних значений для дихотомической переменной q3 (Пол) и для взаимодействия q3 x q4 (рис. 3.18). В нашем случае ни переменная q3, ни ее взаимодействие с q4 не являются статис­тически значимыми, поэтому данные таблицы бесполезны. Однако если бы пере­менная Пол была значима (то есть различие между мужчинами и женщинами су­ществовало), на основании первой таблицы можно было бы сделать заключение о том, какая именно половая группа покупает больше сырков.

Так, если предположить, что влияние переменной Пол статистически значимо, из рис. 3.18 можно было бы заключить, что женщины покупают глазированные сыр­ки в больших объемах по сравнению с мужчинами. То же можно сказать и относи­тельно второй таблицы (Пол х Возраст). Случается, что по результатам таблицы Tests of Between-Subjects Effects некая переменная оказывается незначимой, однако в таблице Multiple Comparisons отдельные уровни этой переменной значимо отлича­ются друг от друга. В такой ситуации все равно следует признать рассматриваемую переменную незначимой и в дальнейшем игнорировать связанные с нею апо­стериорные тесты.


Рис. 3.17. Таблица Tests of Between-Subjects Effects

 


Рис. 3.18. Таблицы Estimated Marginal Means

 

Завершают вывод результатов двухфакторного анализа таблицы с расчетами апо­стериорных тестов. В нашем случае они практически такие же, как в предыдущем примере, поскольку переменная Возраст сохранила свою значимость (см. рис. 3.14 и 3.15). Однако при интерпретации таблицы Multiple Comparisons следует помнить

О неравенстве дисперсий. Поэтому значимость различий между отдельными возраст­ными группами надо устанавливать на основании второй части таблицы Tamhane.

Итак, мы рассмотрели одно - и двухфакторный одномерный дисперсионный анализ. Далее мы поговорим более подробно о трехфакторном дисперсионном анализе. На его примере мы рассмотрим построение графиков и методы их использования с целью облегчения интерпретации значимых взаимодействий между переменными.

Теперь мы будем использовать все четыре переменные из исходного условия зада­чи (см. выше), то есть проанализируем различия в кратности покупки глазирован­ных сырков анализируемыми целевыми группами респондентов (половыми, воз­растными и по количеству членов семьи). Откройте диалоговое окно Univariate и добавьте в список независимых переменных (область Fixed Factor(s)) еще одну пе­ременную q72 (Количество членов семьи).

Здесь необходимо сделать одно важное отступление. Время проведения расчетов в дисперсионном анализе (как одномерном, так и многомерном) при добавлении каж­дого нового фактора существенно возрастает. Если при этом зависимая переменная содержит достаточно большое количество уровней, расчеты могут затянуться на весь­ма длительное время. Исследователям-практикам следует знать об одной существен­ной особенности SPSS: скорость ее работы лимитируется тактовой частотой основ­ного микропроцессора и объемом оперативной памяти (скорость работы жесткого диска не играет существенной роли). SPSS может использовать в своей работе толь­ко один процессор, то есть если у вас в компьютере установлено два и более процес­сора, для SPSS это не будет иметь никакого значения. Поэтому при работе с данной программой мы настоятельно рекомендуем использовать мощные машины с высо­копроизводительным процессором и достаточным объемом оперативной памяти. К сожалению, в настоящее время не все отечественные компании имеют возможность приобретать мощные компьютеры. Предлагаем следующий выход. В главном диало­говом окне Univariate есть кнопка Model, которая, как мы сказали выше, в маркетинго­вых исследованиях используется редко, поскольку при проведении дисперсионного анализа не требуется анализировать сразу много (четыре и более) факторов и, следо­вательно, скорость работы программы будет приемлемой. Однако если в анализ при­ходится включать четыре и более независимых переменных, придется воспользоваться кнопкой Model. Щелкните на ней — и вы увидите одноименное диалоговое окно, пока­занное на рис. 3.19. По умолчанию в SPSS выбрана полнофакторная модель дисперси­онного анализа Full factorial, где исследуется влияние на зависимую переменную:

1. всех независимых переменных по отдельности;

2. всех возможных взаимодействий между независимыми переменными.


Именно на расчеты, связанные со вторым пунктом, и тратится основное время. Поэтому при ограничениях, налагаемых аппаратным обеспечением компьютера, следует отказаться от использования полнофакторных моделей в пользу опреде­ляемых пользователем (Custom). Если ограничения жесткие, можно выполнить только исследования влияния независимых переменных на зависимую по отдель­ности (в терминологии SPSS, Main effects)1.

Рис. 3.19. Диалоговое окно Univariate: Model

 

 

В данном диалоговом окне в левом списке содержатся все выбранные для анализа независимые переменные. Чтобы определить пользовательскую модель, в левом списке Factors & Covariates выберите переменные, которые будут включены в итого­вую пользовательскую модель. Затем из раскрывающегося списка Build Term(s) выберите тот или иной тип взаимодействия между переменными. И наконец, щелк­ните на соответствующей кнопке, чтобы перенести сформированную пользователь­скую модель в правый список Model.

Если вы хотите рассмотреть только влияние факторных переменных по отдельно­сти, выполните действия, показанные на рис. 3.19. Выберите все независимые пе­ременные в левом списке, тип модели Main effects и перенесите эти переменные в правую область. Другими видами моделей являются:

■ Interaction — исследование всех видов взаимодействий между выбранными пе­ременными;

■ АН 2-, 3-, 4-, 5-way — исследование только взаимодействий соответственно второго (ql*q2), третьего (ql*q2*q3), четвертого (ql*q2*q3*q4) и пятого (ql*q2*q3*q4*q5) порядков.

Обратите внимание, что одновременно можно сформировать в правом списке Model сколько угодно различных моделей, подбирая только основные, необходимые вам взаимодействия факторов.

Для иллюстрации решения задачи (выполнение трехфакторного дисперсионного анализа) не будем задавать пользовательские модели, а воспользуемся полнофак­торной моделью, установленной по умолчанию. В диалоговом окне Model есть еще два не рассмотренных ранее параметра: Sum of squares и Include interceptin model. Пер­вый параметр позволяет задать тип формулы для расчета суммы квадратов (тесто­вой величины, на основании которой и производится расчет статистической значи­мости различий). В маркетинговых исследованиях рекомендуется использовать тип III, установленный по умолчанию. Второй параметр служит для указания на необ­ходимость включить в итоговую модель расчеты значимости отрезка значений. Дан­ный параметр также можно всегда оставлять установленным по умолчанию.

Вернемся к описанию решения поставленной задачи. Мы добавили в соответству­ющие поля главного диалогового окна Univariate одну зависимую переменную и cразу три независимые. При помощи кнопок Post Hoc и Options необходимо выбрать те же параметры, которые мы выбирали для одно - и двухфакторного анализа. В ре­зультате останется не рассмотренной одна важная кнопка в главном диалоговом окне Plots, позволяющая указать параметры для построения графиков. Эту кнопку следует использовать в тех ситуациях, когда обнаружено статистически значимое взаимодействие между факторами.

Для того чтобы построить график взаимодействия факторов, сначала мы должны про­вести дисперсионный анализ по обычной схеме (без графиков) и выяснить, есть ли значимые взаимодействия. После щелчка на кнопке ОК в окне SPSS Viewer будут выве­дены результаты расчетов для трехфакторного одномерного дисперсионного анализа. Нет смысла приводить их здесь — в них нет ничего для вас нового. Вместо этого да­вайте посмотрим, как интерпретировать значимые взаимодействия между факторами.

Существует два основных способа интерпретации взаимодействий:

■ в табличной форме — по результатам апостериорных тестов;

■ в графической форме — по построенным графикам взаимодействий.

Графическая форма представления результатов зачастую более предпочтительна по сравнению с табличной, особенно при анализе взаимодействий трех и более уровней. На рис. 3.20 показано диалоговое окно Profile Plots. Для того чтобы построить график по двухуровневому взаимодействию, из левого списка всех независимых переменных (область Factors) выберите переменную, категории которой будут располагаться по оси абсцисс (горизонтальной), и поместите ее в поле Horizontal Axis. Далее выберите пере­менную, значения каждой категории которой будут отображаться на графике в виде отдельных линий (пример см. ниже), и поместите ее в поле Separate Lines.


Рис. 3.20. Диалоговое окно Univariate: Profile Plots

 

Для иллюстрации процесса построения графиков предположим, что по результа­там трехфакторного дисперсионного анализа была установлена статистическая значимость взаимодействия между переменными q3 (Пол) и q4 (Возраст). В окне Profile Plots мы поместили переменную с наименьшим числом категорий q3 в поле Horizontal Axis, а переменную q4 — в поле Separate Lines. Теперь щелкните на кнопке Add, чтобы подтвердить построение графика с заданными параметрами. Таким спо­собом можно задать вывод сразу нескольких графиков.

После того как SPSS завершит расчеты, связанные с дисперсионным анализом, в окне SPSS Viewer после таблиц появится заданный график. В нашем примере он будет выглядеть так, как показано на рис. 3.21.


Рис. 3.21. График взаимодействия q3*q4

 

По оси ординат здесь (вертикальная ось) располагаются средние значения крат­ности покупок глазированных сырков каждой из рассматриваемых половозраст­ных групп. При этом на рисунке видно, что в возрастных группах от 36 до 60 лет и старше 60 лет кратность покупок сырков мужчинами и женщинами практически не различается (соответствующие линии близки к параллели), тогда как в других возрастных группах различие между мужчинами и женщинами выражено доста­точно существенно (соответствующие линии перпендикулярны). Так, мужчины младше 18 лет характеризуются существенно меньшей кратностью покупок сыр­ков, чем женщины младше 18 лет. Мужчины в возрасте до 18 лет имеют наимень­шую кратность покупок и по сравнению со всеми другими половозрастными груп­пами. Мужчины в возрасте 19-35 лет характеризуются наивысшей кратностью покупок сырков среди всех возрастных групп мужчин. Можно заметить, что ситу­ация с женщинами в двух рассматриваемых возрастных группах диаметрально противоположная. Мужчины младше 18 лет имеют наименьшую кратность поку­пок; женщины младше 18 лет — наивысшую. Мужчины от 19 до 35 лет имеют наи­высшую кратность покупок; женщины 19-35 лет — наименьшую.

Таким образом, вы видите, что графики в дисперсионном анализе являются весь­ма ценным ресурсом для построения заключений и выводов. Еще одним направ­лением интерпретации является кластеризация респондентов на основании их средних показателей (например, кратности покупок). Так, в нашем примере на основании кратности покупок можно разделить всех респондентов на следующие целевые сегменты:

1. мужчины младше 18 лет характеризуются наименьшей кратностью покупок сырков;

2. мужчины старше 36 лет и женщины старше 19 лет характеризуются средней кратностью покупок сырков;

3. мужчины от 19 до 35 лет и женщины младше 18 лет характеризуются наивыс­шей кратностью покупок сырков.

В целом общая схема интерпретации графиков в дисперсионном анализе состоит из двух этапов. Сначала следует определить категории респондентов, отличающи­еся и не отличающиеся друг от друга. При этом интерпретация графиков всегда происходит только по двум переменным (представленным по горизонтальной оси и в виде отдельных линий). Для установления различия следует смотреть на фор­му данных линий. Если две (или более) линии близки к параллели, следовательно, различия между данными категориями минимальны (незначимы). В противном случае, если линии пересекаются, следует признать различие между ними суще­ственным (значимым).


Наиболее простым для интерпретации случаем является ситуация, в которой по горизонтальной оси располагается дихотомическая переменная (например, пере­менная Пол). Если линии на отрезке между двумя категориями данной перемен­ной не пересекаются — различий нет; если пересекаются — различия есть. На рис. 3.22 представлен пример максимальных различий (линии пересекаются под прямым углом); на рис. 3.23 — минимальных (линии параллельны).

Рис. 3.22. Значимые различия между взаимодействиями факторов

 

Рис. 3.23. Незначимые различия между взаимодействиями факторов

 

Можно сформулировать следующие рекомендации по построению графиков в дис­персионном анализе.

1. Для горизонтальной оси лучше выбирать дихотомические вопросы.

2. Если дихотомических переменных нет, следует выбрать переменную с наимень­шим четным количеством категорий и перекодировать данные категории в дихотомию. Для горизонтальной оси следует выбирать именно данную (уже ди­хотомическую) переменную. Данный способ работает далеко не всегда, ведь часто различия между взаимодействиями факторов находятся именно в тех категориях, которые будут перекодированы (сокращены).

При исследовании трехуровневых взаимодействий (ql x q2 x q3) переменную с наи­меньшим числом категорий (лучше дихотомическую) следует поместить в поле Separate Plots в диалоговом окне Univariate (например, ql), а для остальных двух исследуемых переменных (например, q2 и q3) — следовать вышеописанным пра­вилам. Это будет означать, что в результате будут построены отдельные графики по каждой категории переменной ql, где будут показаны двухуровневые взаимо­действия переменных q2 и q3.

В заключение настоящего раздела необходимо особо отметить, что графики вза­имодействий могут эффективно применяться только при числе взаимодействий 2 (ql х q2) или 3 (ql x q2 x q3). При взаимодействиях первого уровня (ql) мы гово­рим уже не о взаимодействиях как таковых, а о главных эффектах (Main effects), то есть о влиянии на зависимую переменную только каждого фактора в отдельности. В таком случае различия между конкретными группами независимой переменной определяются исходя из результатов апостериорных тестов. При числе взаимо­действий более трех сохраняется возможность разбиения данного взаимодействия на несколько взаимодействий второго или третьего уровней и построения затем серии графиков. Однако в этом случае интерпретация данных графиков является практически неразрешимой задачей.

© 2011-2024 Контрольные работы по математике и другим предметам!