<<
>>

ПРОВЕРКА ГИПОТЕЗ О РАЗЛИЧИЯХ

В предыдущем разделе проверялись гипотезы о связях между переменными. Теперь мы сделаем акцент на проверке гипотез о различиях. Классификация процедур проверки гипотез о различиях предстзалена на рис. 15.9.
Методы, показанные на рис. I V? согласуются с классификацией одномерных методов, пред­ставленных на рис. 14.6. Главное различие в том, что методы на рис. 14.6 также применимы к не­скольким выборкам (больше двух) и таким образом связаны с дисперсионным анализом (ANOVA) и ранговым дисперсионным анализом Краскера—Уоллеса (K-W ANOVA) (глава 14), тогда как методы на рис, 15.9 ограничены двумя выборками. Процедуры проверки ги­потез можно в общем виде классифицировать на параметрические и непара метрические, исходя из шкалы измерения переменных. Параметрические методы проверки гипотез (parametric tests) предполагают, что изучаемые переменные измерены с помощью интервальной шкалы. Параметрические методы проверки гипотез (parametric tests) Предполагают, что изучаемые переменные измерены с помощью интервальной шкалы. Непараметрические методы проверки гипотез Oionpaiarneiric tests) предполагают, что пере­менные измерены с помощью номинальной или порядковой шкал. Непараметрические методы проверки гипотез (nonparametric tests)
580

Предполагают, что переменные измерены с помощью номинальной или порядковой шкал. Рис. 15.9. Проверка гипотез о различиях Дальнейшая классификация проводится в зависимости от количества выборок: одна, две или больше. Как объяснялось в главе 14, число выборок определяют, исходя из метода даль­нейшей обработки данных для анализа, а не из того, как были собраны данные. Выборки неза­висимы в том случае, если взяты случайным образом из различных генеральных совокупностей. Для анализа данные, !фикйд;:;ж?.шке различным группам респондентов, например мужчинам и жсншиннм. обычно обрабатывают как нс^ал.нсимыс выборки. С другой стороны, выборки являются парными !сатш/ыми). когда данные двух выборок имеют отношение к одной и той же группе респондентов. Наиболее популярный параметрический критерий для проверки гипотез о равенстве сред­них заключается в расчете значений /-статистики. Проверка на основе /-кршерия выполняется относительно среднего значения одной или двух выборок. В случае двух выборок они могут быть независимыми или парными. Непараметрические методы проверки, основанные на на­блюдениях, взятых из одной выборки, включают критерий Колмогорова-Смирнова, критерий хи-квадрат, критерий серий и биномиальный критерий. В случае двух независимых выборок для проверки гипотез относительно среднего значения используют

Проверка ГИПСТезЫ Критерий хи-квадрат - Критерий Манна-Уитни - Медианы | срии «уцялг |«ЛВ)|( - Критерий Колмогорова- ■ Критерий хи-каадраг Смирнова

4

Критерий знаков Критерий 8илкокссшэ Критерий гоакНемара

медианный критерий и критерий Эти критерий — непараметрические копии г-критерн!! для двух групп.

Для парных выборок непараметрические критерии включают критерий Вилкоксона парных сравнений и критерий знаков. Эти тесты — копии парного 1 -критерия. Как параметрическими, так и непараметри­ческими методами оцениаа-от гипотезы, относящиеся к более, чем двум выборкам. Эти крите­рии рассматриваются в следующих главах. Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез 581 ПАРАМЕТРИЧЕСКИЕ КРИТЕРИИ Использование параметрических критериев позволяет слелдп. статистический вывод отно­сительно среднего значения генеральной совокупности. Обычно для этой цели используют 4-к;)ятерий (t-test). В основе критерия лежит /-сгатнстика Стьюдента (Student). Т- критерий (t-test) Одномерный метод проверки гипотез, использующий распределение. Применяется, если стандартное отклонение неизвестно и размер выборки мал. 'і'-статистика (і-чіаіі^іс) подразумевает, что переменная нормально распределена, среднее известно (или предполагается, что оно должно быть известно) и дисперсия генеральной сово­купности определена по данным выборки. Т-сгатистика (1-$1а№11с) Статистика, подразумевающая, что переменная имеет колссолоподобкое- распределение, среднее известно (или предполагается, что известно) и дисперсия генеральной совокупно­сти определена по данным выборки. Примем, что случайная переменнаяXнормально распределена, со средним и неизвестной дисперсией генеральной совокупности о\ которая сцекиваегся с помощью выборочной дис­персии б2. Вспомним, что стандартное отклонение выборочного среднего X определяется как . Тогда / = ( Xявляетсяраспределенным с степенями свободы. Т-распределение п-^гпЬлиоп) по внешнему виду аналогично нормальному распределе­нию. Графики обоих распределений симметричны и имеют кслоколообразпую форму. Однако по сравнению с нормальным распределением в распределении Стьюдента хвостовые части гра­фика по площади больше, а центральная часть по площади — меньше. Это связано с тем, что дисперсия совокупности п' неизвестна, и ее оценивают во выборочной дисперсии £~, -распределение (^айвйо) Симметричное колоколоподобное распределение, используемое для проверки выборок не­большого размера (п < 30) При данной неопределенности в значении наблюдаемые значения -статистики более изменчивы, чем значения Однако с ростом числа степеней свободы ние приближается к нормальному. Фактически, для выборок большого размера (120 и больше) .'-распределение и нереальное распределение практически не отличаются. В табл. 4 Статисти­ческого приложения даны избранные Процедура проверки гипотезы в случае использования в качестве метода проверки (-крптерия состоит из следующих этапов. 1. Сформулировать нулевую и альтернативную 2. Выбрать соответствующую формулу для вычисления /-статистики. 3. Выбрать уровень значимости а для проверки нулевой гипотезы Обычно выбирают уро­вень значимости а, равный 0,05. 4. Взять одну или две выборки и для каждой вычислить значение средней и стандартное от­клонение.
582

5. Вычислить значение t -статистики, приняв, что нулевая гипотеза Д верна. 6. Вычислить число степеней свободы и оценить вероятность получения большего значения статистики из табл. 4 Статистического приложения. (Альтернативно, вычислить критиче­ское значение / -статистики). 7. Если вероятность, рассчитанная на этапе 6 меньше, чем уровень значимости выбран­ный на этапе 3, то отклонить нулевую гипотезу Если значение вероятности больше, то И не отклонять. (Альтернативно, если значение, вычисленной на этапе 5 /-статистики, больше критического значения, определенного на этапе 6, то отклонить нулевую гипотезу Если вычисленное значение меньше критического значения, то //,, не следует откло­нять). Неудачная попытка отклонить нулевую гипотезу необязательно подразумевает, что Н верна. Это только означает, что истинное положение несущественно (статистически не­значимо) отличается от положения, утверждаемого Н. 8. Выразить полученный результат с точки зрения решения проблемы маркетингового ис­следования. Мы проиллюстрируем общую Процедуру проверки гипотез с ЛОМОШЫО /'-критерия в после­дующих разделах главы, начав с рассмотрения одной выборки. Одна выборка В маркетинговом исследовании аналитика часто интересует утверждение о (.'.отноше­нии одной переменной по сравнению с известной или заданной величиной. Примерами таких утверждений являются: доля рынка для нового товара превышает .596; по крайней мере 65% потребителей понравится новая упаковка; 80% дилеров предпочтут новую поли­тику ценообразования. Эти утверждения сформулируем с точки зрения нулевой гипотезы, которую затем проверим, используя статистический критерии для одной выборки, такой как /- или .: критерий. Если маркетолог использует /-критерий для проверки значения средней, его интересует, совпадает ли значение генеральной средней со значением, зада­ваемым в утверждении нулевой гипотезы {Ну,). Для данных табл. 15.2 предположим, что мы хотим проверить гипотезу о том, что среднее значение степени знакомства с Internet превышает 4,0 (балла) — нейтральное значение по семибалльной шкале. Выберем уровень значимости, равный а = 0,05. Сформулируем гипотезы: На :\и< 4,0 H„:[i> 4,0 , (*-") % s 5,385 _ (4.734-4.0) _ 0,724 _ 1?[ 0,297 О, Число степеней свободы для у-статистикн. используемой для проверки гипотезы в отноше­нии среднего значения, равно я ~ 1. В нашем случае я — 1 = 29 — 1 или 28. Из табл. 4 Статисти­ческого приложения находим, что вероятность получения более высокого значения, чем 2,471, меньше 0,05. (Альтернативно, критическое значение /-статистики для 28 степеней свободы и уровня значимости 0,05 равно 1,7011, что меньше рассчитанного значения, равного 2,471). Следовательно, нулевую гипотезу отклоняют. Степень знакомства с Internet превышает 4,0, Обратите внимание, что если нам известно стандартное отклонение генеральной совокуп­ности, и оно, допустим, равно 1,5, а, значит мы используем его, а не определенное на основа­нии выборки, то лучше использовать z-критерий (z-test). 2-критерий ^^еэ^ Одномерный метод проверки гипотезы, использующий стандартное нормальное рас­пределение. В нашем случае значение .--статистики было бы равно: Их-дК где = У ^-^ = 0.279 51 729 5,385 и (4.724-4,0) 0,724 0,279 Из табл. 2 Статистического приложения вероятность получить более высокое значение ста­тистики г, чем 2,595, меньше 0,05. (Альтернативно, критическое значение для односторонней проверки при уровне значимости 0,05 равно 1,645, что меньше полученного значения, равного 2,595). Следовательно, нулевую гипотезу отклоняют и получают тот же ре­зультат, что и при проверке гипотезы с помощью /■кртерин. Процедура проверки нулевой гипотезы относительно доли уже проиллюстрирована в этой главе, когда мы знакомились с теорией проверки гипотезы. Две независимые выборки Иногда гипотезы в маркетинге связаны с параметрами, взятыми из двух разных генеральных совокупностей; например, пользователи и непользователи торговой марки по-разному восприни­мают данную торговую марку; люди с высокими доходами больше тратят на развлечения по срав­нению с липами, имеющими низкий доход; доля приверженцев данной торговой марки в сег­менте 1 больше их доли в сегменте 2. Выборки, взятые случайным образом из разных изучаемых совокупностей, называют независимыми выборками (independent samples). Как и для одной выбор­ки, проверка гипотез может проводиться относительно значений средних или долей. Независимые выборки (independent sampler) Две выборки, экспериментально не связанные мехди собой. Измерения, проведенные в од­ной выборке, не оказывают влияния на значения переменных в другой. Средние. В случае проверки средних для двух независимых выборок гипотезы имеют сле­дующий вид: 11= =Л Из двух совокупностей берут выборки и вычисляют значения средних и дисперсий, из размеров выборок, равных соответственно л, и Если окажемся, что обе рассматриваемые совокупности имеют одинаковые значения дисперсий, то значение объединенной дисперсии, рассчитанное из двух дисперсий выборок, равно: = —

584

Стандартное отклонение проверяемой статистики рассчитывается по формуле: Соответствующее значение/-статистики вычислим по формуле: у = ----------- г.------------- Число степеней свободы в нашем случае равно 2). Если две генеральные совокупности имеют разные значения дисперсий, то точное значение /-■ статистики нельзя подсчитать из-за различия в выборочных средних. Вместо этого аппрок­симируем значения /-статистики. Число степеней свободы в этом случае обычно не будет це­лым числом, но приемлемо точное значение вероятности можно получить округлением до ближайшего целого числа [17]. Если неизвестно, равны ли дисперсии двух совокупностей, то для проверки выборочной дисперсии используем {"'-критерий, или критерий Фишера (Б-ТезТ). В этом случае гипотезы имеют вид: -критерий, или критерий Фишера Статистический критерий для проверки равенства двух дисперсий из двух совокупностей. Р-статиетику (Р-вТаИвПе) вычисляют как отношение выборочных дисперсий по формуле: Г >1 -!>(«!■-О ' где пх — размер выборки 1; — размер выборки 2; — степени свободы для выборки — степени свободы для выборки 2; — выборочная дисперсия для выборки 1; Si — выборочная дисперсия для выборки 2. р-статистика статистика представляет собой отношение двух выборочных дисперсий. Как нидно, критическое значение V-распределения (Р-ШзНтЬЩюп) зависит от значений числа степеней свободы: в числителе и в знаменателе. Г - распределение (Р-^вЙтЬиЙОП) Распределение частот, зависящее от значений степеней свободы: числа степеней свободы в числителе и знаменателе. Критическое значение /-статистики для различных степеней свободы в числителе и знамена­теле дано в табл. 5 Статистического приложения. Если вероятность ^-статистики выше уровня значимости а, то If не отклоняют и используют /-критерии, в основе которого лежит оценка объ­единенной дисперсии. С другой стороны, если вероятность г-статщ'тпки меньше или равна а, то /^отклоняют и используют /-критерий, в основе которого лежит оценка отдельных дисперсий. Предположим, что с помощью данных табл. 15.1 мы хотим определить, действительно ли интен­сивность использования Internet мужчинами отличается от использования Internet женщинами. Для этого выполним /- крнтернй для двух независимых выборок. Результаты приведены а табл. 15.14.

Таблица 15.14. Т-критерий двух независимых выборок
Итоговые статистики
Число случаев Среднее Стандартное отклонение
Мужчины 15 9,333 4,0
Женщины 15 3,867 1,68
F-критерий для проверки равенства дисперсий
F-статистика Двусторонняя вероятность
15,507 0,000

(•критерий

Предполагается равенство дисперсий Не предполагается равенство дисперсий t-статистчка Степени Двус горняя t-cwTucmm Степени Двусторонняя свободы вероятность свободы вероятность 4,492____ 28_______ 0,000_____ 4,492____ 18,014 0,000 Обратите внимание, что /^-критерий имеет вероятность меньше 0,05. В соответствии с этим нулевую гипотезу отклоняют. В данном случае следовало бы использовать /-критерии, в основе которого лежит утверждение "Предполагается, что дисперсии не равны". Значение I равно 4,492 и с учетом 18,014 степеней свободы это дает значение вероятности, равное 0,000, которое меньше уровня значимости, равного 0,05. Следова гел ьно. нулевую гипотезу о равенстве средних отклоня­ют. Так как среднее значение степени использования 1 nternei для мужчин (пол — 1) равно 9,333, а для женщин (пол — 2) — 3,867, то мужчины пользуются Internet значительно больше по сравне­нию с женщинами. Мы также покаэываемоыснизанче с помошыэ/-критерия для равных диспер­сий, поскольку большинство компьютерных программ автоматически выполняет обоими способами. Применение /-критерия рассмотрим в следующем примере. ПРИМЕР. Маркетологи пытаются установить связь между мобильностью лиц пожилого возраста и приверженностью к определенному универмагу

|

В исследовании выборки 789 американских респондентов 65 лет и старше маркетологи попытались определить связь недостаточной мобильности людей с выбором универмага. Главный вопрос данного исследования связан с различиями в физических требованиях, предъявляемых лицами пожилого возраста, зависимыми от других (требующими помощи при передвижении) и уверенными в своих силах, т.е. действительно ли две группы лиц по­жилого возраста выдвигают разные требования, чтобы добраться до магазина? Детальный анализ физических требований, выполненный на основе проверки двух независимых выбо­рок с помощью .'-критерия (таблица ниже), показал, что зависимые ли и;'. вероятнее всего, ищут магазины, которые предлагают доставку товаров на дом или прием заказов по телефо­ну, а также магазины, в которые они могут добраться. Они также предпочитают ряд близко­расположенных магазинов [18]. Различия в физических требованиях между зависимыми и уверенными в своих силах пожилыми людьми Среднее' Уверенные в своих силах Зависимые пожилые Вероятность для пожилыелюди люди t-критери я Доставка домой 1,787 2,00 0 0,023 Заказы по телефону 2,030 2,335 0,003

586

Доставка (человека) в универмаг 2,188 3,098 о,ооо

Близость парковки 4,001 4,095 0,305
Расположение (магазина) рядам с домом 3,177 3,325 0,137
Ряд магазинов, расположенных близко 3,456 3,681 0,023
один от другого
: "Измерения проведены по пятибалльной шкале: "не важно" присвоено 1 балл, "очень важно" — 5 баллов.

В этом примере мы проверили различие между средними. Аналогичную проверку можно выполнить для различия долей для двух независимых выборок. Доли. Рассмотрим с туап;'«.1 для долей двух независимых выборок, .цг^тас для которой приведены в табл. 15.1, где дано количество мужчин и женщин, использующих Internet для приобретения товаров. Одинаковы ли доли людей, использующих Internet для приобретения товаров, среди мужчин и женщин? Нулевая и альтернативная гипотезы имеют вид: Н01г Нг: ?г, * /г. Для одной выборки используют критерий. Однако в этом случае статистику, лежащую в основе критерия, вычисляют по формуле:

Р)

Здесь числитель представляет собой разность долей в двух выборках Р1 и Р1 Знаменатель — это стандартная ошибка разности двух долей, вычисляемая по формуле: —+-L где Выбран уровень значимости а = 0,05. С учетом данных табл. 15.15 тест-статистику можно вычислить следующим образом: Р,-Р, = (11/15)-(6/15) = 0,733-0,400 = 0,333 „ (15x0 733+15x0..400) 0 %7 715+15) " ' '

- =J0,567x0,433 f 0.333

=0,181

+ 1 15

0,181 При двусторонней проверке область справа от критического значения равна а/2 или 0,025. Следовательно, критическое значение тест-статистики равно 1,%. Так как вычисленное значе­ние меньше. чем критическое, нулевую гипотезу нельзя отклонить. Таким образом, различие в долях пользователей (0,733) для мужчин и (0,400) для женщин не считается статистически зна­чимым. Обратите внимание, хотя различие довольно существенное, оно статистически незна­чимое из-за небольшого размера выборки (по 15 человек в каждой группе). Парные выборки Во многих маркетинговых исследованиях наблюдения для двух групп не берут из незави­симых выборок. В таком случае наблюдения называют парными или выборками (paired samples), поскольку два набора наблюдений относятся к одним и тем же респондентам. Парные или связанные выборки (paired samples) В проверке гипотез наблюден*;! называют парными, если два набора наблюдений относятся к одним и тем же респондентам. выборка респондентов может оценимте две конкурирующие торговые марки, выявляя от­носительную важность двух характеристик (атрибутов) продукта, или оценивать стоимость тор­говой марки в разное время (сезон). Различие, возникающее в этой ситуации, проверяют с по­мощью t-критерия парных выборок (paired samples t-test). t критерий парных выборок (paired samples t-test) Критерий для различий средних значений парных выборок. Чтобы вычислить значение .'-критерия для парных выборок, вводят переменную разности, обозначаемую D, и вычисляют ее среднее и дисперсию. После этого вычисляют /-статистику. Чис­ло степеней свободы равно л — 1, где п — число пар. Соответствующие формулы имеют вид: Н,:цпФ О п-1 f Л где о=±о* В примере с пользователями Internet (см. табл. 15.1) этот критерий используют для опреде­ления отношения респондентов к Internet и к Internet-технологиям. Полученные данные при­ведены втабл. 15.15. Таблица 15.15. t-критерий парных выборок Переменная Количестве случаев Среднее Стандартное Стандартная ошибка отклонение Отношение к Internet 30 5,167 1,234 0,225 Отношение к Internet- 30 4,100 1,398 0,255 технологии Различие отношений к Internet и internet-технологиям Разность Стандартное Стандартная Корреляция Двусторонняя Т-статис- Степени Двусторонняя средних отклонение ошибка вероятность тика свободы вероятность ____ 0,1511_ ______ _______ 7,059__ 29___ Среднее значение отношения !>еспондснто]> к Internet равно 5,167, а к Internet-технологиям — 4,10. Разность средних между этими переменными равна 1,067 со стандартным отклонением С,НЗ» и стандартной ошибкой 0,1511. Поэтому значение /-статна и.ки равно (1,067/0,1511) = 7,06 с числом степеней свободы, равным 30 — I = 29 и значением вероятности, меньшим 0,001. Следовательно, респонденты более благосклонно относятся к Internet, чем к Internet- технологиям в целом, В качестве другого примера рассмотрим определение относительной эф­фективности ) 5- секунднаятелевизионной рекламы по сравнению с 30-секунднои. 588 Часть III. Сбор, подготовка и анализ данных Г' ,—..... .. —— --- Ш.......... .-..»....I... * rw~- ........ .. .. 1 ПРИМЕР. Подсчет секунд Для выяснения относительной эффективности В-секукднсй телевизионной рекламы по сравнению с 30-секундной провели опрос 83 директоров по работе с масс-медиа круп­нейших в Канаде рекламных агентств. Используя пятибалльную шкалу (1 — отлично, 5 — плохо) респонденты оценивали эффективность 15- и 30-секундной рекламы по следующим показателям; осведомленность о торговой марке, главная запоминающаяся идея, убедитель­ность и способность к эмоционяльной. передаче. Данные таблицы свидетельствуют, что по всем показателям респонденты выше оценили 30-секундиую рекламу. Среднее значение рейтинга 15- и 30-секундной рекламы по четырем переменным Осведомленность о Главная запоминающаяся Убедительность Эмоциональность торговой марке идо? 15 30 15 30 15 30 15 30 2,5 1,9 2,7 2,0 3,7 2,1 4,3 1,9 Парные проверки показали, что эти различия статистически значимы, и 15-сгкунд:::-.к I телереклама оценена как менее эффективная Разность в долях для парных выборок можно проверить, используя критерий Мак-Немара или критерий как это показано в следующем разделе, посвященном непараметри­ ческим методам проверки.

<< | >>
Источник: Нэреш К. Малхотра. Маркетинговые исследования. Практическое руководство. 3-е изд., пер. с англ. - М.: — 960 с.. 2002 {original}

Еще по теме ПРОВЕРКА ГИПОТЕЗ О РАЗЛИЧИЯХ:

  1. ВВЕДЕНИЕ В ТЕОРИЮ ПРОВЕРКИ ГИПОТЕЗ
  2. ОБЩАЯ СХЕМА ПРОВЕРКИ ГИПОТЕЗЫ
  3. 5. Проверка гипотезы
  4. 2.2.5. Описание данных, оценивание и проверка гипотез
  5. НЕПАРАМЕТРИЧЕСКИЕ МЕТОДЫ ПРОВЕРКИ ГИПОТЕЗ
  6. Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез
  7. Гипотеза
  8. ТРЕБОВАНИЯ К ГИПОТЕЗАМ
  9. § 36.6. ПРОЦЕДУРА ИСПЫТАНИЯ ГИПОТЕЗ
  10. § 16.5. ПРОЦЕДУРА ИСПЫТАНИЯ ГИПОТЕЗ
  11. ГИПОТЕЗА
  12. ГИПОТЕЗА
  13. Гипотеза