<<
>>

ПОСТРОЕНИЕ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ

Помимо ответов на вопросы, относящихся к анализу одной переменной, маркетологов час­то интересуют дополнительные вопросы о связи этой переменной с другими переменными. • Как много мужчин среди приверженцев данной торговой марки? • Связано ли использование товара (потребление его в больших, средних, малых коли­чествах и не потребление) с отдыхом на открытом воздухе (высокая, средняя и низкая активность)? • Связана ли осведомленность о новом товаре с возрастом и уровнем образования? • Связана ли покупка товара с доходом человека (высокий, средний или низкий доход)? На эти и подобные вопросы можно ответить с помощью таблицы сопряженности призна­ков. В то время как вариационный ряд характеризует одну переменную, построение таблиц со­пряженности признаков (кросс-табуляция) (cross-tabulation) помогает увидеть одновременно значения двух или больше переменных. Построение таблиц сопряженности признаков, кросс-табуляция (сгозд-^аЬиЫшп) Статистический метод, который одкоаремэнно характеризует две или больше переменных и заключается в создании таблиц сопряженности признаков, отражающих совместное распре­деление двух или больше переменных с ограниченным числом категорий или определен­ными значениями. Кросс-табуляция представляет собой процесс объединения распределений частот значений двух или больше переменных в одну таблицу. Она объясняет, как одна переменная, например лояльность торговой марке, связана с другой переменной, такой как пол. В таблицах сопря­женности признаков показывается совместное распределение значений двух или больше пере­менных, облагающих ограниченным числом категорий или принимающих определенные зна­чения. Категории одной переменной помешают в таблицу так, чтобы они размещались в ней (сопрягались) в соответствии с категориями другой или другими несколькими переменными. Таким образом, распределение частот одной переменной подразделяется на группы в зависи­мости от категорий других переменных. Предположим, нас интересует, действительно ли использование Internet связано с ио.юм. Чтобы построить таблицу сопряженности признаков, респондентов разделили в зависимости от того, сколько времени они пользуются сетью. Пользующихся Internet пять часов и меньше отнесли к мало пользующимся, а остальных — ко много, Итог процедуры кросс-табуляции приведен в табл. 15.3.
Таблица 15.3, Пол и использование Internet
Пол
Использование Internet Мужчины Женщины Итого
Мало (1) 5 1G 15
Много (2) 1G 5 15
Итого 15 15

Кросс-табуляция предусматривает создание ячейки для каждой комбинации категорий двух переменных. Число в каждой ячейке показывает количество респондентов, давших эту комбинацию ответов. В табл. 15.3 видим, что 10 респондентов, ответивших, что они мало ис­пользуют Internet — женщины. Итоговые значения таблицы показывают, что из 30 респонден­тов с достоверными ответами по обеим переменным 15 человек ответили, что они мало ис­пользуют Internet, a 15 — много. Что касается пола, то 15 респондентов оказались женщинами, а 15 — мужчинами.

Обратите внимание, что эту информацию можно было бы получить из от­дельного распределения частот для каждой переменной. Таблицы также на- зываюттаблицамисопряженности признаков (contingencytables). Таблицы сопряженности признаков (contingency tables) Таблица кросс-табуляции состоит из ячеек, в которых приведены комбинации двух переменных. Рассматриваемые данные должны быть качественными или категориальными, по­скольку предполагается, что каждая переменная должна измеряться только по номиналь­ной шкале [7]. Таблицами сопряженности широко пользуются при проведении прикладных маркетинго­вых исследований, поскольку • менеджеры, которые недостаточно владеют статистическими методами, легко интерпре­тируют и понимают процедуру кросс-табуляции и ее результаты; • очевидность трактовки результатов анализа ясно свидетельствует о возможных управ­ленческих действиях; • ряд операций кросс-табуляции позволяет лучше понять сложное явление, чем это сде­лал бы один многовариантный анализ; • кросс-табуляции облегчает проблему разбросанных ячеек, которая затрудняет дискрет­ный анализ; • анализ методом кросс-табуляции прост для выполнения и поэтому обращен к исследо­вателям, менее искушенным в вопросах статистики [8]. Мы рассмотрим построение таблиц сопряженности для двух и трех переменных. Две переменные Крскс-табуляциш с двумя переменными можно рассматривать как двумерную. Сначала рассмотрим кросс-табуляцию данных, пола и использования Internet, представ­ ленную в табл. 15.3. Связано ли использование Internet с полом? Это можно выяснить из табл. 15.3. Мы видим, что непропорционально большое количество респондентов, проводя- ших много времени в Internet, — мужчины. Лучше понять этот вопрос поможет процентное вычисление.
570

Исходя из того, что обе переменные подвергаются процедуре кросс-табуляинк, мы можем посчитать проценты применительно к колонке (табл. 15.4) либо к строке (табл, 15.5).

Таблица 15.4. Использование Internet в зависимости от пола
Пол
Использование Internet Мужчины Женщины
Мало 33,3% 66,7%
Много 66,7% 33,3%
Итого 100,0% 100,0%
Таблица 15.5. Пол человека в зависимости от использования Internet
Использование
Поп Мало Много Итого
Мужчины 33,3% 66,7% 100,0%
Женщины 66,6% 33.3% 100,0%

Какая из этих двух таблиц полезнее? Ответ на данный вопрос зависит от того, какая пере­менная рассматривается как независимая, а какая как зависимая [9]. Общее правило, которое необходимо соблюдать, гласит —проценты необходимо вычислять для каждой категории неза­висимой переменной (так, чтобы суммарное значение категорий зависимой переменной при­менительно к каждой категории независимой переменной давало 100%). В нашем анализе пол можно рассматривать как независимую переменную, использование Internet — как зависимую, а правильный способ вычисления прицеп юн показан в табл. 15.4. Заметим, что мужчины больше используют Internet, чем женщины. Это видно из ТОГО, что 66,7%, активно пользую­щихся Internet, составляют мужчины, тогда как на долю женщин в этой категории приходится всего лишь З ', 3 %. Вычисление П^центоИ в направлении зависимой переменной через независимую, как по­казано в табл. 15.5, бессмысленно. Табл. 15.5 подразумевает, что интенсивное пользование Internet — причина того, что такими людьми являются мужчины. Это последнее утверждение неправдоподобно. Однако, возможно, что связь между пользованием Internet и полом человека «лоерсдонана третьей переменной, например возрастом или доходом. Поэтому необходимо проверить влияние третьей переменной. Три переменные Часто введение третьей переменной позволяет маркетологу четче уяснить природу исходной связи между двумя переменными. Как показано на рис. 15.7, третья переменная может прп^х- ти к четырем возможностям. 1. Уточнить связь, наблюдаемую между двумя исходными переменными. 2. Указать на отсутствие связи между двумя переменными, хотя первоначально связь наблю­далась, Другими словами, третья переменная покажет, что исходная связь между двумя пе­ременными была ложной. 3. Показать некоторую связь между двумя переменными, хотя первоначально она не наблю­далась. В этом случае третья переменная показывает скрытую связь между первыми двумя переменными. 4. Не показать никаких изменений в первоначальной связи [10].

Рис. 15.7. Введение третьей переменной в кросс-табуляцию

Эти возможности объясняются на примерах, в основе которых лежит выборка в тысячу рес­пондентов. Уточнение исходной связи. В результате изучения связи между покупкой модной одежды и семейным положением получены данные, приведенные в табл. 15.6. 15.6. Покупка дадной одежды в зависимости от семейного положения Семейное положение

Покупка модной одежды Женат (замужем) Неженат (не замужем)
Много 31% 52%
Мало 69% 48%
Итого 100% 100%
Число респонденті ПН 700 300

Респондентов поделили на две категории покупателей модной одежды: много покупающие и мало покупающие. Семейное положение тоже имело две категории: женат (замужем) либо не женат (не замужем). Как видно из табл. 15.6, в категорию лиц, покупающих много модной одежды, попали 52% несемейных респондентов и только 31% семейных. Перед тем как заклю­чить, что респонденты, не имеющие семьи, покупают больше модной одежды, чем и «екниие семью, в анализ была введена третья переменная — пол.

Таблица 15,7. Связь покупки модной одежды с семейным положением
Покупка модной одежды Женат Мужской Не женат Пол Замужем Женский Не замужем
Много 35% 40% 25% 60%
Мало 65% 60% 75% 40%
Итого 100% !00% 100% 100%
Число ре!:-;тонде>'той 400 120 300 180

Пол респондентов вводился в качестве третьей переменной на основании результатов предшествующего маркетингового исследования. Связь между покупкой модной одежды и се­мейным положением пересмотрена в свете третьей переменной, как показано в табл. 15.7. Что касается женщин, то из них 60% незамужних попали в категорию покупающих больше модной одежды по сравнению с 25% замужних женщин, С другой стороны, для мужчин эта разница в процентах не так велика: 40% холостых и 35% женатых попали в категорию покупателей, при­обретающих много модной одежды. Следовательно, третья переменная, уточнила связь между семейным положением и покупкой модной одежды (начальными переменными). Вероятность попадания в категорию покупателей, приобретающих много модной одежды, выше для несе­мейных респондентов по сравнению с семейными, причем она выше для Исходная связь между двумя переменными ложна. Маркетолог проводит исследование для рекламного агентства, разрабатывающего рекламу для автомобилей стоимостью свыше 30 тысяч долларов. Он попытался проанализировать факторы, влияющие на владение дорогими автомо­билями (табл. 15.8).

Таблица 15.8. Зависимость владения автомобилями от образовательного уровня
Наличие дорогого автомобиля Выпускник колледжа Образование 5ез степени колледжа
Да 32% 21%
Нет 68% 79%
Итого 100% 100%
Число респондентов 250 750

Часть подготовка и анализ данных Из таблицы видно, что 32% выпускников колледжа имеют дорогой автомобиль, в то время как среди не окончивших колледж дорогим автомобилем владеют только 21%. Исследователь убежден, что уровень образования влияет на приобретение дорогого автомобиля. Решив, что на его покупку влияет и доход, исследователь перепроверил связь между образованием и наличи­ем дорогого автомобиля в свете уровня доходов. Результаты приведены в табл. 15.9. Таблица 15,9 Влияние образования и уровня дохода на наличие дорогого автомобиля Доход

Низкий Образование Колледж Нет

Высокий Образование Колледж Нет

Наличие дорогого автомобиля

Да Нет Итого:

40% 60% 100% 150

20% 60% 100% 100

20% 80% 100% 700

40% 60% 100% 50

Число респондентов

Заметим, что процент тех, кто имеют дорогой автомобиль, среди окончивших колледж или не окончивших его одинаков для каждой из групп, разбитых по доходу. Если данные по груп­пам с высокими и низкими доходами проверить то связь между образованием и на­личием дорогого автомобиля исчезает, а это значит, что первоначально наблюдаемая связь ме­жду этими двумя переменными была ложной.

Возраст 45 и старше

Третья переменная показывает подавленную связь между первыми двумя переменными. Маркетолог, исследующий сферу туристических поездок за границу, предположил, что на же­лание путешествовать влияет возраст. Однако таблица сопряженности двух переменных (табл. 15,1 0) не выявила никакой связи. Когда в качестве третьей переменной ввели пол, полу­чили данные, представленные ъиюп, 15.11. I Таблица 15.Ю, Зависимость желания совершить туристическую поездку за границу от возрастз Желание совершить туристическую поездку за границу До 45Лет

Да Нет . Итого Число

50% 50% 100% 500

50% 50% 100% 500

| Таблица 15.11. Связь между желанием совершить туристическую поездку за границу, возрастом и полом

Пол
Желание совершить путешествие за границу Мужчины Женщины
До 46 лет и старше До и старше
Да 60% 40% 35% 65%
Нет 40% 60% 65% 35%
Итого 100% 100% 100% 100%
Число респондентов 300 300 200 200

Среди мужчин до 45 лет 60% изъявили желание отправиться в турпоездку заграницу, а по­сле 45 лет — всего лишь 40%. Обратная ситуация наблюдалась для женщин: в возрасте до 45 лет желающих отправиться посмотреть мир оказалось 35%, а после 45 лет — 65%. Поскольку связь между желанием путешествовать и возрастом различна для мужчин и женшин и с противопо­ложной направленностью, связь между этими двумя переменными была скрыта, пока данные не учитывали переменную "пол", как это сделано в табл. 15.10. Но при проверке влияния пола, как показано в табл. 15.11, проигнорированная связь между желанием путешествовать и воз­растом была обнаружена для отдельных категорий: мужчин и женшин. Никаких изменении в первоначальной связи. В некоторых случаях третья переменная не из­меняет первоначально наблюдаемую связь, независимо от того, были ли исходные переменные взаимосвязаны. Это означает, что третья переменная никак не влияет на связь между двумя первыми переменными. Рассмотрим кросс-табуляцию двух переменных: размер семьи и часто­ту посещения ресторанов быстрого питания, представленную в табл.

Таблица 15.12. Связь частоты посещения ресторанов быстрого питания с размером семьи
Частота посещен*я ресторана быстрого питания Небольшая Размер семьи Большая
Большая 65% 65%
Маленькая 35% 35%
Итого 100% 100%
Число респондентов 500 500

Респондентов разделили (используя медиану) на две равные по размеру категории по 500 респондентов в каждой: небольшая и большая семья, Не наблюдалось никакой связи, Затем по этому же принципу респондентов разделили на категории: семьи с большим и малым доходом. При введении в анализ третьей переменной получили табл. 15-13. И снова не наблюдалось ни­какой Таблица Связь частоты посещения ресторанов быстрого с размером семьи и уровнем дохода

Доход
Семьи с низким доходом Семьи с высоким доходом
Частота посещения ресторанов быстрого питания Малая Большая Малая Большая
Большая 65% 65% 65% 65%
Маленькая 35% 35% 35% 35%
Итого 100% 100% 100% 100%
Число респондентов 250 250 250 250

Общие комментарии по поводу кросс-табуляции

574

Можно построить таблицу сопряженности больше, чем для трех переменных, но интер­претация полученных результатов достаточно сложная. Кроме того, поскольку число ячеек многократно увеличится, проблематично оставить необходимое количество респондентов или случаев в каждой ячейке. Как правило, чтобы вычислить статистику в каждой ячейке, должно быть, по крайней мере, пять наблюдений. Таким образом, кросс-табуляция — не­способ проверки связей для ситуаций с несколькими переменными, она рас- снатрїівает просто связь между переменными, а не причинность. Чтобы изучить причинно- следственную связь, необходимо провести соответствующее причинно-следственное иссле­дование (см. главу 7).

<< | >>
Источник: Нэреш К. Малхотра. Маркетинговые исследования. Практическое руководство. 3-е изд., пер. с англ. - М.: — 960 с.. 2002

Еще по теме ПОСТРОЕНИЕ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ:

  1. СТАТИСТИКИ ТАБЛИЦ СОПРЯЖЕННОСТИ ПРИЗНАКОВ
  2. Глава 15. Вариационный ряд, таблицы сопряженности признаков и проверка гипотез
  3. 4.1.3. Построение аналитических таблиц
  4. 7.2. Аналитические таблицы: виды и способы построения
  5. 3. Единая система таможенных органов: краткая характеристика, признаки единства, принципы построения взаимоотношений
  6. 4.2. О коэффициентах взаимной сопряженности
  7. МЕТОД СОПРЯЖЕННЫХ НАПРАВЛЕНИЙ
  8. 12.1. Сопряженные денежные поступления
  9. Концепция сопряженных обстоятельств
  10. 2.2.4. Таблицы
  11. Вопрос 11. Таблицы смертности
  12. 8. Сопряженный эффект финансового и операционного рычагов
  13. 14.2. Традиционный подход к построению системы права (предмет и метод правового регулирования как основания построения системы права)
  14. 1.5. Счета и таблицы
  15. 8.10. ТАБЛИЦЫ ОБЛИГАЦИЙ
  16. 3.9.6. Сводные таблицы