2.94M
Категория: МаркетингМаркетинг

Маркетинговые исследования. Совместный анализ маркетинговых данных. Сравнение средних значений показателей в группах

1.

ФГБОУ ВО «Уральский государственный экономический университет»
Маркетинговые
исследования
Изакова Наталья Борисовна
Кандидат экономических наук
доцент кафедры маркетинга и международного
менеджмента
+7 (343) 283 10 46
[email protected]
г. Екатеринбург, ФГБОУ ВО «УрГЭУ», ул. 8-е марта 62,
ауд. 755, Кафедра маркетинга и международного
менеджмента

2.

Совместный анализ
маркетинговых данных
СРАВНЕНИЕ СРЕДНИХ ЗНАЧЕНИЙ ПОКАЗАТЕЛЕЙ
В ГРУППАХ, ДИСПЕРСИОННЫЙ
АНАЛИЗ В МАРКЕТИНГОВЫХ ИССЛЕДОВАНИЯХ

3.

Сравнение средних: применимость в маркетинговых
исследованиях
1. T-тест
1.1. T-критерий для независимых выборок
1.2. T-критерий для парных выборок
1.3. Одновыборочный t-критерий
2. Дисперсионный анализ
2.1. Однофакторный дисперсионный анализ
2.2. Многофакторный дисперсионный анализ
2.3. Непараметрический дисперсионный анализ

4.

1. Сравнение средних: применимость в исследованиях
• Сравнение средних значений
различных выборок – это
наиболее часто
применяемый метод
статистического анализа.
• При этом должно быть
выяснено,
статистически значимо данное
различие или нет.

5.

Статистическая гипотеза
• При исследованиях показателей маркетинговой деятельности в реальных
условиях во многих случаях приходится иметь дело с трудно
изменяемыми или даже не изменяемыми исследователем факторами.
• Чтобы получать приемлемые результаты и делать достаточно точные
выводы при работе с такими факторами, выдвигаются гипотезы.
• Статистические методы позволяют принимать или отвергать такие
гипотезы.
• Статистическая гипотеза - любое предположение о свойствах случайной
величины.
• Выдвигаемые гипотезы подразделяются:
- исходная (основная) или нулевая гипотеза Н0,
- конкурирующие гипотезы Н1, Н2, …Нn.
Если нулевая гипотеза отвергается, то в качестве основной принимается
первая из конкурирующих, если и она отвергается, то принимается вторая и
т. д.

6.

Пример
• Сравнение среднего дохода различных групп людей: проживающих в столице, обычном
городе или сельской местности, для оценки дифференциации уровня жизни.
• Расчет средних значений уровня дохода не даст обоснованной оценки различий.
• Задача исследователя сформулировать гипотезу о том, что средний доход групп людей,
проживающих в различных населенных пунктах различается.
• Данную гипотезу можно проверить и обоснованно подтвердить или опровергнуть с помощью
T-теста (Т-критерия) и однофакторного дисперсионного анализа.

7.

T – тест или Т–критерий
• t–критерий применяется для сравнения двух групп, образованных категориями
независимой переменной по характеристикам распределения зависимой
непрерывной переменной.
• В маркетинговых исследованиях применяется для проверки статистических
гипотез
• Метод t–критерия используется для проверки достоверности различия двух
выборок по количественной переменной.
• Нулевая гипотеза формулируется следующим образом: “Взаимосвязи между
исследуемыми переменными нет”.
• Например, формулируя исходную (нулевую) гипотезу предполагаем равенство
среднего чека покупателей разного возраста, это говорит о том, что люди разного
возраста в среднем тратят одинаковую сумму на покупки.
• В результате проведенного исследования данная гипотеза либо подтверждается,
либо опровергается.

8.

В основе t-критерия лежат следующие
предположения:
• Две группы являются взаимоисключающими, т.е.
каждое наблюдение может попасть только в одну из
этих групп.
• Данные получены в результате случайной выборки
из генеральной совокупности с нормальным
распределением непрерывной переменной.
• В генеральной совокупности в обеих группах
одинаковая дисперсия непрерывной переменной

9.

t-критерий
• Для проверки достоверности нулевой гипотезы используется критерий
Фишера (F—критерий) и показатель значимости.
• Критерий Фишера (F—критерий) – это статистический критерий, с
помощью которого проверяется гипотеза о равенстве дисперсий двух
разных совокупностей. F—критерий это отношение двух выборочных
дисперсий.
• Найденное Fнабл. сравнивается с критическим значением Fкр
(стандартные показатели) при заданном уровне значимости p.
• Показатель значимости p должен быть меньше 0,05 (5%). Значимость
является мерой достоверности вычисленных результатов. При
использовании t—критерия устанавливается доверительный интервал
равный 95%.
• В случае Fнабл. < Fкр. при допустимом уровне значимости (меньше
0,05) гипотеза об однородности оценок дисперсий не отвергается.
Следовательно нулевая гипотеза, сформулированная в исследовании
подтверждается.

10.

t-критерий, выводы
• Для формулировки выводов используется критерий равенства
дисперсий Ливиня.
• Вывод о том, что дисперсии двух переменных статистически не
различаются (предполагается равенство дисперсий) делается
если величина значимости р>0,05. В таком случае принимается
верность нулевой гипотезы о том, что различий между
исследуемыми величинами нет.
• Вывод о том, что дисперсии двух переменных статистически
различаются (равенство дисперсий не предполагается)
делается если величина значимости р<0,05. В таком случае
нулевая гипотеза отвергается и делается вывод о том, что
различия между исследуемыми величинами есть.

11.

Виды T-критерия
Можно использовать только для количественной переменной в случае, когда
имеются лишь две сравниваемые группы.
Т-критерий
1.
t-критерий для
независимых
выборок
2.
t-критерий для
парных выборок
3. Одновыборочный
t-критерий

12.

Варианты использования метода t-критерия
• Т—критерий для независимых выборок используется для сравнения
средних значений двух выборок. Для данных выборок должны быть
определены значения одной и той же переменной. Например:
удовлетворенность покупкой мужчин и женщин, семейных и
несемейных, предпочитающих или не предпочитающих марку “А” и т.д.
• Т—критерий для парных выборок позволяет сравнить средние значения
двух измерений одного признака для одной и то же выборки. Например,
результаты опроса потребителей в начале и в конце месяца.
• Одновыборочный t—критерий используется для сравнения средней
величины изучаемого признака в выборке с некоторой эталонной
величиной. Например, отличается ли средняя цена на конкретный товар
выбранных торговых предприятий от средней цены, рассчитанной
официальным источником или ценой, которую готовы заплатить
потребители за данный товар.

13.

Пример применения t-критерия для независимых выборок
Задача: определить, отличается ли средний возраст россиян в столицах и городах с населением 950 тыс. человек.
Нулевая гипотеза: различий в среднем возрасте россиян в столицах и городах с населением 950 тыс. человек НЕТ.

14.

Интерпретация результатов t-критерия для независимых выборок
T-критерий реализует разные статистические критерии – когда дисперсии количественной
переменной в двух рассматриваемых группах различны либо одинаковы.
Проверка гипотезы о равенстве дисперсий → «тест Левиня»
F-статистика этого теста равна 2,656, а значимость этой статистики р = 0,104
(принимаем гипотезу)
Значимость ˃ 0,05 – принимаем гипотезу о равенстве средних и делаем вывод, что
средний возраст жителей столиц и крупных городов не различен.

15.

T-критерий для парных выборок
Сравнение средних значений двух отдельных переменных для выяснения вопроса о том, среднее
значение какой из них больше, а какой — меньше.
Проверка различия средних значений, но уже в отношении двух отдельных переменных,
измеренных в рамках одной выборки.

16.

T-критерий для парных выборок
Пример: сравнение средних значений количества свеклы и моркови, которые собрали семьи на своих
приусадебных участках.
Несмотря на весьма существенную, как кажется, разницу между средним количеством собираемых свеклы
и моркови, мы не имеем оснований утверждать о наличии различий в объемах выращивания этих
овощей.
Значимость ˃ 0,05 – принимаем гипотезу о равенстве средних и делаем вывод, что среднее количество
собранной свеклы и моркови не различаются

17.

Одновыборочный t-критерий
Сравним средний возраст
1. «Анализ» → «Сравнение средних» → «Одновыборочный tкритерий».
2. Необходимо выбрать одну или несколько переменных для
проверки при одном и том же гипотетическом значении.
3.Необходимо ввести значение, с которым будет сравниваться
каждое выборочное среднее.
4.Можно щелкнуть мышью по кнопке «Параметры» и выбрать способ
работы с пропущенными значениями, а также задать уровень для
доверительного интервала

18.

Одновыборочный t-критерий
• Результаты проверки статистической гипотезы о равенстве среднего значения выбранной переменной
заданному фиксированному («эталонному») значению.
• Значимсоть р = 0,0001 делаем вывод, что гипотезу о равенстве средних не следует принимать (<0,05).
• Следовательно, делаем вывод о том, что средний возраст жителей выбранного региона отличается от
выбранного «эталонного» значения – 44,52 года.

19.

Дисперсионный анализ
• метод, при помощи которого исследуется влияние одной или
нескольких независимых переменных на одну или несколько
зависимых переменных.
• Например, один и тот же продукт продается в нескольких
регионах в упаковке разных типов. На основе данных объема
продаж, сгруппированных по указанным признакам, нужно
определить, имеют ли существенное влияние на результаты
продаж:
• регион и тип упаковки (основной эффект);
• комбинация этих факторов (интерактивный эффект).

20.

21.

Примеры постановки вопроса
• Пример постановки вопроса однофакторного дисперсионного
анализа: влияет ли тип рекламы (плакаты, объявления в
средствах массовой информации и др.) на число посетителей в
кинотеатре?
• Пример постановки вопроса двухфакторного дисперсионного
анализа: влияет ли регион и тип упаковки на объем продаж
определенного товара?
• Пример постановки вопроса многомерного дисперсионного
анализа: влияют ли регион и тип упаковки на объем продаж и
число жалоб потребителей определенного товара?

22.

Дисперсионный анализ

23.

Дисперсионный анализ
• При однофакторном дисперсионном анализе сравниваются между
собой средние значения нескольких групп (выборок), на которые
делятся все анализируемые данные.
• Независимая переменная, при помощи которой все данные
разделяются на группы (категории) называется категориальным
фактором.
• В дисперсионном анализе всегда показатель, который является
зависимым должен быть количественной величиной!
• Фактор – независимая переменная, должна быть категориальной
(неметрической) и выражаться в номинальной шкале.
• С помощью дисперсионного анализа всегда изучается влияние
номинальной (качественной) переменной на количественную.

24.

Последовательность проведения
однофакторного дисперсионного анализа
• Формулировка вопроса в соответствии с требованиями,
предъявляемыми к переменным, выбор зависимой и независимой
переменных.
• Формулирование исходной (нулевой гипотезы), согласно которой нет
связи между выбранными переменными. В результате анализа
нулевая гипотеза должна быть подтверждена или опровергнута.
• В ходе проведения анализа проверяются условия равенства дисперсий
зависимой переменной в нескольких выбранных группах (категориях).
• Проведение проверки неравенства средних значений зависимой
переменной в сравниваемых группах для выявления взаимосвязи
между переменными.
• Определение особенностей выявленной взаимосвязи, выявление
категорий ее обуславливающих.

25.

Однофакторный дисперсионный анализ
• метод дисперсионного анализа, в котором рассматривается только один фактор.
«Анализ» → «Сравнение средних» → «Однофакторный дисперсионный анализ»
Во вкладке
«Параметры»
отметить:
Статистика
‒ Описательные
‒ Проверка однородности дисперсии
График средних
Пропущенные значения
‒ Исключать по отдельности

26.

Однофакторный дисперсионный анализ
• В маркетинговых исследованиях под фактором F (независимой
переменной) чаще всего принимают:
• социально-демографические, поведенческие и прочие характеристики
потребителей (пол, возраст, социальное положение, доход, степень
осведомленности о продукте и прочее);
• отдельные элементы комплекса маркетинга (цена, ассортимент,
интенсивность рекламной кампании, интенсивность комплекса мер по
стимулированию сбыта, варианты упаковки товара, виды рекламных
роликов и прочее).
• Зависимой переменной X может выступать объем покупок, частота
покупок, предпочтение товара или торговой марки, имидж фирмы,
оценка потребительских намерений приобретения товара, вероятность
покупки товара и другие переменные.

27.

Однофакторный дисперсионный анализ
• Пример постановки вопроса однофакторного дисперсионного
анализа: влияет ли тип рекламы (плакаты, объявления в средствах
массовой информации и др.) на число посетителей в кинотеатре?
• Пример постановки вопроса двухфакторного дисперсионного
анализа: влияет ли регион и тип упаковки на объем продаж
определенного товара?
• Пример постановки вопроса многомерного дисперсионного
анализа: влияют ли регион и тип упаковки на объем продаж и
число жалоб потребителей определенного товара?

28.

Вопросы:
для однофакторного дисперсионного анализа
Действительно ли различаются предпочтения потребителей к торговой
марке в зависимости от их уровня дохода;
Действительно ли различаются предпочтения потребителей к торговой
марке в зависимости от вида рекламного ролика, который они
посмотрели;
Различаются ли разные сегменты рынка с точки зрения предпочтений
мест приобретения товара;
Влияет ли уровень образования респондентов на выбор мета отдыха;
Различаются ли географические сегменты по товарным предпочтениям
потребителей.

29.

Пример анкеты

30.

Пример применения однофакторного
дисперсионного анализа
Анализ влияния различных факторов на объемы продаж компаниипроизводителя
По результатам исследования предложения сырья для производства
мебельной доски на рынке России, выявлены основные факторы,
влияющие на объемы продаж российских компаний-производителей.
Исследуемыми показателями (факторами) являются:
- зависимая переменная – средний объем продаж, т/мес.;
- независимая переменная (категориальный фактор) – широта
дилерской сети: 1 – от 0 до 7 дилеров, 2 – от 8 до 14 дилеров, 3 – от 15
и более

31.

Пример применения однофакторного
дисперсионного анализа
Выдвинуты для статистической проверки следующая гипотеза:
- на объемы продаж компаний влияет широта дилерской сети
производителей.
С целью проведения анализа формулируется нулевая гипотеза:
H0: на объемы продаж компаний влияет широта дилерской сети
производителей.
Изучение влияния факторов на объемы продаж позволило установить:
• Fрасч = 2,760>Fтабл = 0,750, что свидетельствует о значимости влияния
фактора на объем продаж.
• Так как p = 0,009<0,05, следовательно мы можем отклонить нулевую
гипотезу с вероятностью ошибки меньше 5%. Отклоняем и делаем вывод:
на продажи оказывает влияние широта дилерской сети

32.

СПАСИБО ЗА ВНИМАНИЕ!
English     Русский Правила