Регрессионный анализ позволяет установить причинно-следственные взаимосвязи между переменными объемом продаж и расходами на рекламу, уровнем обслуживания и




Регрессионный анализ
Регрессионный анализ позволяет установить причинно-следственные взаимосвязи между переменными (объемом продаж и расходами на рекламу, уровнем обслуживания и площадью торгового зала, предпочтениями потребителей и степенью узнаваемости торговой марки и т.д.).
Однако, прежде, чем приступить к изучению регрессии, необходимо рассмотреть понятие корреляции, лежащей в основе регрессионного анализа.
Часто при проведении маркетингового исследования нас интересует связь между двумя метрическими переменными:
1. Насколько сильно связан объем продаж с расходами на рекламу?
2. Существует ли связь между долей рынка и количеством торгового персонала?
3. Связано ли восприятие качества товара с уровнем цены?
Для определения силы взаимосвязи между метрическими переменными используется коэффициент корреляции Пирсона – r. Формула для расчета:

В формуле переменная ^ Х является независимой, а Y – зависимой.
В Excel выполняется командой «Мастер функций» - «Статистические» - «Коррел» (или «Мастер функций» - «Статистические» - «Пирсон»).
Коэффициент Пирсона принимает значения от -1 до +1. Абсолютное значение (по модулю) 0,7 – наличие тесной (сильной) взаимосвязи.
Знак коэффициента Пирсона означает наличие прямой или обратной взаимосвязи между переменными.
Парная корреляция составляет концептуальную основу для парного и множественного регрессионного анализа.
Расчет коэффициента корреляции носит название «корреляционного анализа».

Пример. Рассмотреть силу взаимосвязи между показателями ВВП и доходами страховых компаний.

Год
Доходы страховых компаний
ВВП (млн. грн.)
2002
3049,6
225810
2003
6167,2
267344
2004
14913,5
345113
2005
27822,7
441452
2006
23927
544153
2007
25511,2
720731
2008
35644
948056
2009
32710
913345






^ Коррел = 0,900995506




Таким образом, между этими переменными, существует сильная взаимосвязь (корреляция).
Если маркетологу приходится иметь дело с категориальными переменными, то для изучения взаимосвязи рассчитывается ранговый коэффициент корреляции Спирмена.
, где
n – количество парных наблюдений.

^ Регрессионный анализ

представляет собой статистический метод изучения данных, в результате которого устанавливаются причинно-следственные взаимосвязи между переменными.
В результате анализа появляется возможность рассчитывать значение зависимой переменной в зависимости от того, какое значение примет независимая переменная (предиктор), т.е. выполнять прогнозирование.
^ Все переменные для регрессионного анализа должны быть метрическими.
Парная (двумерная) регрессия – это метод установления зависимости между двумя метрическими переменными в виде математического уравнения, одна из которых является зависимой (категориальной), а другая – независимой.
Примеры для применения регрессионного анализа.
1. На сколько можно ожидать увеличение объема продаж при увеличении количества продавцов?
2. Как влияет изменение расходов на рекламу на степень узнаваемости торговой марки?
3. Как цена товара влияет на количество лояльных покупателей?
Порядок выполнения регрессионного анализа

Пример. Изучить влияние рекламы на объемы продаж.

Расходы на рекламу
Объем продаж

41


1250


54


1380


63


1425


54


1425


48


1450


46


1300


62


1400


61


1510


64


1575


71


1650







1. Построение корреляционной диаграммы и расчет коэффициента корреляции. («Мастер диаграмм» - «Точечная» - «Ок»).

r = 0,84

, что свидетельствует о сильной взаимосвязи между переменными.
2. Построение модели и вывод уравнения регрессии.

Уравнение регрессии имеет вид:
3. Расчет параметров модели.

^ ВЫВОД ИТОГОВ

Регрессионная статистика


Множествен. R


0,847950033







R-квадрат


0,719019259







Нормированный R-квадрат
0,683896667





^ Стандартная ошибка


67,19447214







Наблюдения
10





Дисперсионный анализ


 
df
SS
MS
F
Значимость F

Регрессия
1
92431,72
92431,72

20,4717


0,001938



Остаток
8
36120,78
4515,097



Итого
9
128552,5
 
 
 








 
Коэффиц.
Стандарт. ошибка
t-статистика
P-Значение
Нижние 95%
Верхние 95%
Y-пересечение

828,1268882


136,1286
6,083416
0,000295
514,2138
1142,04
Переменная X 1

10,7867573


2,384042

4,524567


0,001938


5,289146


16,28437


^ ВЫВОД ОСТАТКА
Наблюдение
Предсказ. Y

Остатки






1
1270,383938
-20,3839




2
1410,611782
-30,6118




3
1507,692598
-82,6926




4
1410,611782
14,38822




5
1345,891239
104,1088




6
1324,317724
-24,3177




7
1496,905841
-96,9058




8
1486,119084
23,88092




9
1518,479355
56,52064




10
1593,986657
56,01334




Основные параметры регрессионной модели:
1.

Множественный R

= 0,847950033 (коэффициент корреляции Пирсона).
2.

R-квадрат

= 0,719019259 (коэффициент детерминации) – показывает долю вариации зависимой переменной, которая объясняется вариацией независимой переменной (значения от 0 до 1).
3.

Стандартная ошибка SE

= 67,19 (значение не должно превышать 30%).
4.

F – критерий Фишера

(полученное значение должно быть больше табличного),

Значимость F

< 0,05.
5.

t – статистика

(коэффициент Стьюдента) – значение должно быть > 2;

р – значение

< 0,05;

доверительный интервал

не должен включать 0. Эти три показателя между собой взаимосвязаны и интерепретируются одинаково: переменная

Х

оказывает значимое влияние на переменную

Y

.
6.

Остатки

(влияние случайных факторов) – коэффициент автокорреляции для остатков должен стремиться к нулю. Рассчитывается как коэффициент корреляции для двух наборов данных их одного столбца: первый – значения с 1 по 9 (предпоследний), второй – значения с 2 по 10 (последний).
4. Проверка модели на возможность ее практического применения производится по критериям точности, надежности и адекватности.

Все параметры должны выполняться одновременно. Несоответствие одному из критериев означает отсутствие модели как таковой.


Точность

оценивается по значениям коэффициента корреляции

r

, коэффициента детерминации

r

2

и стандартной ошибки

SE

.


Критерий
Критическое значение
Расчетное значение
Вывод о точности модели

r


> 0,7
0,847

+


r2


> 0,5
0,719

+


SE


< 30%

+


Надежность

модели оценивается по значениям

F

– для модели в целом и значениям

t, p и доверительного интервала –

для независимой переменной

Х

.


Критерий
Критическое значение
Расчетное значение
Вывод о надежности модели
для модели

F


F

>

F

табличн


20,47

+


Значимость F


> 0,05
0,0018

+


Для независимой переменной

Х


t


t > 2


4,524

+


p


p < 0,05


0,019

+


доверительный интервал


0 отсутствует
5,289 – 16,283

+


Адекватность

модели оценивается по коэффициенту автокорреляции.

Критерий
Критическое значение
Расчетное значение
Вывод о точности модели

r


< 0,3
0,164

+




^ ВЫВОД ОСТАТКА









Наблюдение
Предсказанное Y
Остатки

Автокорреляция


1
1270,383938
-20,3839

0,164647


2
1410,611782
-30,6118


3
1507,692598
-82,6926


4
1410,611782
14,38822


5
1345,891239
104,1088


6
1324,317724
-24,3177


7
1496,905841
-96,9058


8
1486,119084
23,88092


9
1518,479355
56,52064


10
1593,986657
56,01334


Вывод:
Уравнение , описывающее зависимость двух переменных отвечает требованиям точности, надежности и адекватности и может быть использовано для прогнозирования результатов.
Таким образом, при расходах на рекламу в размере 50 и 80 денежных единиц, прогнозируется объем продаж на уровне 1367 и 1690 соответственно.Добавить документ в свой блог или на сайт Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат
Реферат