БИНАРНЫЕ (ФИКТИВНЫЕ) ПЕРЕМЕННЫЕ
522.00K
Категория: МатематикаМатематика

Бинарные (фиктивные) переменные

1. БИНАРНЫЕ (ФИКТИВНЫЕ) ПЕРЕМЕННЫЕ

Иногда в регрессионных моделях требуется учесть качественные факторы.
Например, исследуется зависимость цены квартиры от ряда факторов.
На стоимость квартиры могут повлиять количественные факторы:
общая площадь, площадь кухни и т.д. и качественные факторы:
средний или крайний этаж, первичное или вторичное жилье, тип дома
(хрущевка, брежневка, улучшенной планировки) и т.д.
Оценить влияние качественных факторов в регрессионных моделях можно с
помощью фиктивных (бинарных) переменных.

2.

Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice b1 S b2 Floor b3
Floor=0, если этаж крайний
Floor=1, если этаж средний

3.

5. Фиктивные переменные в нелинейных моделях
Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice b1 S b2 Floor b3
Floor=0, если этаж крайний
b2
Floor=1, если этаж средний
показывает на сколько в среднем цена квартиры на средних этажах
выше цены квартиры на крайних этажах (при той же площади)

4.

Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice b1 S b2 Floor b3
Floor=0, если этаж крайний
b2
Floor=1, если этаж средний
показывает на сколько в среднем цена квартиры на средних этажах
выше цены квартиры на крайних этажах (при той же площади)
Незначимость переменной b2 означает, что этаж не влияет на цену

5.

Фиктивные переменные в нелинейных моделях
Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice S e
b1
Floor=1, если этаж крайний
b2 Floor
b3
Floor=0, если этаж средний

6.

Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice S e
b1
Floor=1, если этаж крайний
b2 Floor
b3
Floor=0, если этаж средний
Для оценки модель логарифмируется
ln(Pr ice) b1 ln( S ) b2 Floor ln(b3 )

7.

Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice S e
b1
Floor=1, если этаж крайний
eb2
b2 Floor
b3
Floor=0, если этаж средний
показывает во сколько раз в среднем цена квартиры на средних этажах
выше цены квартиры на крайних этажах (при той же площади)

8.

Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice S
0.01
Floor=1, если этаж крайний
e
0.12 Floor
b3
Floor=0, если этаж средний
Квартиры на средних этажах в среднем в
e0.12 1.127
раз
дороже, чем квартиры на крайних этажах (при той же площади)
(иными словами, на 12,7%)

9.

Пример: исследуется зависимость цены квартиры от ее площади и того,
является ли этаж, на котором расположена квартира крайним или средним
Pr ice S
0.01
Floor=1, если этаж крайний
e
0.12 Floor
b3
Floor=0, если этаж средний
Квартиры на средних этажах в среднем в
e0.12 1.127
раз
дороже, чем квартиры на крайних этажах (при той же площади)
(иными словами, на 12,7%)

10.

Имеются данные по однокомнатным квартирам, выставлявшимся
на продажу в Москве:
Region
район;
Distc
удаленность от центра, км.;
Distm
удаленность от метро, мин.;
Totsq
общий метраж, кв.м.;
Kitsq
площадь кухни, кв.м.;
Livsq
площадь комнаты, кв.м.;
Floor
этаж (0,1) 0 – первый или последний, 1 – средний;
Cat
категория дома (0,1), 1 – кирпичный, 0 – панельный;
Price
цена, тыс. USD.

11.

Линейная модель

12.

Линейная модель
Price=-4.06-0.37distc-0.17distm+0.98totsq+1.21kitsq-0.07livsq+4.69floor+8.30cat

13.

Линейная модель
Price=-4.06-0.37distc-0.17distm+0.98totsq+1.21kitsq-0.07livsq+4.69floor+8.30cat

14.

Линейная модель после исключения незначимых факторов
Price=-10.11+0.94totsq+1.20kitsq+4.87floor+10.15cat

15.

Линейная модель после исключения незначимых факторов
Price=-10.11+0.94totsq+1.20kitsq+4.87floor+10.15cat
76% вариации цены квартир объясняется факторами, включенными в модель
Модель значима.

16.

Степенная модель
Pr ice a0 ( Distc) a1 ( Distm) a2 (Totsq ) a3 ( Kitsq ) a4 ( Livsq) a5 e a6 Floore a7 Cat

17.

Степенная модель
Pr ice a0 ( Distc) a1 ( Distm) a2 (Totsq ) a3 ( Kitsq ) a4 ( Livsq) a5 e a6 Floore a7 Cat
Логарифмируем
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat

18.

Степенная модель
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat

19.

Степенная модель
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat

20.

Степенная модель
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat

21.

Степенная модель
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
Ln(Price)=0.092+0.34ln(totsq)+0.11ln(kitsq)+0.053floor+0.1cat

22.

Степенная модель
ln(Pr ice) ln(a0 ) a1 ln( Distc) a2 ln( Distm) a3 ln(Totsq)
a4 ln( Kitsq) a5 ln( Livsq) a6 Floor a7Cat
Pr ice a0 ( Distc) ( Distm) (Totsq ) ( Kitsq ) ( Livsq) e
a1
a3
a2
a4
a5
a6 Floor a 7 Cat
e
Ln(Price)=0.092+0.34ln(totsq)+0.11ln(kitsq)+0.053floor+0.1cat
Ln(a0)=0.092,
a0=exp(0.092)=1.097
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e

23.

Степенная модель
Pr ice 1.097(Totsq)
0.34
( Kitsq)
Квартиры на средних этажах стоят в
e
0.053
0.11 0.053 Floor 0.1Cat
e
e
1.054
раз дороже, чем квартиры с теми же характеристиками на средних этажах
Иными словами, квартиры на средних этаж в среднем на 5.4% дороже, чем
квартиры на крайних этажах с теми же характеристиками

24.

Степенная модель
Pr ice 1.097(Totsq)
0.34
( Kitsq)
Квартиры в кирпичном доме стоят в
e
0.1
0.11 0.053 Floor 0.1Cat
e
e
1.11
раз дороже, чем квартиры с теми же характеристиками в панельных домах
Иными словами, квартиры в кирпичных домах в среднем на 11% дороже, чем
квартиры в панельных домах с теми же характеристиками

25.

Степенная модель
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
74% вариации цены квартир объясняется факторами, включенными в модель
Модель значима.

26.

Выбор лучшей модели
1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e

27.

Выбор лучшей модели
1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e

28.

Выбор лучшей модели
1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e

29.

Выбор лучшей модели
1) Коэффициент детерминации
2) Средняя ошибка аппроксимации
Pr ice 1.097(Totsq)
0.34
( Kitsq)
0.11 0.053 Floor 0.1Cat
e
e
Используя выбранную модель, осуществите прогноз цены
однокомнатной квартиры, находящейся на расстоянии 10 км от
центра, 5 мин. ходьбы до метро, общей площадью 35 кв.м,
площадью кухни 8 кв.м, жилой площадью 33 кв.м, расположенной на
1-м этаже кирпичного дома.
English     Русский Правила