Файл: Модели с лаговыми переменными.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.01.2024

Просмотров: 106

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Модели с лаговыми переменными
В случае, когда объясняемая (зависимая) переменная связана не только со значениями объясняющих (независимых) переменных в текущий момент времени, но и со значениями объясняющих и самой объясняемой переменной в предыдущие моменты времени, строятся модели с запаздыванием, или модели с лаговыми переменными.
Объясняющие и объясняемая переменные с запаздыванием называются
лаговыми переменными. Величина запаздывания – лагом.
Модели регрессии по временным рядам с лаговыми переменными принято называть динамическими моделями. Их можно разделить на три класса.
1. Модели, включающие лаговые объясняющие переменные – модели с распределенным лагом,
2. Модели, включающие лаговые объясняемые переменные – модели авторегрессии.
3. Модели, включающие лаговые как объясняющие так и объясняемые переменные – авторегрессионные модели с распределенным лагом.
Основной вопрос при построении динамических моделей – выбор величины лага и количества лаговых переменных.
Для решения поставленного вопроса строится корреляционная функция. В модель можно включить переменные с величиной лагов, соответствующими порядку всех значимых коэффициентов автокорреляции, любо переменную с лагом, соответствующим максимальному по модулю значимому коэффициенту автокорреляции.
При оценке параметров динамических моделей нельзя применять классический метод наименьших квадратов в силу мультиколлинеарности значений объясняющих переменных.
Оценка параметров моделей с распределенными лагами.
Рассмотри модель с конечным числом лагов
t
p
i
i
t
i
t
t
x
x
y











1 0
Для оценки параметров модели применяется метод Алмон (предложен в 1965г.
Ш.Алмон).
Параметры оцениваются в предположении их полиномиальной зависимости от величины лага









k
j
j
j
k
k
i
i
c
i
c
i
c
i
c
c
b
0 2
2 1
0
. (*)
После подстановки представления
i
b
в исходную модель и ее преобразования

 

 









































k
j
j
j
k
j
j
p
i
j
i
t
p
i
i
t
p
i
i
t
k
j
j
j
t
p
i
i
t
i
t
t
z
c
z
c
a
c
i
x
x
c
a
x
i
c
x
c
a
x
b
x
b
a
y
1 0
0 1
1 0
0 1
0 0
1 0
получаем модель с новыми переменными
j
z
, представляющими собой линейную комбинацию исходных переменных. В матричном виде модель принимает вид





















k
k
k
p
p
p
H
Zc
XHc
Y
3 1
9 3
1 2
1 0
4 2
1 1
1 1
0 0
1
,
2
где
Н – матрица весов при лаговых коэффициентах
i
с
;
с – вектор коэффициентов при переменных
j
z
,
XH
Z

Далее оценка вектора осуществляется по методу наименьших квадратов
Y
Z
Z
Z
c
T
T



1
)
(
. Оценка параметров
i
b осуществляется по формулам (*).
Оценка моделей с бесконечным числом распределенных лагов.
Для оценки параметров модели вида
t
i
i
t
i
t
t
x
x
y












1 0
предполагается, что коэффициенты
i
b
представляют собой убывающую геометрическую прогрессия со знаменателем

и первым членом
0
b
, т.е.
i
i
b
b



0
Рассмотрим модель


t
i
i
t
i
t
t
x
x
y













1 0
0
(**) тогда
t
i
i
t
i
t
t
x
x
y
















1 1
0 1
0 1
(***)
Умножим последнее уравнение (***) на

:
t
i
i
t
i
t
i
i
t
i
t
t
x
x
x
y





























1 0
1
)
1
(
1 0
1 0
1
и вычтем почленно из уравнения (**), получим
)
1
(
)
1
(
0 1













t
t
t
t
x
y
y
или
t
t
t
t
x
y
y









0 1
, где
)
1
(





,
)
1
(





t
t
Далее оцениваем параметры полученной модели по методу наименьших квадратов

1
А.А. Марчук
Русская Служба Оценки (
www.rusvs.ru
)
Учет качественных параметров в регрессионном анализе
Применение статистики в оценке имущества является одной из наиболее «модных» тем в оценочном сообществе. Статистические процедуры, давно известные математикам и специалистам по эконометрике, могут быть полезны оценщику, позволяя сделать расчеты более надежными и обоснованными. Развитие информационной открытости рынков, унификация баз данных, давно обсуждаемый доступ оценщиков к данным регистрирующих органов и т.п., безусловно, потребуют от оценщиков применение самых современных способов обработки и интерпретации информации.
Одним из наиболее эффективных и полезных для оценщика статистических инструментов является регрессионный анализ. Регрессионный анализ позволяет выявить ценообразующие факторы и определить вид зависимости. Но при применении данного инструмента оценщики сталкиваются с целым рядом проблем (недостаточное число аналогов, недоступность информации по объектам- аналогам, волатильность рынков и другие). Эта статья посвящена проблеме учета качественных параметров при построении регрессионных зависимостей.
Параметры, описывающие характеристики того или иного объекта оценки, можно разделить на два типа: количественные и качественные. Количественные параметры – параметры, значения которых выражаются числом. Примерами таких параметров могут выступать, например, площадь объекта, мощность двигателя, выручка компании и т.п.
Но описать полностью тот или иной объект только количественными параметрами удается далеко не всегда. Существенная часть характеристик оцениваемых объектов носит качественный характер, т.е. описываются качественными параметрами. Значение качественной переменной выражается текстовым описанием, рисунком или каким-либо другим поясняющим его смысл способом. Измерить качественные параметры при помощи числовой шкалы невозможно. Примерами таких переменных могут выступать класс объекта, материал изготовления, тип привода, район расположения объекта и т.п.
Учет качественных параметров при регрессионном анализе возможен различными способами.
Наиболее простое решение – построение индивидуальных моделей для каждого значения (градации) качественного параметра. На первый взгляд такое решение является крайне эффективным – чем меньше параметров учитывается в модели, тем проще решение задачи. Но, на самом деле, такое решение далеко не всегда самое лучшее. Представьте, что для оценки объекта необходимо будет подобрать аналоги, удовлетворяющие следующим критериям: однокомнатные квартиры, расположенные на первом этаже в домах типа «хрущевка» в определенном районе города, внутри жилого квартала и с отделкой определенного уровня. Даже на развитом рынке (например, рынок жилья городов-миллионников) поиск аналогов, удовлетворяющих столь жестким требованиям, скорей всего, не увенчается успехом. Кроме того, с уменьшением количества аналогов надежность оценок коэффициентов модели существенно снижается, а погрешность полученной модели, соответственно, возрастает.
Альтернативным вариантом является учет качественных параметров в модели, для чего используются фиктивные переменные (в литературе также встречается термин «переменные – манекены»). Данный способ является более эффективным, т.к. появляется возможность оценить статистическую значимость влияния данного фактора на зависимую переменную на фоне других параметров, включенных в модель, и повысить надежность модели за счет включения большего количества аналогов.
Фиктивная переменная (dummy variable) — в эконометрике переменная модели, полученная путем преобразования (напр., с помощью балльных оценок) информации, содержащей качественные и другие не поддающиеся числовой оценке величины. Ф. п. используются как простое средство для включения подобной информации в регрессионный анализ. Напр., добавление Ф. п., принимающей только два значения — 0 и 1 в качестве дополнительной объясняющей переменной, часто используется при анализе сезонных колебаний. [1]


2
Фиктивные переменные подразделяются на переменные сдвига и переменные наклона. Выбор в пользу того или иного типа переменных (или их комбинаций) является «содержательной» задачей и зависит от характера используемых в модели параметров. Далее продемонстрированы особенности данных видов переменных на нескольких примерах.
1. Переменные сдвига
1.1. Пример №1: модель с одной фиктивной переменной.
Рассмотрим самый простой случай регрессии – учтем в модели только одну, качественную переменную. Данный пример является упрощенным вариантом применения регрессионного анализа и предназначен для демонстрации сути фиктивных переменных.
В нижеследующей таблице представлены данные по ценам предложения однокомнатных квартир одного типа (панельные 5-ти этажные дома), расположенные в центральном районе г. Архангельска
1
Табл. 1. Информация об аналогах для Примера №1
№,
п./п.
Дата
Кол-во
комнат
Район
Этаж
Этаж-
ность
Площадь
общая,
кв. м
Жилая
площадь,
кв. м
Кухня,
кв. м
Тип
дома
Удельная
цена,
руб./кв. м
«Сред-
ний
этаж»
1
2
3
4
5
6
7
8
9
10
11
12
1 20.06.09 1
Центр
1 5
31,3 18,2 6 пан.
41 534 0
2 16.05.09 1
Центр
1 5
31 18 6 пан.
41 613 0
3 25.09.09 1
Центр
1 5
31 18 6,5 пан.
41 613 0
4 16.10.09 1
Центр
5 5
31 17,5 6 пан.
41 935 0
5 13.11.09 1
Центр
5 5
30,7 17 5,6 пан.
42 345 0
6 15.08.09 1
Центр
1 5
31 17 5 пан.
42 903 0
7 13.11.09 1
Центр
5 5
31 17,5 5,7 пан.
43 548 0
8 23.10.09 1
Центр
1 5
30 17,5 5,5 пан.
45 000 0
9 20.11.09 1
Центр
5 5
30 18 5,6 пан.
45 000 0
10 16.05.09 1
Центр
1 5
29,3 17,5 6,1 пан.
45 000 0
11 20.11.09 1
Центр
1 5
30 16,4 6,3 пан.
45 000 0
12 02.10.09 1
Центр
1 5
30 18 6 пан.
45 000 0
13 01.08.09 1
Центр
5 5
30,2 17,4 5,4 пан.
45 000 0
14 11.09.09 1
Центр
3 5
32 18 6 пан.
43 750 1
15 19.09.09 1
Центр
3 5
30,5 18,6 5,4 пан.
44 262 1
16 16.10.09 1
Центр
3 5
31 18,5 6 пан.
44 839 1
17 28.08.09 1
Центр
4 5
31 18 5 пан.
45 161 1
18 02.10.09 1
Центр
4 5
31 17 6,7 пан.
45 161 1
19 13.11.09 1
Центр
3 5
30,4 16,6 6,3 пан.
46 053 1
20 09.10.09 1
Центр
2 5
32 17 6 пан.
46 875 1
21 30.10.09 1
Центр
2 5
30 17,1 5,4 пан.
48 333 1
22 19.09.09 1
Центр
2 5
30 17,1 5,4 пан.
49 667 1
23 16.10.09 1
Центр
2 5
30 17 5,6 пан.
50 000 1
24 09.10.09 1
Центр
4 5
31 18 6 пан.
50 000 1
Как видно из таблицы, объекты достаточно однородны по площади, расположены в одном районе.
При этом аналоги №№1…13 расположены на крайних этажах, 14-24 – на средних этажах.
Общеизвестный факт, что квартиры на крайних этажах обычно стоят дешевле аналогичных квартир на средних этажах. Анализ данных, представленных в Табл. 1, это подтверждает – см. Табл. 2.
1
Данные предоставлены Агентством недвижимости «Троицкий Дом» (г. Архангельск, www.3dom.ru
)


3
Табл. 2. Средние значения
Этаж
Показатель
Удельная цена, руб./ кв. м
Крайние этажи
Минимальное значение
41 534
Максимальное значение
45 000
Среднее
43 499
Средние этажи
Минимальное значение
43 750
Максимальное значение
50 000
Среднее
46 736
По всей выборке
Минимальное значение
41 534
Максимальное значение
50 000
Среднее
44 983
Учтем различие «крайний этаж» / «средний этаж» при построении модели, для чего введем фиктивную переменную X
1
(«Средний этаж», см. колонку 12 в Табл. 1), которая будет принимать следующие значения:
X
1
= 1 для квартир, расположенных на средних этажах;
X
1
= 0 для квартир, расположенных на крайних этажах.
Искомая модель будет иметь вид:
Y = a
1
*X
1
+ с
(модель №1)
где:
Y
- удельная стоимость;
X
1
- фиктивная переменная «Средний этаж»; a
1
- коэффициент модели; с
- константа.
Полученные результаты представлены в Табл. 3 (строка №1). Сопоставляя Табл. 2 и Табл. 3 легко заметить, что константа модели «c» равна среднему значению удельной стоимости квартир, расположенных на крайних этажах, а коэффициент при фиктивной переменной «Средний этаж» равен разнице между средними удельными стоимостями квартир на средних и крайних этажах:
a
1
= 46 736 - 43 499 = 3 237
Фактически коэффициент при фиктивной переменной «Средний этаж» отвечает на вопрос:
«На сколько в среднем квартиры на средних этажах дороже квартир на крайних этажах?».
Аналогичную модель можно построить с фиктивной переменной Х
2
(«Крайний этаж»):
Y = a
2
*X
2
+ с
(модель №2)
где:
X
2
- фиктивная переменная «Крайний этаж», принимающая следующие значения:
X
2
= 0 для квартир, расположенных на средних этажах;
X
2
= 1 для квартир, расположенных на крайних этажах.
Результаты расчетов представлены в Табл. 3 (строка №2). Данная модель идентична модели №1, но константа модели равна среднему значению удельной стоимости квартир на средних этажах, а коэффициент при фиктивной переменной «Крайний этаж» отвечает на вопрос:
«На сколько в среднем квартиры на крайних этажах дешевле квартир на средних этажах?».

4
На этих же данных возможно построить еще один вариант модели, куда будут включены обе обозначенные выше фиктивные переменные.
При этом будет наблюдаться полная мультиколлинеарность
2
(параметры X
2
и X
1
связаны выражением X
2
= 1- X
1
), для устранения которой необходимо исключить из спецификации модели константу:
Y=a
1
*X
1
+a
2
*X
2
Результаты также представлены в Табл. 3 (строка №3). Коэффициенты при фиктивных переменных в данной модели равны средним значениям стоимости квартир на средних и крайних этажах соответственно.
Табл. 3. Результаты регрессионного анализа
Модель
a
1
a
2
С
R
2
Модель №1 Y=a
1
*X
1
+c
3 237
(546)

43 499
(806)
0,42
Модель №2 Y=a
2
*X
2
+c

-3 237
(546)
46 736
(806)
0,42
Модель №3 Y=a
1
*X
1
+a
2
*X
2
46 736
(593)
43 499
(546)

0,998
Примечания:
1.
Следует отметить достаточно низкое значение R
2
. Это объясняется тем, что анализируемые квартиры
отличаются не только этажом расположения, но и состоянием, а также местоположением внутри центрального
района города. Задачей этого и последующих примеров является демонстрация сути фиктивных переменных;
2.
В скобках указаны стандартные ошибки для полученных коэффициентов модели;
3.
Для модели без константы (модель №3) вместо коэффициента детерминации R
2
определяется
нецентрированный R
2
. Сопоставление нецентрированного R
2
с коэффициентом детерминации некорректно.

1.2. Пример №2: модель с одной фиктивной и одной количественной
переменными
Пример №1 является достаточно простым случаем. Рассмотрим более сложный вариант.
На графике ниже представлена информация о ценах предложения квартир в г. Архангельске. В данную выборку были включены такие же квартиры, как и в примере №1 (т.е. панельные 5-ти этажные дома, расположенные в одном районе города), но в данном случае отсутствовало ограничение по количеству комнат.
Из графика видно, что в выборку были включены квартиры разной площади: однокомнатные площадью около 30 кв. м, 2-х комнатные площадью 40-48 кв. м и 3-х и 4-х комнатные площадью более 55 кв. м (на графике видно три группы аналогов). Также на графике видно, что квартиры на средних этажах обычно чуть дороже квартир на крайних этажах.
2
Мультиколлинеарность [multicollinearity] — понятие математической статистики — тесная корреляционная взаимосвязь между отбираемыми для анализа факторами, совместно воздействующими на общий результат. Эта связь затрудняет оценивание параметров регрессии в частности, при анализе эконометрической модели. [1]

5
Рис. 1. Информация об аналогах для Примера №2
Попробуем учесть различие в площади объектов и этаже расположения в модели, для чего построим модель вида:
Y=a
1
*X
1
+ a
2
*S + c
Где:
S
- общая площадь квартиры;
X
1
- фиктивная переменная средний этаж.
Результаты анализа представлены в нижеследующей таблице (формат таблицы соответствует результатам действия надстройки «Регрессия» из «Пакета анализа» MS Excel).
Табл. 4. Результаты регрессионного анализа
Регрессионная статистика
Множественный R
0,825
R-квадрат
0,681
Нормированный R-квадрат
0,676
Стандартная ошибка
2 600
Наблюдения
146
Дисперсионный анализ
df
SS
MS
F
Значимость
F
Регрессия
2 2 062 718 366 1 031 359 183 153 0,00000
Остаток
143 966 582 616 6 759 319
Итого
145 3 029 300 983
Коэффициенты
Стандартная
ошибка
t-
статистика
P-
Значение
Нижние 95%
Верхние
95%
Y-пересечение
53 795 1 016 53 0,00000 51 787 55 803
Средний этаж
2 859 440 6
0,00000 1 989 3 729
Общая площадь, кв. м
-363 21
-17 0,00000
-405
-321 25 000 30 000 35 000 40 000 45 000 50 000 55 000 25 30 35 40 45 50 55 60 65 70
Уд
е
л
ьн
ая
с
то
и
м
о
ст
ь,
р
уб
./
кв
. м
Площадь квартиры, кв. м
Крайние этажи
Средние этажи