ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 24.10.2023

Просмотров: 322

Скачиваний: 6

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Контрольные вопросы по главе 3
59
ˆ 0 < DW < d
L
— наблюдается положительная автокорреляция остатков, H
0
от- клоняется, с вероятностью P = 1 − α принимается H
1
;
ˆ d
L

DW d
U
— зона неопределенности;
ˆ d
U
<
DW < 4 − d
U
— нет оснований отклонять H
0
, т. е. автокорреляция остат- ков отсутствует;
ˆ 4 − d
U

DW ⩽ 4 − d
L
— зона неопределенности;
ˆ 4 − d
L
<
DW < 4 — наблюдается отрицательная автокорреляция остатков, H
0
отклоняется, с вероятностью P = 1 − α принимается H
*
1
Рис. 3.4 – Схема применения критерия Дарбина—Уотсона
Если фактическое значение критерия Дарбина—Уотсона попадает в зону неоп- ределенности, то на практике либо предполагают существование автокорреляции остатков и отклоняют гипотезу H
0
, либо проводят дополнительные исследования,
например по большему числу наблюдений.
Контрольные вопросы по главе 3 1. В чем суть гетероскедастичности?
2. Каковы последствия автокорреляции и гетероскедастичности остатков?
3. В чем суть обобщенного МНК (ОМНК)?
4. Приведите схему теста Голдфелда—Квандта.
5. Приведите схему теста Парка.
6. Приведите схему теста Спирмена.
7. Опишите алгоритм выявления автокорреляции остатков с использованием критерия Дарбина—Уотсона.

Глава 4
РЕГРЕССИОННЫЕ МОДЕЛИ
С ПЕРЕМЕННОЙ СТРУКТУРОЙ
4.1 Понятие фиктивных переменных
Экономические величины складываются под влиянием множества различных факторов, как количественных, так и качественных по своей природе. Это могут быть разного рода атрибутивные признаки, такие, например, как профессия, пол,
образование и пр., а также факторы, оказывающие косвенное воздействие (во вре- мени и/или пространстве) на изучаемый процесс, что приводит к неоднородной выборке рассматриваемых показателей. Иногда представляет интерес включение этих факторов в эконометрическую модель и исследование их влияния на изучае- мую зависимость. Например, влияние пола или образования на уровень заработной платы или влияние дефолта на величину основных макроэкономических показателей.
Возможным решением было бы разбить имеющиеся исходные статистические данные на заведомо однородные группы и строить модели для каждой однородной выборки с последующим выяснением различия в моделях. Например, построить модели зависимости заработной платы от стажа отдельно для мужчин и женщин или изучать поведение макроэкономических показателей отдельно на временном интервале до дефолта и после.
Другой возможный подход состоит в построении и оценивании одной модели для всей совокупности наблюдений и измерении влияния качественного факто- ра, явившегося причиной появления неоднородной выборки. Чтобы ввести каче- ственные факторы в регрессионную модель, им должны быть присвоены те или иные цифровые метки, т. е. качественные переменные преобразованы в количе- ственные. Такого вида сконструированные переменные в эконометрике принято называть фиктивными переменными или дамми-переменными.
Построение модели с фиктивными переменными обладает следующими пре- имуществами:


4.2 Модели регрессии с фиктивными переменными сдвига
61
ˆ имеется простой способ проверки, является ли воздействие качественного фактора значимым (путем проверки на статистическую значимость коэф- фициента перед фиктивной переменной);
ˆ при условии выполнения определенных предположений оценки модели оказываются более эффективными (вследствие большей выборки).
Регрессионные модели могут содержать одновременно как количественные,
так и качественные переменные, и даже только качественные. В эконометрике рас- сматриваются различные варианты моделей регрессии с фиктивными переменными.
4.2 Модели регрессии с фиктивными переменными сдвига
Рассмотрим применение фиктивных переменных для функции спроса. Пред- положим, что по группе лиц мужского и женского пола изучается линейная зави- симость потребления кофе от цены [1]. В общем виде для общей совокупности наблюдений уравнение регрессии имеет вид:
y = a + b x + ε,
где y — количество потребляемого кофе; x — цена.
Аналогичные уравнения могут быть найдены, если рассматривать отдельно по- требление кофе для категории «лица мужского пола»: y
1
=
a
1
+b
1
x
1

1
и категории
«лица женского пола»: y
2
=
a
2
+ b
2
x
2
+ ε
2
Различия в потреблении кофе проявятся в различии средних y
1
и y
2
. Вместе с тем сила влияния x на y может быть одинаковой, т. е. b b
1

b
2
. Для построения общего уравнения регрессии, учитывающего различия в потреблении кофе мужчи- нами и женщинами, возможно включение в него фактора «пол» в виде фиктивной переменной:
y = a + bx + δ ⋅ z + ε.
В этом случае зависимая переменная y рассматривается как функция не толь- ко цены x, но и пола z. Переменная z рассматривается как бинарная переменная,
принимающая всего два значения: 1 и 0.
z =
⎧⎪⎪
⎨⎪⎪

1 — мyжcкoй пoл,
0 — жeнcкий пoл.
Тогда уравнение для лиц женского пола можно записать:
̂y = a + bx, а для лиц мужского пола:
̂y = (a + δ) + bx.
Сравнивая два полученных уравнения, видим, что они различаются величи- ной свободного члена. То есть для одного уровня неколичественной переменной уровень результата в среднем будет на
δ единиц выше или ниже другого. Иными словами
δ показывает сдвиг в потреблении кофе мужчинами по сравнению с жен- щинами (рис. 4.1).
Если рассмотреть зависимость потребления кофе не только от цены, но и от ре- гиона проживания: северные регионы, центральные и южные, то в этом случае


62
Глава 4. Регрессионные модели с переменной структурой
все данные разбиваются на три категории. В модель вводятся две фиктивные пе- ременные z
1
и z
2
:
z
1
=
⎧⎪⎪
⎨⎪⎪

1 — пpoживaниe в одном из ceвepных peгиoнов,
0 — в ocтaльныx peгиoнax;
z
2
=
⎧⎪⎪
⎨⎪⎪

1 — пpoживaниe в одном из южных peгиoнов,
0 — в ocтaльныx peгиoнax.
Рис. 4.1 – Модель регрессии с фиктивной переменной сдвига
δ
Значение z
1
=
0 и z
2
=
0 принимается за эталонное и определяет среднее значе- ние потребления кофе проживающих в одном из центральных регионов.
Линейная регрессионная модель в этом случае определяется следующим урав- нением:
̂y = a + bx + δ
1
z
1
+ δ
2
z
2
,
где коэффициенты
δ
1
и
δ
2
показывают сдвиг в объеме потребления кофе в соответ- ствующих регионах по отношению к потреблению кофе в центральных регионах.
Таким образом, построение модели с фиктивными переменными требует вы- полнения следующих этапов:
1) статистические данные разбиваются на категории, число которых опреде- ляется числом значений качественного признака. Одна из категорий при- нимается за эталонную (выбирается произвольно);
2) вводятся фиктивные переменные для всех категорий, кроме эталонной.
Каждая из введенных фиктивных переменных принимает значение, рав- ное единице для данных рассматриваемой категории и нуль для данных остальных категорий;
3) фиктивные переменные вводятся в уравнение с коэффициентом
δ
i
, i =
=
1, k − 1, где k — число категорий. Каждый из коэффициентов δ
i
характери- зует сдвиг значения результативного показателя для данных i-ой категории относительно эталонной. Если
δ
i
оказывается статистически значимым, то фактор (событие), выражаемый этой фиктивной переменной, оказывает су- щественное влияние на результативный показатель.

4.2 Модели регрессии с фиктивными переменными сдвига
63
Модель может содержать несколько качественных признаков. В этом случае фиктивные переменные для каждого признака вводятся в соответствии с выше- приведенной методикой.
Пример 4.1
Предположим, что изучается потребление кофе в зависимости от цены, пола и региона проживания: северные регионы, центральные и южные (табл. 4.1).
Таблица 4.1 – Данные к примеру 4.1
N
По
т
реб
ление
(кг)
Цена
(тыс.
р
у
б.)
По
л
Cеверные
регионы
Ю
жные
регионы
N
По
т
реб
ление
(кг)
Цена
(тыс.
р
у
б.)
По
л
Cеверные
регионы
Ю
жные
регионы
Y
x
z
z
1
z
2
Y
x
z
z
1
z
2 1
0,2 1
1 0
0 16 0,6 0,6 0
1 0
2 0,4 1
0 0
0 17 0,6 0,5 0
1 0
3 0,4 0,8 1
0 0
18 0,65 0,5 1
1 0
4 0,6 0,8 0
0 0
19 0,6 0,3 1
1 0
5 0,6 0,6 1
0 0
20 0,7 0,3 0
1 0
6 0,8 0,6 0
0 0
21 0,5 1
1 0
1 7
0,75 0,5 0
0 0
22 0,6 1
0 0
1 8
0,9 0,5 1
0 0
23 0,7 0,8 1
0 1
9 0,9 0,3 1
0 0
24 0,9 0,8 0
0 1
10 1,1 0,3 0
0 0
25 0,9 0,6 1
0 1
11 0,2 1
1 1
0 26 1,1 0,6 0
0 1
12 0,45 1
0 1
0 27 1
0,5 0
0 1
13 0,45 0,8 1
1 0
28 1,2 0,5 1
0 1
14 0,6 0,8 0
1 0
29 1,2 0,3 1
0 1
15 0,5 0,6 1
1 0
30 1,4 0,3 0
0 1
Вводим фиктивную бинарную переменную z для признака «пол» и две бинар- ные переменные z
1
и z
2
для регионов проживания.
Линейная регрессионная модель запишется:
̂y = a + bx + δ ⋅ z + δ
1
z
1
+ δ
2
z
2
.
Коэффициент
δ показывает сдвиг в потреблении кофе мужчинами относитель- но женщин, а коэффициенты
δ
1
и
δ
2
соответственно показывают сдвиг в объеме потребления кофе в северных и южных регионах относительно центральных реги- онов. После вычисления коэффициентов уравнение регрессии имеет вид:
̂y = 1,26 − 0,84x − 0,11z − 0,13z
1
+ 0,29z
2
.


64
1   ...   5   6   7   8   9   10   11   12   13

Глава 4. Регрессионные модели с переменной структурой
Коэффициент детерминации R
2
=
0,88, что говорит о хорошем качестве модели.
Статистическая значимость модели в целом подтверждается значением критерия
Фишера F = 47,951 > F
тaбл
=
2,76.
Оценка значимости коэффициентов регрессии выполняется на основе анализа следующих величин (табл. 4.2).
Таблица 4.2 – Оценка значимости коэффициентов регрессии
Значения
коэффициентов
Стандартная
ошибка
Значения
t-статистики
a
1,26 0,07 19,26
b
−0,84 0,08
−10,30
δ
−0,11 0,04
−2,88
δ
1
−0,13 0,05
−2,70
δ
2 0,29 0,05 5,91
Так как расчетные значения t-статистики для всех коэффициентов по модулю превышают табличное значение t
0,05, 10
=
2,228, то они статистически значимы. Сле- довательно, потребление кофе существенно зависит от цены, пола и проживания в определенном регионе.
Можно построить отдельные уравнения для мужчин и женщин каждого реги- она (табл. 4.3).
Таблица 4.3 – Уравнения регрессии
Тип категории
Уравнение
Женщины (северные регионы)
̂Y = 1,13
− 0,84x
Мужчины (северные регионы)
̂Y = 1,02
− 0,84x
Женщины (центральные регионы)
̂Y = 1,26
− 0,84x
Мужчины (центральные регионы)
̂Y = 1,15
− 0,84x
Женщины (южные регионы)
̂Y = 1,55
− 0,84x
Мужчины (южные регионы)
̂Y = 1,44
− 0,84x
В этих уравнениях различны только свободные члены, угол наклона всех пря- мых одинаков (одинаковый коэффициент перед переменной «цена»).
4.3 Модели регрессии с фиктивными переменными наклона
Модели регрессии с фиктивными переменными наклона отражают зависи- мость количественного фактора от значения фиктивной переменной [1]. Это может быть представлено следующими выражениями:
̂y = a + b
1
x, если z = 0;
̂y = a + b
2
x, если z = 1;
b
1

b
2
.

4.4 Общий вид модели регрессии с фиктивными переменными
65
В таком случае говорят, что имеют место структурные изменения в исследу- емой зависимости. Для их учета в уравнение регрессии вводят фиктивную пере- менную z как сомножитель при количественной переменной:
̂y = a + b x + δ ⋅ x z.
Тогда для значения фиктивной переменной z = 0 уравнение запишется:
̂y = a + b x.
А для значения фиктивной переменной z = 1:
̂y = a + (b + δ) ⋅ x.
Следовательно, коэффициент b
2
будет равен
(b + δ). Графически эта модель может быть представлена в виде двух прямых разным углом наклона (рис. 4.2).
Рис. 4.2 – Модель регрессии с фиктивной переменной наклона
4.4 Общий вид модели регрессии с фиктивными переменными
Общий вид модели с фиктивными переменными объединяет модель с фик- тивными переменными наклона и модель с фиктивными переменными сдвига.
Рассмотрим в качестве примера зависимость изменения заработной платы y от стажа x и пола.
Можно предположить, что фактор «пол» будет оказывать влияние не только на разницу в заработной плате мужчин и женщин, но и скорость ее изменения
(наклон линии регрессии). Чтобы учесть этот факт, вводим фиктивную бинарную переменную z для признака «пол»:
z =
⎧⎪⎪
⎨⎪⎪

0 — мyжчины,
1 — жeнщины,
а также переменную для коэффициента наклона —
(z x).