Файл: Контрольная работа по дисциплине эконметрика Студент (Ф. И. О.) Толибова Фотиманисо Мухторкизи Группа кэ12.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 26.10.2023
Просмотров: 49
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
МИНИСТЕРСТВО ВЫСШЕГО И СРЕДНЕГО СПЕЦИАЛЬНОГО
ОБРАЗОВАНИЯ РЕСПУБЛИКИ УЗБЕКИСТАН
СОВЕСТНАЫ МЕЖДУНАРОДНАЯ
ОБРАЗОВАТЕЛЬНАЯ ПРОГРАММА
КОНТРОЛЬНАЯ РАБОТА
ПО ДИСЦИПЛИНЕ
Эконметрика
Студент (Ф.И.О.) Толибова Фотиманисо Мухтор-кизи
Группа: КЭ-12
1. Корректное формирование модели регрессии.
Статистическая функция ЛИНЕЙН определяет параметры линейной регрессии у=ах+b. Порядок вычисления следующий:
1) введите исходные данные или откройте существующий файл, содержащий анализируемые данные;
2) выделите область пустых ячеек 52 (5 строк, 2 столбца) длявывода результатов регрессионной статистики или область 12 – для получения только оценок коэффициентов регрессии;
3) активизируйте Мастер функций любым из способов:
а) в главном меню выберите Вставка/Функция;
б) на панели инструментов Стандартная щелкните по кнопке Вставка функции;
4) в окне Категория выберите Статистические, в окне Функция – ЛИНЕЙН. Щелкните по кнопке ОК;
5) заполните аргументы функции:
Известные_значения_у – диапазон, содержащий данные результативного признака;
Известные_значения_х – диапазон, содержащий данные факторов независимого признака;
Константа - логическое значение, которое указывает на наличие или на отсутствие свободного члена в уравнении; если Константа = 1, то свободный член рассчитывается обычным образом, если Константа = 0, то свободный член равен 0;
Статистика – логическое значение, которое указывает, выводить дополнительную информацию по регрессионному анализу или нет. Если Статистика = 1, то дополнительная информация выводится, если Статистика = 0, то выводятся только оценки параметров уравнения.
Щелкните по кнопке ОК;
6) в левой верхней ячейке выделенной области появится первый элемент итоговой таблицы. Чтобы раскрыть всю таблицу, нажмите клавишу
Регрессионная статистика представляется в выделенной области в следующем порядке:
Значение коэффициента a | Значение коэффициента b |
Среднеквадратическое отклонение a | Среднеквадратическое отклонение b |
Коэффициент детерминации R2 | Среднеквадратическое отклонение y |
F-статистика | Число степеней свободы |
Регрессионная сумма квадратов | Остаточная сумма квадратов |
2.5.2. Многофакторная регрессия.
Построение линейной многофакторной модели производится с помощью инструментов пакета анализа данных Корреляция и Регрессия. Корреляция используется для расчета матрицы парных коэффициентов корреляции. С помощью Регрессии, помимо результатов регрессионной статистики, дисперсионного анализа и доверительных интервалов, можно получить остатки и графики подбора линии регрессии, остатков и нормальной вероятности. Порядок действий следующий:
-
проверьте доступ к пакету анализа. В главном меню последовательно выберите Сервис/Надстройки. Установите флажок Пакет анализа; -
введите исходные данные или откройте существующий файл, содержащий анализируемые данные; -
в главном меню выберите пункты Сервис/Анализ данных/ Корреляция; -
заполните диалоговое окно входных данных и параметров вывода:
Входной интервал – диапазон, содержащий анализируемые данные (все столбцы или строки);
Группирование – по столбцам или по строкам;
Метки – флажок, который указывает, содержит ли первая строка названия столбцов или нет;
Выходной интервал – достаточно указать левую верхнюю ячейку диапазона;
-
результаты вычислений – матрица парных коэффициентов корреляции, анализ которых позволяет выполнить первый этап процесса моделирования, описанный в 2.4; -
в главном меню выберите пункты Сервис/Анализ данных/ Регрессия; -
заполните диалоговое окно входных данных и параметров вывода как в пункте 4, только интервал для результативного признака Y и для факторов Х надо задавать отдельно (причем входной интервал Х должен включать все столбцы, содержащие значения факторных признаков); -
в результате получаем регрессионную статистику, таблицу дисперсионного анализа и таблицу коэффициентов модели, в которой первая строка (Y-пересечение) соответствует коэффициенту а0, а следующие строки описывают коэффициенты регрессии аi.
-
Линейные регрессионные модели с гетероскедастичными и автокоррелированными остатками.
Итак, при исследовании остатков i должно проверяться наличие следующих пяти предпосылок МНК:
-
случайный характер остатков; -
нулевая средняя величина остатков, не зависящая от хi; -
гомоскедастичность – дисперсия каждого отклоненияiодинакова для всех значенийхi; -
отсутствие автокорреляции остатков – значения остатковiраспределены независимо друг от друга; -
остатки подчиняются нормальному распределению.
Если распределение случайных остатков iне соответствует некоторым предпосылкам МНК, то следует корректировать модель.
В случае нарушения первых двух предпосылок необходимо либо применять другую функцию, либо вводить дополнительную информацию и заново строить уравнение регрессии.
Пятая предпосылка о нормальном распределении остатков позволяет проводить проверку параметров регрессии и корреляции с помощью критериев t,F. Однако и при нарушении пятой предпосылки МНК оценки регрессии обладают достаточной состоятельностью.
Совершенно необходимым для получения по МНК состоятельных оценок параметров регрессии является соблюдение третьей и четвертой предпосылок.
Если не соблюдается гомоскедастичность, то имеет место гетероскедастичность. Наличие гетероскедастичности может привести к смещенности оценок коэффициентов регрессии, а также к уменьшению их эффективности. В этом случае рекомендуется применятьобобщенный метод наименьших квадратов, который заключается в том, что при минимизации суммы квадратов отклонений (5) отдельные ее слагаемые взвешиваются: наблюдениям с большей дисперсией придается пропорционально меньший вес. Чтобы убедиться в гетероскедастичности остатков и, следовательно, в необходимости использования обобщенного МНК, обычно не ограничиваются визуальной проверкой гетероскедастичности, а проводят ее эмпирическое подтверждение, в частности, используют метод Гольдфельда – Квандта. Проиллюстрируем его на примере (табл.7).
Таблица 7.
Поступления налогов в бюджет (yi– млн.руб.) в зависимости
от численности работающих (хi– тыс.чел).
№ п/п | хi | yi | ŷх | i |
1 | 2 | 3 | 4 | 5 |
1 | 3 | 4,4 | -1,0 | 5,4 |
2 | 6 | 8,1 | 2,5 | 5,6 |
3 | 8 | 12,9 | 4,9 | 8,0 |
4 | 18 | 20,8 | 16,6 | 4,2 |
5 | 20 | 15,5 | 19,0 | -3,5 |
6 | 23 | 28,8 | 22,5 | 6,3 |
7 | 39 | 37,5 | 41,4 | -3,9 |
8 | 49 | 48,7 | 53,2 | -4,5 |
9 | 60 | 68,6 | 66,1 | 2,5 |
10 | 74 | 104,6 | 82,6 | 22,0 |
11 | 79 | 90,5 | 88,5 | 2,0 |
12 | 95 | 88,3 | 107,4 | -19,1 |
13 | 106 | 132,4 | 120,4 | 12,0 |
14 | 112 | 122,0 | 127,4 | -5,4 |
15 | 115 | 99,1 | 131,0 | -31,9 |
16 | 125 | 114,2 | 142,7 | -28,5 |
17 | 132 | 150,6 | 151,0 | -0,4 |
18 | 149 | 156,1 | 171,0 | -14,9 |
19 | 157 | 209,5 | 180,5 | 29,0 |
20 | 282 | 342,9 | 327,8 | 15,1 |
итого | 1652 | 1855,5 | 1855,5 | 0,0 |
По выборочным данным строим уравнение регрессии
ŷх= –4,565 + 1,178х.
Теоретические значения ŷх и отклонения от них фактических значенийiприведены в четвертой и пятой колонке табл.7. Очевидно, что остаточные величиныiобнаруживают тенденцию к росту по мере увеличенияхиу. Этот вывод подтверждается и по критерию Гольдфельда – Квандта. Для его применения необходимо выполнить следующие шаги:
-
упорядочить nнаблюдений по мере возрастания переменнойх (выполнено); -
исключить из рассмотрения kцентральных наблюдений (рекомендовано приn=60 приниматьk=16, приn=30 приниматьk=8, приn=20 приниматьk=4), в данном случае исключаем строки 9–12; -
разделить совокупность на две группы (по ń=(n–k):2=8 наблюдений соответственно с малыми и большими значениями факторах) и определить по каждой из групп уравнения регрессии (результаты в табл.8.); -
определить остаточные суммы квадратов для первой (S1) и второй (S2) групп и найти их отношениеR=S2:S1. Чем больше величинаRпревышает табличное значениеF–критерия с ń –2 степенями свободы (приложение 2), тем более нарушена предпосылка о равенстве дисперсий остаточных величин, т.е. наблюдается гетероскедастичность остатков.
Таблица 8.
№ п/п | хi | yi | ŷх | i | i2 |
1 | 3 | 4,4 | 5,7 | –1,3 | 1,69 |
2 | 6 | 8,1 | 8,5 | –0,4 | 0,16 |
3 | 8 | 12,9 | 10,3 | 2,6 | 6,76 |
4 | 18 | 20,8 | 19,6 | 1,2 | 1,44 |
5 | 20 | 15,5 | 21,4 | –5,9 | 34,81 |
6 | 23 | 28,8 | 24,2 | 4,6 | 21,16 |
7 | 39 | 37,5 | 38,9 | –1,4 | 1,96 |
8 | 49 | 48,7 | 48,1 | 0,6 | 0,36 |
Уравнение регрессии: ŷх = 2,978 + 0,921х. Сумма S1=68,34 | |||||
13 | 106 | 132,4 | 110,7 | 21,7 | 470,89 |
14 | 112 | 122,0 | 118,7 | 3,3 | 10,89 |
15 | 115 | 99,1 | 122,7 | –23,6 | 556,96 |
16 | 125 | 114,2 | 136,1 | –21,9 | 479,61 |
17 | 132 | 150,6 | 145,4 | 5,2 | 27,04 |
18 | 149 | 156,1 | 168,2 | –12,1 | 146,41 |
19 | 157 | 209,5 | 178,9 | 30,6 | 936,36 |
20 | 282 | 342,9 | 346,1 | –3,2 | 10,24 |
Уравнение регрессии: ŷх = 31,142 + 1,338х. СуммаS2 =2638,4 |
Величина R=2638,4 : 68,34=38.6 существенно превышает табличное значениеF-критерия 4,28 при 5%-ном и 8,47 при 1%-ном уровне значимости для числа степеней свободы 8 – 2 = 6, подтверждая тем самым наличие гетероскедастичности.
Нарушение четвертой предпосылки МНК – автокорреляция остатков означает наличие корреляции между остатками текущих и предыдущих (последующих) наблюдений. Коэффициент корреляции rijмеждуiиj, гдеi– остатки текущих наблюдений,j– остатки предыдущих наблюдений (например,j=i–1) определяется по обычной формуле линейного коэффициента корреляции (2).
Для подсчета автокорреляции необходимо наблюдения упорядочить по значению фактора х (как в предыдущем примере) и составить ряды с текущими и предыдущими остатками. Рассмотрим расчет коэффициента корреляции междуiиj, взяв в качестве примера данные из табл.7 и перенеся их в табл. 9 (n=19).
Таблица 9.
№ п/п | i | i-1 | ii-1 |
1 | 5,6 | 5,4 | 30.24 |
2 | 8,0 | 5,6 | 44.8 |
3 | 4,2 | 8,0 | 33.6 |
4 | –3,5 | 4,2 | –14.7 |
5 | 6,3 | –3,5 | –22.05 |
6 | –3,9 | 6,3 | –24.57 |
7 | –4,5 | –3,9 | 17.55 |
8 | 2,5 | –4,5 | –11.25 |
9 | 22,0 | 2,5 | 55 |
10 | 2,0 | 22,0 | 44 |
11 | –19,1 | 2,0 | –38.2 |
12 | 12,0 | –19,1 | –229.2 |
13 | –5,4 | 12,0 | –64.8 |
14 | –31,9 | –5,4 | 172.26 |
15 | –28,5 | –31,9 | 909.15 |
16 | –0,4 | –28,5 | 11.4 |
17 | –14,9 | –0,4 | 5.96 |
18 | 29,0 | –14,9 | –432.1 |
19 | 15,1 | 29,0 | 435 |
итого | –5.3998 | –15.1031 | 922.09 |
среднее | –0,2842 | –0,7949 | 48.5311 |
σi=15.1347, σj=14,7663 и в соответствие с (2)
rij=(48,5311 – (–0,2842)(–0,7949))/15,1347/14,7663=0,2161,
что при 17 степенях свободы явно незначимо и демонстрирует отсутствие автокорреляции остатков.
Автокорреляция остатков может быть вызвана несколькими причинами, имеющими различную природу. Во-первых, иногда она связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака. Во-вторых, причину следует искать в формулировке модели, которая может не включать существенный фактор, влияние которого отражается в остатках, вследствие чего они оказываются автокоррелированными. Очень часто этим фактором является фактор времени, поэтому проблема автокорреляции остатков весьма актуальна при исследовании динамических рядов, что мы рассмотрим в соответствующем разделе.
2. Практическая реализация решения модели парной линейной регрессии в Excel
Уравнение линейной парной регрессии имеет вид:
где — моделируемая переменная,
— переменная-фактор,
— ошибка.
Стандартной задачей является нахождение параметров и для конкретных статистических данных. Рассмотрим пример решения этой задачи простыми инструментами программы MS Excel.
Пример. Изучается зависимость себестоимости единицы изделия ( , тыс. руб.) от величины выпуска продукции ( , тыс. шт.) по группам предприятий за отчетный период. Экономист обследовал предприятий и получил следующие результаты:
| 2 | 3 | 4 | 5 | 6 |
| 1,9 | 1,7 | 1,8 | 1,6 | 1,4 |
Найти уравнение линейной парной регрессии .
Источник: Просветов Г.И. Эконометрика: задачи и решения: учебно-методическое пособие. — М.: Издательство «Альфа-пресс», 2008. — 192 с. (Пример 18, с.32)
Решение. Введем исходные данные в таблице MS Excel:
Выделим диапазон исходных данных:
В меню Вставка выбираем инструмент Точечная диаграмма (именно эта диаграмма позволяет строить точки по двум координатам):
Появляется диаграмма (в статистике этот график называют корреляционным полем):
Выполняем правый щелчок мыши по любой точке на диаграмме, появляется контекстное меню, в котором выбираем команду Добавить линию тренда:
Появляется окно диалога:
В окне диалога Формат линии тренда выбираем вид Линейная (обычно выбрано по умолчанию) и ставим флажок Показывать уравнение на диаграмме, нажимаем кнопку Закрыть. На точечной диаграмме появляется сглаживающая линия и ее уравнение, это и есть искомое уравнение регрессии:
Таким образом, уравнение регрессии имеет вид:
Сделаем вывод: коэффициент регрессии показывает, что при увеличении выпуска продукции на одну тысячу штук, себестоимость единицы продукции уменьшается в среднем на 0,11 тысяч рублей.
Задание на СР: Найти уравнение линейной парной регрессии, если — недельные объемы продаж, тыс. руб., — расходы на рекламу, тыс. руб.
| 5 | 8 | 6 | 5 | 3 | 9 | 12 | 4 | 3 | 10 |
| 72 | 76 | 78 | 70 | 68 | 80 | 82 | 65 | 62 | 90 |
3. Анализ полученного решения и экономическая интерпретация результатов
Любая экономико-математическая модель лишь упрощенно, грубо отображает реальный экономический процесс, и это упрощение существенно сказывается на получаемых результатах. Исследователя вряд ли устроила бы заключительная симплекс-таблица, из которой можно было бы получить только список переменных и их значения. На самом же деле результирующая симплекс-таблица «насыщена» весьма важными данными, лишь небольшую часть которых составляют оптимальные значения переменных. Из симплекс-таблицы можно получить информацию относительно:
-
оптимального решения; -
статуса ресурсов; -
ценности каждого ресурса; -
чувствительности оптимального решения к изменению запасов ресурсов, вариациям коэффициентов целевой функции и интенсивности потребления ресурсов.
Сведения, относящиеся к первым трем пунктам, можно извлечь непосредственно из итоговой симплекс-таблицы. Получение информации, относящейся к четвертому пункту, требует дополнительных вычислений.
Для иллюстрации возможностей получения указанной выше информации из заключительной симплекс-таблицы воспользуемся опять задачей об ассортименте продукции (пример 7.2). Эта задача формулируется следующим образом:
максимизировать: (доход);
при следующих ограничениях: (сырьё А),
(сырьё В),
(спрос),
(спрос).
Оптимальная симплекс – таблица имеет вид:
Свободные неиз-вестные Базисные неизвестные | Свободный Член | y1 | y3 |
x1 | 2.4 | 0.2 | 0.6 |
y2 | 3 | -1 | -1 |
y4 | 0.6 | -0.2 | 0.4 |
x2 | 1.4 | 0.2 | -0.4 |
Zmax | 12.8 | 1.4 | 0.2 |
В таблице - выравнивающие переменные.
Оптимальное решение
С точки зрения практического использования результатов решения задач линейного программирования классификация переменных на базисные и небазисные не имеет значения и при анализе оптимального решения может не учитываться. Переменные, отсутствующие в симплекс-таблице в столбце «базисные переменные», обязательно имеют нулевое значение. Значения остальных переменных приводятся в столбце «свободные члены».
При интерпретации результатов оптимизации в задаче об ассортименте продукции нас прежде всего интересуют объемы производства продукции П1 и П2, т. е. значения управляемых переменных x1 и х2- Используя данные, содержащиеся в симплекс-таблице для оптимального решения, основные результаты можно представить в следующем виде:
Управляемые переменные | Оптимальные значения | Решение |
x1 х2 | 2,4 1,4 | Объем производства продукции П1, должен быть равен 2,4 ед. в сутки Объем производства продукции П2должен быть равен 1,4 ед. в сутки |
Zmax | 12,8 | Доход от реализации продукции будет равен 12,8 д. е. в сутки |
Статус ресурсов
В п. 7.4 ресурсы относились либо к дефицитным либо к недефицитным — в зависимости от того, полное или частичное их использование предусматривает оптимальное решение задачи. Сейчас цель состоит в том, чтобы получить соответствующую информацию непосредственно из оптимальной таблицы.
В модели, построенной для задачи об ассортименте продукции, фигурируют четыре ограничения со знаком « ». Первые два ограничения (определяющие допустимый расход исходного сырья) представляют собой истинные ограничения на ресурсы. Третье и четвертое ограничения относятся к спросу. Эти требования можно рассматривать как ограничения на соответствующие ресурсы, так как увеличение спроса на продукцию эквивалентно расширению представительства предприятия на рынке сбыта. В отношении финансовых средств такая ситуация имеет те же последствия, что и