Файл: Министерство цифровых технологий республики Узбекистан Нурафшанскийфилиал Ташкентского университета информационных технологий имени Мухаммада альхорезми.ppt

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.12.2023

Просмотров: 7

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Министерство цифровых технологий республики Узбекистан Нурафшанскийфилиал Ташкентского университета информационных технологий имени Мухаммада аль-хорезми


Кафедра .К.И.
Самостоятельная работа
Выполни .Розибойев.М.А
Проверил .Умаров.М. А.
Студент гр. 320-21

Нелинейные уравнения регрессии. Многомерная регрессия и корреляция.

Множественные регрессионные модели


Независимая переменная y характеризует состояние или поведение экономического объекта. Набор переменных x1,…,xm, характеризуют этот экономический объект качественно или количественно. Предполагаем, что переменные x оказывают влияние на переменную y , т. е. реализации переменной y выступают в виде функции. Значения y определяются с некоторой погрешностью, значениями объясняющих переменных, выступающих в роли аргументов этой функции, т. е.
y = f(x 1,…, x m) + , где  - случайная компонента.

Пример


Уравнение множественной линейной регрессии





Множественная регрессия широко используется в решении проблем спроса, изучении доходности акций, изучении функции издержек, производства, в макроэкономических расчетах.

Основная цель множественной регрессии


Построить модель с большим числом факторов, определив при этом влияние каждого из них в отдельности, а также совокупное их воздействие на моделируемый показатель.

Спецификация модели


Спецификация модели включает в себя два круга вопросов:
- отбор факторов;
- выбор вида уравнения регрессии.




Отбор факторов при построении множественной регрессии.


1.) Факторы должны быть количественно измеримы.
Если необходимо включить в модель качественный фактор, не имеющий количественного измерения, то ему нужно придать количественную определенность.

Например:


в модели урожайности качество почвы задается в виде баллов;
в модели стоимости объектов недвижимости учитывается место нахождения недвижимости: районы могут быть пронумерованы.


2.) Факторы не должны быть интеркоррелированы и тем более находиться в точной функциональной связи.


Если между факторами существует высокая корреляция, то нельзя определить их изолированное влияние на результативный показатель и параметры уравнения регрессии оказываются неинтерпретируемыми.

Пусть в уравнении


Пусть в уравнении
Тогда можно говорить, что параметр b1 измеряет силу влияния фактора x1 на средний результат y при неизменном значении фактора x2.


Если же , то с изменением фактора x1 фактор x2 не может оставаться неизменным.
Отсюда b1 и b2 нельзя интерпретировать как показатели раздельного влияния x1 и x2 на y .

Пример


Рассмотрим регрессию себестоимости единицы продукции (руб.,у) от заработной платы работника (руб., x) и производительности его труда (единиц в час, z):


отбор факторов обычно осуществляется в две стадии на первой подбираются факторы исходя из сущности проблемы;
на второй – на основе матрицы показателей корреляции определяют существенность включения в уравнение регрессии каждого из факторов.


Коэффициенты интеркорреляции – коэфф. корреляции между объясняющими переменными.


Считается, что две переменные явно коллинеарны, т.е находятся между собой в линейной зависимости, если rxixj> 0,7.
Одним из условий построения уравнения множественной регрессии является независимость действия факторов.


Если факторы явно коллинеарны, то они дублируют друг друга и один из них рекомендуется исключить из регрессии.


Предпочтение отдается не фактору, более тесно связанному с результатом, а тому фактору, который при достаточной тесной связи с результатом имеет наименьшую тесноту связи с другими факторами.


1


0,8


1


0,7


0,8


1


0,6


0,5


0,2


1


Пусть, например, при изучении зависимости y=a+b*x+c*z+d*v+ матрица парных коэффициентов корреляции оказалась следующей:


Очевидно, что факторы x и z дублируют друг друга. В анализ целесообразно включить фактор z, а не x, хотя корреляция z с результатом y слабее, чем корреляция фактора x с y (ryz<ryx), но зато слабее, чем межфакторная корреляция rzv<rxv . Поэтому в данном случае в уравнении множественной регрессии включаются факторы z, v.

Пример


1


0,3


1


0,7


0,75


1


0,6


0,5


0,8


1


По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов.
Наибольшие трудности возникают при наличии мультиколлинеарности факторов, когда более чем два фактора связаны между собой линейной зависимостью.

Мультиколлинеарность


Мультиколлинеарность – это проблема, когда тесная корреляционная зависимость между регрессорами ведет к получению ненадежных оценок регрессии

Неизбежность мультиколлинеарности


Мультиколлинеарность – нормальное явление.
Практически любая модель содержит мультиколлинеарность.
Мы не обращаем внимания на мультиколлинеарность до появления явных симптомов.
Только чрезмерно сильные связи становятся помехой.

Механизм действия мультиколлинеарности


Мультиколлинеарность проявляется в совместном действии факторов:
Построить модель – значит определить вклад каждого фактора.
Если два или более фактора изменяются только совместно, их вклад по отдельности становится невозможно различить.
Чем более сильно коррелированы переменные, тем труднее различить их вклад.

Обнаружение мультиколлинерности


Внешние признаки, являющимся следствиями мультиколлинеарности:
    некоторые из оценок имеют неправильные с точки зрения экономической теории знаки или неоправданно большие значения;
    небольшое изменение исходных экономических данных приводит к существенному изменению оценок коэффициентов модели;
    большинство t-статистик коэффициентов малы, в то же время модель в целом является значимой, о чем говорит высокое значение F-статистики.

Обнаружение мультиколлинерности


Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами.


Если бы факторы не коррелировали между собой, то определитель матрицы парных коэффициентов корреляции был бы единичной матрицей т.е.


Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны единице, то определитель такой матрицы равен нулю:

Таким образом,


Таким образом, чем ближе к нулю определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии.

Включение дополнительных факторов


При дополнительном включении в регрессию m+1 фактора коэффициент детерминации должен возрастать, а остаточная дисперсия уменьшаться;
и
Если же этого не происходит и данные показатели практически мало отличаются друг от друга, то включаемый в анализ фактор не улучшает модель и практически является лишним фактором.

Пример


Так, если для регрессии, включающих пять факторов, коэффициент детерминации составил 0,857.
Включение шестого фактора дало коэффициент детерминации 0,858, вряд ли целесообразно дополнительно включать в модель этот фактор.

Методы построения уравнения множественной регрессии


Метод исключения
Отсев факторов из полного его набора
Метод включения
Дополнительное введение фактора

Выбор формы уравнения регрессии

Выбор формы уравнения регрессии


Линейная регрессия
Линеаризуемые регрессии
    Степенная регрессия
    Экспоненциальная регрессия
    Гиперболическая регрессия




Пример


Предположим, что при исследовании спроса на мясо получено уравнение.
где y – количество спрашиваемого мяса;
x1 – цена;
x2 – доход.
Рост цен на 1% при том же доходе вызывает снижение спроса в среднем на 2,63%. Увеличение дохода на 1% обуславливает при неизменных ценах рост спроса на 1,11%.

Оценка параметров уравнения множественной регрессии

Метод наименьших квадратов для множественной линейной регрессии


Модель
Система нормальных уравнений
………………………………………




Матричная форма записи множественной линейной регрессии


где

Итог


МНК оценки коэффициентов множественной линейной регрессии

Множественная корреляция

Множественная корреляция


Практическое значимость уравнения множественной регрессии оценивается с помощью показателя множественной корреляции и его квадрата – коэффициента детерминации.
Показатель множественной корреляции характеризует тесноту связи рассматриваемого набора факторов с исследуемым признаком, или, иначе, оценивает тесноту совместного влияния факторов на результат.

Множественная корреляция


Чем ближе R к единице, тем теснее связь рассматриваемых признаков.
R2 коэффициент множественной детерминации.


R2, вообще говоря, возрастает при добавлении еще одного фактора, поэтому для выбора между несколькими регрессионными уравнениями не следует полагаться только на R2.


Если число параметров при xj равно m и приближается к объему наблюдений, то остаточная дисперсия будет близка к нулю и коэффициент детерминации приблизится к единице даже при слабой связи факторов с результатом.


Попыткой устранить эффект, связанный с ростом R2 при увеличении числа факторов, является коррекция R2 на число факторов- наложение "штрафа" за увеличение числа независимых переменных.


где m – число параметров при переменных x;
n – число наблюдений.

Свойства скорректированного коэффициента детерминации


Чем больше m, тем сильнее различаются


При заданном объеме наблюдений при прочих равных условиях с увеличением числа независимых переменных (параметров) убывает. Его величина может стать и отрицательной при слабых связах результата с факторами. В этом случае он должен считаться равным нулю.

Частная корреляция

Частные коэффициенты корреляции


характеризуют тесноту связи между результатом и соответствующим фактором при устранении влияния других факторов, включенных в уравнение регрессии.


Частные показатели корреляции широко используются при решении проблемы отбора факторов;
ранжировании факторов, участвующих в множественной регрессии.


Порядок частного коэффициента корреляции определяется количеством факторов, влияние которых исключается.
Например, или
коэффициент частной корреляции первого порядка.

Для линейной регрессии


Коэффициенты частной корреляции более высоких порядков можно определить через коэффициенты частной корреляции более низких порядков по рекуррентной формуле


Изменяется в пределах от -1 до 1.

Для линейной регрессии


При двух факторах и i = 1 данная формула примет вид:


При i = 2 ?

Для нелинейной регрессии


- коэффициент частной детерминации.


Частный коэффициент корреляции изменяется в пределах от 0 до 1.

Для нелинейной регрессии


При двух факторах и i = 1 данная формула примет вид:


При i = 2 ?


- измеряет тесноту связи между y и x1 при неизменном уровне фактора x2.

Частные коэффициенты корреляции


В эконометрике частные коэффициенты корреляции обычно не имеют самостоятельного значения. В основном их используют на стадии формирования модели, в частности в процедуре отсева факторов.
Величина множественного коэффициента корреляции всегда больше (или равна) максимального частного коэффициента корреляции.

Оценка надежности результатов множественной регрессии и корреляции

Оценка значимости уравнения множественной регрессии


Значимость уравнения множественной регрессии в целом, так же как и в парной регрессии, оценивается с помощью F - критерия Фишера.


где m – число параметров при переменных x.

Частный F-критерий


Оценивает значимость не уравнения в целом, а фактора, дополнительно включенного в регрессионную модель.
Необходимость такой оценки связана с тем, что не каждый фактор, вошедший в модель, может существенно увеличить долю объясненной вариации результативного признака.

Частный F-критерий


При двух факторах и i = 1 данная формула примет вид:


При i = 2 ?

Частный F-критерий


Если фактическое значение превышает , то дополнительное включение фактора xi в модель статистически оправданно и коэффициент чистой регрессии bi при факторе xi статистически значим.
С помощью частного F-критерия можно проверить значимость всех коэффициентов регрессии в предположении, что каждый соответствующий фактор xi вводился в уравнение множественной регрессии последним.


Частный F-критерий оценивает значимость коэффициентов чистой регрессии. Зная величину , можно определить и t-критерий для коэффициента регрессии при i-м факторе, , а именно:


Оценка значимости коэффициентов чистой регрессии по t-критерию Стьюдента может быть проведена и без расчета частных F-критериев. В этом случае, как ив парной регрессии, для каждого фактора используется формула


Для уравнения множественно регрессии


При представлении результатов множественной регрессии наряду с уравнением множественной регрессии и скорректированным коэффициентом множественной детерминации принято приводить значения .

Пример


1 шаг – изучение корреляционной матрицы
2 шаг – анализ всех возможных регрессий или пошаговая регрессия

Анализ всех возможных регрессий


1этап – все возможные уравнения регрессии ( )
2 этап – разделение уравнений на множества (по количеству оцениваемых параметров)

Анализ всех возможных регрессий

Анализ всех возможных регрессий

Анализ всех возможных регрессий


3 этап – выбор наилучшей независимой переменной (или переменных) из каждой группы с определенным числом параметров

Анализ всех возможных регрессий


4 этап – выбор наилучшего уравнения
Желательно иметь наибольшее из возможных значений показателя детерминации, НО максимально простое уравнение регрессии
Это уравнение объясняет 89,48% вариации переменной Y