Файл: Практическая работа 1 Теоретические основы моделирования. Регрессионный и корреляционный анализ.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 23.11.2023

Просмотров: 796

Скачиваний: 79

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.



Практическая работа № 1

Теоретические основы моделирования. Регрессионный и корреляционный анализ

Вариант 24

  1. Заполним исходные данные задачи в табл.1. После вычисления коэффициентов уравнения для различных видов зависимости (линейной, степенной, экспоненциальной), занесем полученные значения в табл. 3. Далее составим уравнения линейной, степенной, экспоненциальной регрессии и найдем значения моделей Yi для каждого Xi(значения занесем в табл. 1)




  1. Уравнение линейной регрессии имеет вид: y=3x+35

  2. Уравнение экспоненциальной регрессии имеет вид: y=54,034e0,02581x

  3. Уравнение степенной регрессии имеет вид : y=14,1852x0,6478




  1. Построим графики функций регрессий:




  1. Подсчитаем коэффициент парной корреляции для линейной модели и индекс корреляции для нелинейных моделей.




  1. Для линейной модели коэффициенты корреляции R2, вычисленный вручную и полученный через встроенные средства программного обеспечения EXCEL, совпадают: R2р= R2=1; модуль R равен 1, связь линейна

  2. Для cтепенной модели коэффициенты корреляции R2, вычисленный вручную R2р= и полученный через встроенные средства программного обеспечения EXCEL, совпадают: R2р= R2=0,9936; т.е. разброс теоретических «ŷ» и экспериментальных «y» значений результирующей переменной относительно общего среднего значения небольшой. Модель достаточно точно описывает исходную функцию.

  3. Для экспоненциальной модели коэффициенты корреляции R2, вычисленный вручную R2р= и полученный через встроенные средства программного обеспечения EXCEL, совпадают: R2р= R2=0,9767; т.е. разброс теоретических «ŷ» и экспериментальных «y» значений результирующей переменной относительно общего среднего значения небольшой. Модель достаточно точно описывает исходную функцию.

Вопросы для проверки:


  1. Запишите вид парной линейной регрессии. Дайте определение всем входящим в нее элементам.

Парная линейная регрессия имеет вид: или

Уравнение вида позволяет по заданным значениям фактора x (регрессора) находить теоретические значения результативного признака, подставляя в него фактические значения фактора x. Параметр b называется коэффициентом регрессии. Его величина показывает среднее изменение результата с изменением фактора на одну единицу. Параметр a, при котором нет факторов, называют часто константой. Формально — это значение функции при нулевом значении всех факторов. - случайная ошибка модели.


  1. В чем суть метода наименьших квадратов?

Метод наименьших квадратов - математический метод, применяемый для решения различных задач, основанный на минимизации суммы квадратов отклонений некоторых функций от искомых переменных. Он может использоваться для «решения» переопределенных систем уравнений (когда количество уравнений превышает количество неизвестных), для поиска решения в случае обычных (не переопределенных) нелинейных систем уравнений, для аппроксимации точечных значений некоторой функции.

Суть метода.

Пусть x{\displaystyle x} - набор {\displaystyle n}n неизвестных переменных (параметров){\displaystyle f_{i}(x)}bbb {\displaystyle m>n} - совокупность функций от этого набора переменных. Задача заключается в подборе таких значений {\displaystyle x}x, чтобы значения этих функций были максимально близки к некоторым значениям {\displaystyle y_{i}} . По существу речь идет о «решении» переопределенной системы уравнений {\displaystyle f_{i}(x)=y_{i}} {\displaystyle i=1,\ldots ,m} в указанном смысле максимальной близости левой и правой частей системы. Суть МНК заключается в выборе в качестве «меры близости» суммы квадратов отклонений левых и правых частей 

{\displaystyle |f_{i}(x)-y_{i}|} . Таким образом, сущность МНК может быть выражена следующим образом: {\displaystyle \sum _{i}e_{i}^{2}=\sum _{i}(y_{i}-f_{i}(x))^{2}\rightarrow \min _{x}}

В случае, если система уравнений имеет решение, то наименьшее значение суммы квадратов будет равно нулю и могут быть найдены точные решения системы уравнений аналитически или, например, различными численными методами оптимизации. Если система переопределена, то есть, говоря нестрого, количество независимых уравнений больше количества искомых переменных, то система не имеет точного решения и метод наименьших квадратов позволяет найти некоторый «оптимальный» вектор{\displaystyle x}x в смысле максимальной близости векторов y{\displaystyle y} и f(x) {\displaystyle f(x)} или максимальной близости вектора отклонений {\displaystyle e}e к нулю (близость понимается в смысле евклидова расстояния).

  1. Дайте интерпретацию параметров b1 и b0 линейной модели. Покажите их графическое представление.

Простая линейная регрессия имеет вид:

 Yi = β0 + β1Xi + εi

где β0 - сдвиг (длина отрезка, отсекаемого на координатной оси прямой Y), β1 - наклон прямой Y, εi - случайная ошибка переменной Y в i-м наблюдении.

В этой модели наклон βпредставляет собой количество единиц измерения переменной Y, приходящихся на одну единицу измерения переменной X. Эта величина характеризует среднюю величину изменения переменной Y (положительного или отрицательного) на заданном отрезке оси X. Сдвиг β0 представляет собой среднее значение переменной Y, когда переменная X равна 0. Последний компонент модели εi является случайной ошибкой переменной Y в i-м наблюдении. 



  1. Что оценивает линейный коэффициент корреляции?

Линейный коэффициент корреляции измеряет степень линейной зависимости между двумя переменными, одна из которых - результативный показатель (у), а другая - факторный (х).


  1. Приведите примеры нелинейных моделей по объясняющей переменной x.

Модели нелинейные относительно включенных в анализ объясняющих переменных, но линейные по оцениваемым параметрам:

  1. Полиноминальное уравнение регрессии(полиномы различных степеней):

  2. Гиперболическое уравнение регрессии: 

  3. Полулогарифмическое уравнение регрессии:

-случайная ошибка(отклонение, возмущение).


  1. Что понимается под линеаризацией нелинейной модели?

Многие важные связи в экономике являются нелинейными, например, ПФ (зависимости между объемом производства, трудом и капиталом и т.д.), функция спроса (зависимости между спросом на какой – либо товар или услуги, доходом населения и ценами на этот товар). Если в результате анализа пришли к выводу, что в регрессионной модели функция  нелинейная, то обычно подбирают такие преобразования анализируемых переменных  , которые позволили бы представить искомую зависимость в виде линейного соотношения между новыми переменными:

, … , − преобразования, , где

Такая процедура называется линеаризацией модели.

  1. Каким показателем характеризуется теснота связи факторов для нелинейной модели? Каковы свойства этого показателя?


Теснота связи факторов для нелинейной модели характеризуется корреляционным отношением. Различают эмпирическое и теоретическое корреляционное отношение. Эмпирическое корреляционное отношение рассчитывается по данным группировки.

При отклонении парной статистической зависимости от линейной коэффициент корреляции теряет свой смысл, как характеристика тесноты связи. В этом случае можно воспользоваться таким измерителем связи, как индекс корреляции (корреляционное отношение). Корреляционное отношение применяется в случае нелинейной зависимости между признаками и определяется через отношение межгрупповой дисперсии к общей дисперсии.

Для определения эмпирического корреляционного отношения совокупность значений результативного признака У разбивают на отдельные группы. В основу группировки кладется исследуемый фактор Х. Когда изучаемая совокупность (в виде корреляционной таблицы) разбивается на группы по одному (факторному) признаку Х, то для каждой из этих групп можно вычислить соответствующие групповые средние результативного признака. Изменение групповых средних от группы к группе свидетельствует о наличии связи результативного признака с факторным признаком, а примерное равенство групповых средних – об отсутствии связи. Следовательно, чем большую роль в общем изменении результативного признака играет изменение групповых средних (за счет влияния факторного признака), тем сильнее влияние этого признака.



Величина корреляционного отношения изменяется от 0 до 1. Близость ее к нулю говорит об отсутствии связи, близость к единице – о тесноте связи.

Оценка связи на основе теоретического корреляционного отношения (шкала Чеддока):

Значение 

Характер связи

 

Значение 

Характер связи

η = 0

Отсутствует

 

0,5≤ η <0,7

Заметная

0< η < 0,2

Очень слабая

 

0,7≤ η < 0,9

Сильная

0,2 ≤ η < 0,3

Слабая

 

0,9 ≤ η < 1

Весьма сильная

0,3≤ η <0,5

Умеренная

 

η = 1

Функциональная