Файл: Практическая работа 1 Регрессионный и корреляционный анализ.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.12.2023

Просмотров: 146

Скачиваний: 40

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Практическая работа №1
Регрессионный и корреляционный анализ
Регрессионный анализ исследует форму зависимости одной величины от другой.
Регрессия – это зависимость математического ожидания одной случайной величины от значений математического ожидания другой величины.
Аналитическая связь между значениями X и Y вида Y=f(X) наилучшим образом описывающая зависимость Yi от Xi называется эмпирической формулой. Поскольку на замеренные значения Xi и Yi оказывает влияние множество неучтенных факторов, то функция Y=f(X) не должна проходить точно через экспериментальные точки.
Идея регрессионного анализа
В качестве основного математического метода для определения уравнения регрессии используется метод наименьших квадратов.
Коэффициенты уравнения регрессии определяются исходя из условия, что сумма квадратов отклонений эмпирических значений f(Xi) от экспериментальных значений Yi в узловых точках должна быть минимальной.
( )
(
)
MIN
X
f
Y
n
i
i
i
=


=1 2
Линейная зависимость
Y=aХ+b
(
)

=
=


=
n
i
i
i
MIN
b
aX
Y
S
1 2

0
=


a
S
0
=


b
S
Задача сводится к решению системы уравнений в частных производных:
(
)
(
)(
)


=
=
=



=




n
i
n
i
i
i
i
i
i
X
b
aX
Y
b
aX
Y
a
1 1
2 0
2
(
)
(
)( )


=
=
=



=




n
i
n
i
i
i
i
i
b
aX
Y
b
aX
Y
b
1 1
2 0
1 2
Решение сводится к системе линейных уравнений:



=
=
=
=
+
n
i
n
i
n
i
i
i
i
i
Y
X
X
b
X
a
1 1
1 2


=
=
=
+
n
i
n
i
i
i
Y
bn
X
a
1 1
Решая систему уравнений, получаем a и b





=
=
=
=
=








=
N
i
i
N
i
i
N
i
i
i
N
i
i
N
i
i
x
N
x
y
x
N
y
x
a
1 2
2 1
1 1
1







=


=
=
N
i
i
N
i
i
x
a
y
N
b
1 1
1
Степенная регрессия
Y(x)=B0*ХB1







=
=
=
=
=








=
N
i
i
N
i
i
N
i
i
i
N
i
i
N
i
i
x
N
x
y
x
N
y
x
B
1 2
2 1
1 1
1
)
(ln ln
)
ln
(ln ln ln
1













=


=
=
N
i
i
N
i
i
x
B
y
N
B
1 1
ln
1
ln
1
exp
0
Экспоненциальная регрессия
Y(x)=B0*ЕХР(В1x)





=
=
=
=
=








=
N
i
i
N
i
i
N
i
i
i
N
i
i
N
i
i
x
N
x
y
x
N
y
x
B
1 2
2 1
1 1
1
)
ln
(
ln
1













=


=
=
N
i
i
N
i
i
x
B
y
N
B
1 1
1
ln
1
exp
0

Наряду с понятием регрессии при рассмотрении связи между случайными переменными вводится понятие корреляции.
Корреляция в широком смысле подразумевает наличие связи между случайными переменными. Понятия регрессии и корреляции непосредственно связаны между собой. Если в регрессионном анализе исследуется форма связи между переменными, то в корреляционном анализе оценивается сила этой связи.
Задачи корреляционного анализа
1. Измерение степени связности двух и более переменных с помощью соответствующих статистических вычислений.
2. Отбор существенных факторов, выявленных в результате измерения степени связности между переменными.

3. Установление неизвестных причинных связей.
Корреляция непосредственно не устанавливает причинные связи, но позволяет сделать вывод о степени необходимости их наличия. Причинный характер связей устанавливает исследователь.
Линейная корреляция
Коэффициент парной корреляции







=
=
=
=
=
=
=





















=
N
i
N
i
i
i
N
i
N
i
i
i
N
i
N
i
i
N
i
i
i
i
N
y
y
N
x
x
N
y
x
y
x
R
1 2
1 2
1 2
1 2
1 1
1
/
• Если модуль R близок к 1, то эта связь линейна, причем знак R определяет знак коэффициента а.
• Если R>0, то а>0 и наоборот
• Если R<0, то а<0
• Если R близок к 0, то линейная связь отсутствует, но возможна нелинейная связь, для установления которой требуются дополнительные исследования.
Мерой интенсивности связи при нелинейных соотношениях между переменными служит индекс корреляции.
Индекс корреляции рассчитывается, когда выбрана конкретная нелинейная зависимость между переменными, построена эта зависимость и по ней определены теоретические значения результирующей переменной “ŷ”.
Расчетная формула для индекса корреляции имеет вид.


2 1
1 2
2 1
1
^
2














=




=
=
=
=
n
i
i
n
i
i
n
i
n
i
i
i
y
y
n
y
y
n
R
R позволяет сопоставить разброс теоретических «ŷ» и экспериментальных
«y» значений результирующей переменной относительно общего среднего значения.
Диапазон изменения индекса корреляции -1≤R≤1.
Рассчитать значения коэффициента парной корреляции для линейной зависимости, для степенной и экспоненциальной зависимости при тех же исходных данных.
При расчете коэффициента парной корреляции для степенной и экспоненциальной зависимостей надо использовать не х и у, как для линейной зависимости, а LN(x) и LN(y), x и LN(y) соответственно.
Сравните R
2
, вычисленный Вами, и полученный через «Вставить линию тренда».

Задание:
В виде точек дана зависимость потребительских расходов на душу населения У (Руб) от денежных доходов на душу населения Х(Руб).
Варианты контрольных заданий по
Темам «Регрессионный анализ и корреляционный анализ»
Таблица значений величинY(i) по вариантам
Значения величин X(i) одинаковы для всех вариантов
Значения вел X
№ варианта
10 20 30 40 50 1
7,38 18,15 44,64 109,79 270,06 2
30 50 70 90 110 3
23,94 58,95 99,87 145,16 194,01 4
126,19 54,92 33,77 23,91 18,29 5
166,44 55,41 18,44 6,14 2,04 6
156,19 34,85 7,78 1,74 0,39 7
100 80 60 40 20 8
180 140 100 60 20 9
6,68 14,86 33,07 73,60 163,79

10 45 75 105 135 165 11 150,36 61,06 36,05 24,80 18,55 12 8,90 18,81 44,09 98,13 218,39 13 245,28 66,85 18,22 4,96 1,35 14 290,00 220,0 150,00 80,00 10,00 15 70,00 130,00 190,00 250,00 310,00 16 126,19 54,92 33,77 23,91 18,29 17 180 140 100 60 20 18 150,36 61,06 36,05 24,80 18,55 19 23,94 58,95 99,87 145,16 194,01 20 6,68 14,86 33,07 73,60 163,79 21 8,90 18,81 44,09 98,13 218,39 22 70,00 130,00 190,00 250,00 310,00 23 245,28 66,85 18,22 4,96 1,35 24 65 95 125 155 185 25 166,44 55,41 18,44 6,14 2,04
Вопросы для проверки:
1. Запишите вид парной линейной регрессии. Дайте определение всем входящим в нее элементам.

2. В чем суть метода наименьших квадратов?
3. Дайте интерпретацию параметров b1 и b0 линейной модели. Покажите их графическое представление.

4. Что оценивает линейный коэффициент корреляции?
5. Приведите примеры нелинейных моделей по объясняющей переменной x.

6. Что понимается под линеаризацией нелинейной модели?
7. Каким показателем характеризуется теснота связи факторов для нелинейной модели? Каковы свойства этого показателя?

0>