ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.12.2020
Просмотров: 461
Скачиваний: 2
К о э ф ф и ц и е н т к о р р е л я ц и и
Мерой линейной статистической связи двух случайных величин является коэффициент
корреляции:
r
xy
=
n
⋅
∑
i
=
1
n
x
i
y
i
−
∑
i
=
1
n
x
i
⋅
∑
i
=
1
n
y
i
√
n
⋅
∑
i
=
1
n
x
i
2
−(
∑
i
=
1
n
x
i
)
2
√
n
⋅
∑
i
=
1
n
y
i
2
−(
∑
i
=
1
n
y
i
)
2
Свойства коэффициента корреляции:
−
1
⩽
r
x y
⩽
1
или
∣
r
x y
∣⩽
1
Если
r
x y
→
1
, то между переменными
x
и
у
присутствует тесная прямая линейная связь
Если
r
x y
→ −
1
, то между переменными
x
и
у
присутствует тесная обратная линейная
связь
Если
∣
r
x y
∣ →
0
, о между переменными
x
и
у
отсутствует
линейная
связь (вообще
отсутствует связь или присутствует нелинейная связь)
К о р р е л я ц и о н н о е о т н о ш е н и е . К о э ф ф и ц и е н т д е т е р м и н а ц и и .
В случае нелинейной зависимости тесноту связи между величинами оценивают по величине
корреляционного отношения.
R
=
√
1
−
∑
i
=
1
n
(
y
i
− ̃
y
i
)
2
∑
i
=
1
n
(
y
i
−̄
y
)
2
,
где
y
i
наблюдаемые значения,
̃
y
i
=
f
(
x
i
)
расчетное значение.
Интервал изменения корреляционного отношения
0
⩽
R
⩽
1
Величина
R
2
, называемая
коэффициентом детерминации,
показывает, какая часть общей
вариации
Y
обусловлена вариацией
X
.
Коэффициент детерминации статистически значим, если
F
=
R
2
(
n
−
p
−
1
)
(
1
−
R
2
)
p
>
F
таб
=
F
α
,k
1
,k
2
k
1
=
p
,
k
2
=
n
−
p
−
1
числа степеней свободы;
α
уровень значимости.
П а р н а я л и н е й н а я р е г р е с с и я
y
=
β
0
+
β
1
⋅
x
+
ε
теоретическое уравнение парной линейной регрессии
β
0
;
β
1
параметры (коэффициенты) теоретического уравнения парной линейной
регрессии
ε
теоретическая величина случайного отклонения
y
=
b
0
+
b
1
x
+
e
эмпирическое уравнение парной линейной регрессии
̃
y
=
b
0
+
b
1
x
расчетная часть уравнения регрессии
b
0
; b
1
эмпирические оценки теоретических параметров уравнения регрессии
e —
эмпирическая оценка величины случайного отклонения
Эмпирические оценки параметров уравнения регрессии находятся по выборке с помощью
метода наименьших квадратов (МНК)
М е т о д н а и м е н ь ш и х к в а д р а т о в ( М Н К )
ε
2
≈
e
2
=
∑
i
=
1
n
(
y
i
− ̃
y
i
)
2
=
∑
i
=
1
n
(
y
i
−
b
0
−
b
1
⋅
x
i
)
2
=
S
(
b
0
; b
1
) →
min
Найдем минимум функции нескольких переменных:
{
∂
S
∂
b
0
=−
2
⋅
∑
i
=
1
n
(
y
i
−
b
0
−
b
1
⋅
x
i
)=
0
∂
S
∂
b
1
=−
2
⋅
∑
i
=
1
n
x
i
⋅(
y
i
−
b
0
−
b
1
⋅
x
i
)=
0
Решение системы:
b
1
= ̄
xy
−̄
x
̄
y
̄
x
2
−(̄
x
)
2
,
b
0
=̄
y
−
b
1
̄
x
,
̄
x
=
∑
i
=
1
n
x
i
n
,
̄
y
=
∑
i
=
1
n
y
i
n
,
̄
xy
=
∑
i
=
1
n
x
i
y
i
n
,
̄
x
2
=
∑
i
=
1
n
x
i
n
С т а т и с т и ч е с к а я з н а ч и м о с т ь у р а в н е н и я
п а р н о й л и н е й н о й р е г р е с с и и
Оценка статистической значимости уравнения парной линейной регрессии осуществляется
как оценка значимости коэффициента
b
1
, с помощью критерия Стьюдента.
Если
T
расч
=
∣
b
1
∣
S
b
1
>
T
таб
=
T
α
2
,k
, то коэффициент
b
1
, а значит и уравнение регрессии
статистически значимо.
S
b
1
=
√
S
2
∑
i
=
1
n
(
x
i
−̄
x
)
2
отклонение коэффициента
b
1
S
2
=
∑
i
=
1
n
e
i
2
n
−
2
=
∑
i
=
1
n
(
y
i
− ̃
y
i
)
2
n
−
2
дисперсия случайного отклонения
k
=
n
−
2
число степеней свободы;
α
уровень значимости (
α
= 0,05; 0,01)