Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.06.2024
Просмотров: 243
Скачиваний: 0
-90-
чим. Найдём доверительный интервал для выборочного коэффициен-
та |
|
корреляции, |
|
вычислим |
z = 1 ln1 |
+0 |
,854 − |
1,96 |
≈ 0,9849 , |
||||
|
|
|
|
|
|
1 |
2 |
1 |
−0 |
,854 |
50 −3 |
|
|
|
|
= 1 ln 1,854 + 1,96 |
|
|
|
|
|||||||
z |
2 |
≈1,5566 , |
тогда |
|
th z |
= th0,9849 ≈ 0,755 |
и |
||||||
|
|
2 0,146 |
47 |
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
th z2 = th1,5566 ≈ 0,9149 . Следовательно, доверительный |
интервал |
||||||||||||
для |
выборочного |
коэффициента |
|
корреляции |
имеет |
вид |
|||||||
0,755 < r < 0,9149. |
|
|
|
|
|
|
|
|
|
58. Эмпирическая и теоретическая линии регрессии
Определить форму связи – значит выявить механизм получения зависимой случайной величины.
Кривой регрессии У по Х (или Х по У) называют условное среднее значение случайной величины У, рассматриваемое как функция определённого класса, параметры которой находятся методом наименьших квадратов по наблюдённым значениям двухмерной случайной величины. То есть уравнение линейной регрессии имеет вид y = β0 + β1x . Оценке в этом случае подлежат параметры β0 и β1,
называемые коэффициентами регрессии, а также σост2 - остаточная
дисперсия. Остаточной дисперсией называется та часть рассеивания результативного признака, которую нельзя объяснить действием наблюдаемого признака.
Пример 53. Построить эмпирическую и теоретическую линии регрессии по данным примера 51.
Решение. Уравнение теоретической линии регрессии имеет вид |
|||||||||
y = r |
S(y) |
(x − x)+ y , |
|
|
|
||||
|
|
|
|
|
|
|
|||
в S(x) |
|
|
|
||||||
где: x = hxu +C x = 2,2 (−0,04)+14,8 =14,792, |
|
|
|||||||
y = hy |
v |
+C y = 6,3 0,24 +22,45 = 23,962 , |
|
|
|||||
S(x)= hx S(u)≈ 2,2 1,549 ≈ 3,408, |
S(y)= hy S(v)≈ 6,3 1,422 ≈8,959 . |
||||||||
Тогда |
|
|
|
|
уравнение |
регрессии |
имеет |
вид |
|
y = 0,854 |
8,959 |
(x −14,792)+23,962 или y = 2,245x −9,245. |
Для по- |
||||||
|
|||||||||
|
3,408 |
|
|
|
|
-91-
строения возьмём точки (8,2;9,2) и (21,4;38,8). При построении эмпирической линии регрессии используем точки вида (xi ; yi ), где значения yi находятся по формуле yi = hyvi +C y . Получаем
y1 = −2 6,3 +22,45 = 9,85,
y2 = −1,5 6,3 + 22,45 =13, y3 = −0,5 6,3 +22,45 =19,3, y4 = 0,5 6,3 +22,45 = 25,6 , y5 = 6,3 +22,45 = 28,75,
y6 = |
4 |
6,3 +22 |
,45 = 30,85 , y7 = |
8 |
6,3 +22,45 = 39,25 . Построим на |
|
|
|
|||||
3 |
|
|
|
3 |
||
плоскости |
точки с координатами (8,2;9,9), (10,4;13), (12,6;19,3), |
|||||
(14,8;25,6), |
(17 |
;28,8), (19,2;30,9), |
(21,4;39,3) и, соединив их в порядке |
возрастания х, получим эмпирическую линию регрессии.
45
40
35
30
25
20
15
10
5
0
0 |
5 |
10 |
15 |
20 |
25 |
5
9. Значимость коэффициентов регрессии Проверить значимость оценок коэффициентов регрессии – зна-
чит установить, достаточна ли величина оценки для статистически обоснованного вывода о том, что коэффициенты регрессии отличны от нуля. Для этого проверяют гипотезу о равенстве нулю коэффициентов регрессии, соблюдая предпосылки нормальной регрессии.
Вычисляем статистику t = |
|
b |
|
, которая имеет k = n −2 степе- |
|
Sb |
|||||
|
|
|
ней свободы, b – оценка коэффициента регрессии, Sb - оценка сред-
него квадратического отклонения коэффициента, иначе стандартная ошибка оценки. По уровню значимости и числу степеней свободы по
-92-
таблице находят tα ,k . Если t > tα ,k , то гипотезу о равенстве нулю
коэффициента регрессии отвергают, следовательно при заданном уровне значимости коэффициент регрессии значим. Оценки среднего
квадратического отклонения находятся по формулам Sb |
= |
Sост |
, |
|||||||
|
|
|
|
|
|
|
0 |
|
n −2 |
|
|
Sост |
|
|
|
|
|
|
|
|
|
Sb = |
, |
где |
S(x)= |
1 |
∑(xi − x)2 |
|
|
и |
||
S(x) n − 2 |
n |
|
|
|||||||
1 |
|
|
|
|
|
|
|
|
Sост2 = n 1−2 ∑(yi − y(xi ))2 .
Доверительные интервалы для коэффициентов регрессии находятся по формулам b −tα ,k Sb < β < b +tα ,k Sb .
Пример 54. Найти коэффициенты регрессии, проверить их значимость и построить доверительные интервалы при уровне значимости α = 0,05 по данной выборке
|
xi |
|
|
|
|
|
|
1 |
|
|
2 |
3 |
|
|
|
4 |
|
5 |
|
6 |
7 |
8 |
9 |
10 |
|
|||||||||||
|
yi |
|
|
|
|
|
7 |
|
|
|
9 |
|
|
11 |
15 |
|
15 |
|
19 |
20 |
23 |
24 |
27 |
по формулам |
||||||||||||
|
|
|
|
|
|
|
|
|
Решение. |
|
Найдём |
коэффициенты |
регрессии |
|||||||||||||||||||||||
|
β |
1 |
|
= |
|
|
|
|
|
xy − x y |
и β |
0 |
= y − β |
1 |
x . Вычислим значения входящих в фор- |
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
x2 −(x)2 |
||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
мулы величин: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
x = |
|
1 |
∑xi = |
|
1 |
|
(1+2 +3 +4 +5 +6 +7 +8 +9 +10)= 5,5, |
|
|||||||||||||||||||||||||||
|
|
|
|
10 |
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
y = |
1 |
|
|
∑ yi |
= |
|
1 |
|
|
(7 +9 +11+15 +15 +19 +20 +23 +24 +27)=17 , |
|||||||||||||||||||||||||
n |
|
|
|
|
|
|||||||||||||||||||||||||||||||
|
|
|
|
|
1 |
|
(12 |
10 |
|
|
+32 +42 +52 +62 +72 +82 +92 +102 )= 38,5 , |
|||||||||||||||||||||||||
|
|
|
|
= |
|
|
|
|
|
+22 |
|
|||||||||||||||||||||||||
|
x |
2 |
|
|
|
|
|
|||||||||||||||||||||||||||||
|
10 |
|
||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
(72 |
|
|
|
|
|
|
+112 +152 +152 +192 +202 +232 +242 +272 )=329,6, |
||||||||||||||||||||||
|
|
|
= |
|
|
|
|
|
1 |
|
+92 |
|
||||||||||||||||||||||||
|
y |
2 |
|
|
|
|
|
|
||||||||||||||||||||||||||||
|
|
10 |
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xy =101 (7 +2 9 +3 11+4 15 +5 15 +6 19 +7 20 +8 23+9 24 +270)= =111,1.
-93-
Тогда |
|
|
β = |
|
|
|
111,1−5,5 17 |
≈ 2,13 |
и |
β |
0 |
=17 −2,13 5,5 ≈ 5,27 , следова- |
|||||||||||||||||||||||||
|
|
|
|
|
|||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
38,5 −5,52 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
y = 2,13x +5,27 . |
Проверим |
|||||||||
тельно, уравнение регрессии имеет вид |
|||||||||||||||||||||||||||||||||||||
значимость |
|
|
|
коэффициентов |
регрессии. |
Для |
этого |
вычислим |
|||||||||||||||||||||||||||||
S(x)= |
|
|
|
|
|
|
|
−(x)2 = |
38,5 −5,52 ≈ 2,872 . |
|
|
y(xi ), |
|
||||||||||||||||||||||||
|
|
|
x2 |
Найдём |
используя |
||||||||||||||||||||||||||||||||
уравнение регрессии |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||
y(1) |
≈ 7,4; y |
(2)≈ 9,53; y(3)≈11,66; y(4)≈13,79; |
|
|
|
||||||||||||||||||||||||||||||||
y(5)≈15,92; y(6) |
≈18,05; y |
(7)≈ 20,18; y(8) |
≈ 22,31; y(9)≈ 24,44; |
|
|||||||||||||||||||||||||||||||||
y(10)≈ 26,57 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
Найдём |
|
|
|
|
|
остаточную |
|
|
|
дисперсию |
по |
формуле |
|||||||||||||||||||||||||
S2 |
|
|
= |
|
|
1 |
|
|
∑(y −y(x ))2 = |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
|
|
|
n−2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||
|
ост |
|
|
|
|
|
|
|
i |
|
|
|
i |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
= |
1 |
(0,42 |
+0,532 +0,662 +1,212 +0,922 +0,952 +0,182 +0,692 +0,442 +0,432)≈Вы- |
||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||
|
|
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
≈0,622 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Sост = |
0,7887 ≈ 0,279 |
|
|||||||||
числим |
|
|
|
Sост ≈ 0,7887 , |
тогда |
|
Sb |
|
= |
и |
|||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
Sост |
|
|
|
0,7887 |
|
|
|
|
|
0 |
|
|
n − 2 |
8 |
|
|
|||||||||||
Sb |
|
= |
|
|
|
|
|
|
= |
≈ 0,097 . |
|
|
|
|
Статистики |
равны |
|||||||||||||||||||||
|
|
1 |
|
|
S(x) |
|
|
|
|
|
n − 2 |
|
|
|
2,872 |
8 |
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
t |
0 |
= |
|
β0 |
|
= |
|
|
5,27 |
|
|
≈18,9 и t |
= |
|
β1 |
|
= |
|
2,13 |
≈ 21,96 . По таблице |
(см. |
||||||||||||||||
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
Sb |
|
|
|
|
|
|
0,279 |
|
|
|
|
1 |
|
Sb |
|
|
|
0,097 |
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
приложение табл. 5) находим tкр(8; 0,05)= 2,31. Так как t0 > tкр и |
t1 > tкр, то оба коэффициента значимы. Доверительный интервал для b0 имеет вид
5,27 − 0,279 2,31 < b0 < 5,27 + 0,279 2,31 или 4,626 < b0 < 5,914 . |
До- |
||||
верительный |
интервал |
для |
b1 |
имеет |
вид |
2,13 − 0,097 2,31 < b1 < 2,13 + 0,097 2,31 или 1,906 < b1 < 2,354 .
60. Корреляционное отношение На практике часто предпосылки корреляционного анализа на-
рушаются: один из признаков оказывается неслучайным, или признаки не имеют нормального распределения. Однако статистическая
-94-
связь между ними существует. Для изучения связи между ними в этом случае существует показатель зависимости признаков, основанный на показателе изменчивости общей (или полной) дисперсии.
Полной называется дисперсия признака относительно его математического ожидания. Так для признака У это σ 2y = M (Y − M (y))2.
Дисперсию σ 2y можно разложить на две составляющие, одна из ко-
торых характеризует влияние фактора Х на У, другая - влияние прочих факторов. Очевидно, чем меньше влияние прочих факторов, тем теснее связь, тем более приближается она к функциональной.
По выборочным данным рассчитываем выборочное корреляци-
S 2y
онное отношение η2 = |
|
x |
, где |
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
S 2y |
|
|
|
|
|
|
|
|
|||
S 2 = |
∑ y2m y |
|
∑ yi m y |
|
2 |
|
|
|
1 |
∑(y(x |
|
)− y)2 m |
|
|
|
i |
− |
|
|
|
и S |
y |
= |
|
i |
x |
. Значения |
||||
|
|
|
|
||||||||||||
y |
∑m y |
|
∑m y |
|
|
|
x |
∑m |
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|||||
η2 лежащие в интервале 0 ≤η2 ≤1, |
являются показателями тесноты |
группировки точек около кривой регрессии независимо от её вида
(формы связи). Корреляционное отношение η2 является показателем тесноты группировки точек около кривой регрессии независимо от её
вида (формы связи) и связано с r 2 следующим образом: 0 ≤ r 2 ≤η2 ≤1. В случае линейной зависимости между переменными: r 2 =η2.