Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.06.2024
Просмотров: 236
Скачиваний: 0
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
-86- |
|
|
|
|
|
|
|
|
|||
|
|
Решение. Вычислим x = |
1 |
|
∑xi = |
1 |
(2 +2 +3 +5)= 3; |
|||||||||||||||||||||||
|
|
n |
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
1 |
|
|
1 |
|
|
4 |
|
|
|
1 |
|
|||||||||
|
|
|
|
|
|
|
= |
∑x2 = |
(4 +4 +9 +25)=10,5; y = |
(4 +6 +6 +8)= 6; |
||||||||||||||||||||
|
|
|
|
x2 |
||||||||||||||||||||||||||
|
|
|
|
n |
|
|
|
|||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
i |
4 |
|
|
|
|
|
|
|
|
|
4 |
|
||||||||
|
= |
|
1 |
(16 +36 +36 +64)= 38; |
|
= |
1 |
∑xi |
yi = |
1 |
(8 +12 +18 +40)=19,5; |
|||||||||||||||||||
y2 |
||||||||||||||||||||||||||||||
|
xy |
|||||||||||||||||||||||||||||
4 |
|
|
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
4 |
|
|
||||||||||
S 2 (x)= |
x2 |
− x2 =10,5 −9 =1,5; S 2 (y)= |
y2 |
− y2 = 38 −36 = 2; |
||||||||||||||||||||||||||
|
|
|
|
|
|
− x y |
=19,5 −18 = 1,5 ≈ 0,866. |
|||||||||||||||||||||||
r = |
|
|
|
|
xy |
|||||||||||||||||||||||||
в |
|
|
S 2 (x)S 2 (y) |
3 |
|
|
|
3 |
|
|
|
|
|
|
|
|
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
56. Метод вычисления выборочного коэффициента корреляции для вариационных рядов
Для вычисления выборочного коэффициента корреляции строят корреляционную таблицу. Для этого разбиваем каждый вариационный ряд на интервальный. Затем находятся входящие в формулу для вычисления выборочного коэффициента корреляции параметры.
Пример 51. По данным наблюдений над случайными величинами X и Y получена выборка, приведённая в таблице
№ X |
Y № X |
Y № X |
Y № X |
Y |
|||||||
1 |
7,1 |
10,0 |
14 |
14,8 |
35,3 |
27 |
10,9 |
18,2 |
40 |
16,1 |
30,1 |
2 |
9,5 |
6,7 |
15 |
17,2 |
36,3 |
28 |
11,4 |
18,7 |
41 |
18,2 |
27,2 |
3 |
11,0 |
14,0 |
16 |
19,2 |
37,4 |
29 |
12,3 |
17,6 |
42 |
19,1 |
30,9 |
4 |
12,3 |
15,1 |
17 |
22,3 |
38,0 |
30 |
13,2 |
18,1 |
43 |
17,9 |
35,1 |
5 |
11,8 |
24,2 |
18 |
17,2 |
40,2 |
31 |
13,1 |
24,1 |
44 |
18,7 |
36,1 |
6 |
14,1 |
19,9 |
19 |
19,9 |
42,4 |
32 |
13,6 |
21,3 |
45 |
12,4 |
17,6 |
7 |
15,1 |
24,3 |
20 |
20,1 |
44,5 |
33 |
13,7 |
19,8 |
46 |
12,5 |
18,6 |
8 |
14,7 |
22,2 |
21 |
21,7 |
42,4 |
34 |
14,6 |
24,1 |
47 |
12,7 |
19,2 |
9 |
16,1 |
21,0 |
22 |
8,5 |
12,2 |
35 |
14,2 |
21,3 |
48 |
14,1 |
26,2 |
10 |
13,1 |
30,1 |
23 |
9,7 |
12,4 |
36 |
15,2 |
25,2 |
49 |
14,6 |
27,4 |
11 |
13,8 |
28,1 |
24 |
10,2 |
12,5 |
37 |
16,1 |
21,1 |
50 |
14,9 |
30,1 |
12 |
16,9 |
30,3 |
25 |
11,1 |
12,9 |
38 |
17,2 |
24,6 |
|
|
|
13 |
19,1 |
27,3 |
26 |
11,3 |
16,1 |
39 |
18,0 |
23,3 |
|
|
|
Найдём оптимальные длины интервалов и количество интервалов, используя формулу Стэрджеса. Для переменной Х наименьшее значение - 7,1 наибольшее - 22,3, тогда оптимальное число интервалов равно 7 с шагом, равным 2,2, при этом получаем такие интервалы:
[7,1;9,3),[9,3;11,5),[11,5;13,7),[13,7;15,9), [15,9;18,1),
-87-
[18,1;20,3), [20,3;22,5). Для переменной У минимальное значение - 6,7
наибольшее - 44,5, тогда оптимальное число интервалов 6 с шагом, равным 6,3. Получаем интервалы
[6,7;13,0), [13,0;19,3),[19,3;25,6),[25,6;31,9), [31,9;38,2),[38,2;44,5]. Рас-
пределим наблюдения по полученным интервалам получим корреляционную таблицу. В таблицу вместо интервалов запишем их середины
У |
|
|
|
Х |
|
|
|
ny |
|
8,2 |
10,4 |
12,6 |
14,8 |
17,0 |
19,2 |
21,4 |
|||
|
|
||||||||
9,85 |
2 |
4 |
|
|
|
|
|
6 |
|
16,15 |
|
4 |
6 |
|
|
|
|
10 |
|
22,45 |
|
|
3 |
7 |
4 |
|
|
14 |
|
28,75 |
|
|
1 |
4 |
2 |
3 |
|
10 |
|
35,05 |
|
|
|
1 |
2 |
2 |
1 |
6 |
|
41,35 |
|
|
|
|
1 |
1 |
2 |
4 |
|
nx |
2 |
8 |
10 |
12 |
9 |
6 |
3 |
50 |
Для упрощения |
|
расчётов |
перейдём |
к |
условным |
вариантам |
||||||||||||||||||||||||
ui = |
|
xi −C x |
= |
|
xi −14,8 |
и vi = |
yi −C y |
= |
|
yi −22,45 |
. |
Составим рас- |
||||||||||||||||||
|
|
|
hx |
|
2 |
,2 |
|
|
hy |
|
|
6,3 |
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||
чётную таблицу. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
V |
|
|
|
|
|
|
|
|
|
|
|
|
U |
|
|
|
|
|
|
|
|
|
nv |
|
vi nv |
nvvi2 |
|
|||
|
|
|
|
-3 |
|
|
-2 |
|
-1 |
|
0 |
|
1 |
|
2 |
|
|
|
3 |
|
|
|
||||||||
-2 |
|
|
|
|
2 |
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
6 |
|
|
-12 |
|
24 |
|
||
-1 |
|
|
|
|
|
|
|
4 |
|
6 |
|
|
|
|
|
|
|
|
|
|
|
10 |
|
|
-10 |
|
10 |
|
||
0 |
|
|
|
|
|
|
|
|
|
|
3 |
|
7 |
|
4 |
|
|
|
|
|
|
|
14 |
|
|
0 |
|
0 |
|
|
1 |
|
|
|
|
|
|
|
|
|
|
1 |
|
4 |
|
2 |
|
3 |
|
|
|
|
|
10 |
|
|
10 |
|
10 |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
|
2 |
|
|
|
1 |
|
6 |
|
|
12 |
|
24 |
|
|
3 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
1 |
|
|
|
2 |
|
4 |
|
|
12 |
|
36 |
|
|
nu |
|
|
|
|
2 |
|
|
8 |
|
10 |
12 |
|
9 |
|
6 |
|
|
|
3 |
|
50 |
|
|
12 |
|
104 |
|
|||
nuui |
|
-6 |
|
|
-16 |
-10 |
0 |
|
9 |
|
12 |
|
|
9 |
|
|
|
|
-2 |
|
|
|
||||||||
nuui2 |
|
18 |
|
|
32 |
|
10 |
0 |
|
9 |
|
24 |
|
|
27 |
|
|
|
|
120 |
|
|
|
|||||||
v |
i |
|
|
|
|
-2 |
|
|
-1,5 |
|
-0,5 |
0,5 |
|
1 |
|
53 |
|
|
83 |
|
|
|
|
|
|
|
|
|||
nuui |
v |
i |
|
12 |
|
|
24 |
|
5 |
|
0 |
|
9 |
|
20 |
|
|
24 |
|
|
|
|
94 |
|
|
|
-88-
Для вычисления выборочного коэффициента корреляции используем
формулу |
r |
|
|
= |
|
uv −u |
v |
, |
|
где |
u = |
1 |
∑n |
u |
= |
1 |
(−2)= −0,04; |
|||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
в |
|
|
|
|
|
S2(u)S2(v) |
|
|
|
|
|
|
n |
|
u |
i |
50 |
|
|
||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
120 |
|
|
|
|
|
|
|
|
|
|
|
2,4 −(−0,04)2 ≈1,549; |
|||||||||||||||||
|
|
|
= |
∑n u2 = |
= 2,4; |
|
S(u)= u2 |
−u2 = |
|
|||||||||||||||||||||||||||||||||||||
u2 |
|
|
||||||||||||||||||||||||||||||||||||||||||||
|
|
n |
|
|
|
|
||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
u |
i |
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||
|
|
|
12 |
|
|
|
|
|
|
|
|
|
|
|
|
= |
|
104 |
=2,08; |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
v |
= |
|
=0,24; v |
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
|
|
|
|
|
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||
50 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
94 |
|
||||||||||
|
S(v)= |
|
|
|
v2 |
−( |
v |
)2 = |
|
|
2,08−0,242 ≈1,422; |
|
|
= |
∑nuui |
v |
i = |
=1,88; |
||||||||||||||||||||||||||||
|
|
|
|
|
|
|
uv |
|||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
n |
|
||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
−u |
v |
|
|
|
|
|
1,88 +0,04 0,24 |
|
|
|
|
|
|
|
|
|
|
50 |
|
||||||||||||||||||
r = |
|
uv |
|
|
≈ |
|
≈ 0,854. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
S(u)S(v) |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||
|
в |
|
|
|
|
|
|
1,549 1,422 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
57. Проверка гипотезы о значимости коэффициента корреляции
На практике коэффициент корреляции r обычно неизвестен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции rв. Равенство нулю выборочного
коэффициента корреляции ещё не свидетельствует о равенстве нулю самого коэффициента корреляции, а следовательно, о некоррелированности случайных величин Х и У. Чтобы выяснить, находятся ли случайные величины в корреляционной зависимости, нужно проверить значимость выборочного коэффициента корреляции rв, то есть
установить, достаточна ли его величина для обоснованного вывода о наличии корреляционной связи. Для этого проверяют нулевую гипотезу H0 : r = 0. Предполагается наличие двухмерного нормального
распределения случайных переменных; объём выборки может быть
любым. Вычисляют статистику t = r |
n −2 |
, которая имеет распре- |
в |
1−r 2 |
|
|
в |
|
деление Стьюдента с k = n −2 степенями свободы. Для проверки нулевой гипотезы по уровню значимости α и числу степеней свободы k находят по таблице распределения Стьюдента критическое значе-
-89-
ние tα ,k . Если t ≥ tα ,k , то нулевую гипотезу об отсутствии корреля-
ционной связи между переменными Х и У следует отвергнуть. Переменные считают зависимыми. При t < tα ,k , нет оснований отверг-
нуть нулевую гипотезу.
В случае значимого выборочного коэффициента корреляции есть смысл построить доверительный интервал для коэффициента корреляции r . Однако для этого нужно знать закон распределения выборочного коэффициента корреляции rв. Плотность вероятности
выборочного коэффициента корреляции имеет сложный вид, поэтому прибегают к специально подобранным функциям от выборочного коэффициента корреляции, которые сводятся к хорошо изученным распределениям, например к нормальному или Стьюдента. Чаще всего для подбора функции применяют преобразование Фишера. Вычис-
|
|
1 |
|
1 |
+rв |
|
|
|
||
ляют статистику |
z = |
|
|
, где rв = th z |
- гиперболический тан- |
|||||
|
|
|
|
|||||||
|
1 |
|
||||||||
2 ln |
−r |
|||||||||
|
|
|
|
|
|
в |
|
|
генс от z . Распределение статистики z хорошо аппроксимируется
нормальным |
|
|
|
|
|
распределением |
|
|
с |
|
параметрами |
|||||||||||||
M (z)= |
1 |
|
1 |
+r |
|
|
r |
|
σ 2 |
|
1 |
|
|
|
|
|
|
|
||||||
|
|
ln |
|
|
|
|
|
+ |
|
|
|
, |
= |
|
|
|
. В этом случае доверитель- |
|||||||
2 |
1 |
|
2(n −1) |
n − |
3 |
|||||||||||||||||||
|
|
−r |
|
|
z |
|
|
|
|
|
|
|||||||||||||
ный интервал для r |
имеет вид th z1 < r < th z2 . Величины z1 и z2 на- |
|||||||||||||||||||||||
ходятся по формулам z = 1 ln1+rв − |
|
|
zα ; z |
2 |
= 1 ln1+rв + |
zα |
, |
|||||||||||||||||
|
|
|
||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
2 |
1 |
−r |
|
|
n −3 |
2 1−r |
n −3 |
|||
|
|
|
|
|
|
1 |
−α |
|
|
|
|
|
|
|
|
в |
|
|
|
|
в |
|
|
|
где Ф(z |
)= |
. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
α |
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Пример 52. Проверить значимость выборочного коэффициента корреляции из примера 51 и найти доверительный интервал с надёж-
ностью 0,95 для него. |
|
|
|
|
|
|
Решение. Для |
проверки значимости |
найдём |
статистику |
|
t = r |
n −2 = 0,854 |
48 |
≈11,37 . По |
уровню |
значимости |
в |
1−r 2 |
1−0,8542 |
|
|
|
|
в |
|
|
|
|
α = 0,05 и числу степеней свободы k = 48 найдём tα ,k = 2,009 (см. приложение табл.3). Так как t ≥ tα ,k , то нулевую гипотезу об отсут-
ствии корреляционной связи между переменными Х и У следует отвергнуть. Следовательно, выборочный коэффициент корреляции зна-