Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.06.2024

Просмотров: 202

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

-86-

 

 

 

 

 

 

 

 

 

 

Решение. Вычислим x =

1

 

xi =

1

(2 +2 +3 +5)= 3;

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

1

 

 

4

 

 

 

1

 

 

 

 

 

 

 

 

=

x2 =

(4 +4 +9 +25)=10,5; y =

(4 +6 +6 +8)= 6;

 

 

 

 

x2

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

i

4

 

 

 

 

 

 

 

 

 

4

 

 

=

 

1

(16 +36 +36 +64)= 38;

 

=

1

xi

yi =

1

(8 +12 +18 +40)=19,5;

y2

 

xy

4

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

4

 

 

S 2 (x)=

x2

x2 =10,5 9 =1,5; S 2 (y)=

y2

y2 = 38 36 = 2;

 

 

 

 

 

 

x y

=19,5 18 = 1,5 0,866.

r =

 

 

 

 

xy

в

 

 

S 2 (x)S 2 (y)

3

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

56. Метод вычисления выборочного коэффициента корреляции для вариационных рядов

Для вычисления выборочного коэффициента корреляции строят корреляционную таблицу. Для этого разбиваем каждый вариационный ряд на интервальный. Затем находятся входящие в формулу для вычисления выборочного коэффициента корреляции параметры.

Пример 51. По данным наблюдений над случайными величинами X и Y получена выборка, приведённая в таблице

№ X

Y № X

Y № X

Y № X

Y

1

7,1

10,0

14

14,8

35,3

27

10,9

18,2

40

16,1

30,1

2

9,5

6,7

15

17,2

36,3

28

11,4

18,7

41

18,2

27,2

3

11,0

14,0

16

19,2

37,4

29

12,3

17,6

42

19,1

30,9

4

12,3

15,1

17

22,3

38,0

30

13,2

18,1

43

17,9

35,1

5

11,8

24,2

18

17,2

40,2

31

13,1

24,1

44

18,7

36,1

6

14,1

19,9

19

19,9

42,4

32

13,6

21,3

45

12,4

17,6

7

15,1

24,3

20

20,1

44,5

33

13,7

19,8

46

12,5

18,6

8

14,7

22,2

21

21,7

42,4

34

14,6

24,1

47

12,7

19,2

9

16,1

21,0

22

8,5

12,2

35

14,2

21,3

48

14,1

26,2

10

13,1

30,1

23

9,7

12,4

36

15,2

25,2

49

14,6

27,4

11

13,8

28,1

24

10,2

12,5

37

16,1

21,1

50

14,9

30,1

12

16,9

30,3

25

11,1

12,9

38

17,2

24,6

 

 

 

13

19,1

27,3

26

11,3

16,1

39

18,0

23,3

 

 

 

Найдём оптимальные длины интервалов и количество интервалов, используя формулу Стэрджеса. Для переменной Х наименьшее значение - 7,1 наибольшее - 22,3, тогда оптимальное число интервалов равно 7 с шагом, равным 2,2, при этом получаем такие интервалы:

[7,1;9,3),[9,3;11,5),[11,5;13,7),[13,7;15,9), [15,9;18,1),


-87-

[18,1;20,3), [20,3;22,5). Для переменной У минимальное значение - 6,7

наибольшее - 44,5, тогда оптимальное число интервалов 6 с шагом, равным 6,3. Получаем интервалы

[6,7;13,0), [13,0;19,3),[19,3;25,6),[25,6;31,9), [31,9;38,2),[38,2;44,5]. Рас-

пределим наблюдения по полученным интервалам получим корреляционную таблицу. В таблицу вместо интервалов запишем их середины

У

 

 

 

Х

 

 

 

ny

8,2

10,4

12,6

14,8

17,0

19,2

21,4

 

 

9,85

2

4

 

 

 

 

 

6

16,15

 

4

6

 

 

 

 

10

22,45

 

 

3

7

4

 

 

14

28,75

 

 

1

4

2

3

 

10

35,05

 

 

 

1

2

2

1

6

41,35

 

 

 

 

1

1

2

4

nx

2

8

10

12

9

6

3

50

Для упрощения

 

расчётов

перейдём

к

условным

вариантам

ui =

 

xi C x

=

 

xi 14,8

и vi =

yi C y

=

 

yi 22,45

.

Составим рас-

 

 

 

hx

 

2

,2

 

 

hy

 

 

6,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чётную таблицу.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

 

 

 

nv

 

vi nv

nvvi2

 

 

 

 

 

-3

 

 

-2

 

-1

 

0

 

1

 

2

 

 

 

3

 

 

 

-2

 

 

 

 

2

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

 

6

 

 

-12

 

24

 

-1

 

 

 

 

 

 

 

4

 

6

 

 

 

 

 

 

 

 

 

 

 

10

 

 

-10

 

10

 

0

 

 

 

 

 

 

 

 

 

 

3

 

7

 

4

 

 

 

 

 

 

 

14

 

 

0

 

0

 

1

 

 

 

 

 

 

 

 

 

 

1

 

4

 

2

 

3

 

 

 

 

 

10

 

 

10

 

10

 

2

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

 

2

 

 

 

1

 

6

 

 

12

 

24

 

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

 

 

2

 

4

 

 

12

 

36

 

nu

 

 

 

 

2

 

 

8

 

10

12

 

9

 

6

 

 

 

3

 

50

 

 

12

 

104

 

nuui

 

-6

 

 

-16

-10

0

 

9

 

12

 

 

9

 

 

 

 

-2

 

 

 

nuui2

 

18

 

 

32

 

10

0

 

9

 

24

 

 

27

 

 

 

 

120

 

 

 

v

i

 

 

 

 

-2

 

 

-1,5

 

-0,5

0,5

 

1

 

53

 

 

83

 

 

 

 

 

 

 

 

nuui

v

i

 

12

 

 

24

 

5

 

0

 

9

 

20

 

 

24

 

 

 

 

94

 

 

 


-88-

Для вычисления выборочного коэффициента корреляции используем

формулу

r

 

 

=

 

uv u

v

,

 

где

u =

1

n

u

=

1

(2)= −0,04;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

S2(u)S2(v)

 

 

 

 

 

 

n

 

u

i

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

 

 

 

2,4 (0,04)2 1,549;

 

 

 

=

n u2 =

= 2,4;

 

S(u)= u2

u2 =

 

u2

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

u

i

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

=

 

104

=2,08;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

=

 

=0,24; v

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

94

 

 

S(v)=

 

 

 

v2

(

v

)2 =

 

 

2,080,242 1,422;

 

 

=

nuui

v

i =

=1,88;

 

 

 

 

 

 

 

uv

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

u

v

 

 

 

 

 

1,88 +0,04 0,24

 

 

 

 

 

 

 

 

 

 

50

 

r =

 

uv

 

 

 

0,854.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(u)S(v)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

1,549 1,422

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

57. Проверка гипотезы о значимости коэффициента корреляции

На практике коэффициент корреляции r обычно неизвестен. По результатам выборки может быть найдена его точечная оценка – выборочный коэффициент корреляции rв. Равенство нулю выборочного

коэффициента корреляции ещё не свидетельствует о равенстве нулю самого коэффициента корреляции, а следовательно, о некоррелированности случайных величин Х и У. Чтобы выяснить, находятся ли случайные величины в корреляционной зависимости, нужно проверить значимость выборочного коэффициента корреляции rв, то есть

установить, достаточна ли его величина для обоснованного вывода о наличии корреляционной связи. Для этого проверяют нулевую гипотезу H0 : r = 0. Предполагается наличие двухмерного нормального

распределения случайных переменных; объём выборки может быть

любым. Вычисляют статистику t = r

n 2

, которая имеет распре-

в

1r 2

 

 

в

 

деление Стьюдента с k = n 2 степенями свободы. Для проверки нулевой гипотезы по уровню значимости α и числу степеней свободы k находят по таблице распределения Стьюдента критическое значе-


-89-

ние tα ,k . Если t tα ,k , то нулевую гипотезу об отсутствии корреля-

ционной связи между переменными Х и У следует отвергнуть. Переменные считают зависимыми. При t < tα ,k , нет оснований отверг-

нуть нулевую гипотезу.

В случае значимого выборочного коэффициента корреляции есть смысл построить доверительный интервал для коэффициента корреляции r . Однако для этого нужно знать закон распределения выборочного коэффициента корреляции rв. Плотность вероятности

выборочного коэффициента корреляции имеет сложный вид, поэтому прибегают к специально подобранным функциям от выборочного коэффициента корреляции, которые сводятся к хорошо изученным распределениям, например к нормальному или Стьюдента. Чаще всего для подбора функции применяют преобразование Фишера. Вычис-

 

 

1

 

1

+rв

 

 

 

ляют статистику

z =

 

 

, где rв = th z

- гиперболический тан-

 

 

 

 

 

1

 

2 ln

r

 

 

 

 

 

 

в

 

 

генс от z . Распределение статистики z хорошо аппроксимируется

нормальным

 

 

 

 

 

распределением

 

 

с

 

параметрами

M (z)=

1

 

1

+r

 

 

r

 

σ 2

 

1

 

 

 

 

 

 

 

 

 

ln

 

 

 

 

 

+

 

 

 

,

=

 

 

 

. В этом случае доверитель-

2

1

 

2(n 1)

n

3

 

 

r

 

 

z

 

 

 

 

 

 

ный интервал для r

имеет вид th z1 < r < th z2 . Величины z1 и z2 на-

ходятся по формулам z = 1 ln1+rв

 

 

zα ; z

2

= 1 ln1+rв +

zα

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

2

1

r

 

 

n 3

2 1r

n 3

 

 

 

 

 

 

1

α

 

 

 

 

 

 

 

 

в

 

 

 

 

в

 

 

где Ф(z

)=

.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

α

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Пример 52. Проверить значимость выборочного коэффициента корреляции из примера 51 и найти доверительный интервал с надёж-

ностью 0,95 для него.

 

 

 

 

 

Решение. Для

проверки значимости

найдём

статистику

t = r

n 2 = 0,854

48

11,37 . По

уровню

значимости

в

1r 2

10,8542

 

 

 

 

в

 

 

 

 

α = 0,05 и числу степеней свободы k = 48 найдём tα ,k = 2,009 (см. приложение табл.3). Так как t tα ,k , то нулевую гипотезу об отсут-

ствии корреляционной связи между переменными Х и У следует отвергнуть. Следовательно, выборочный коэффициент корреляции зна-