Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов всех специальностей.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.06.2024

Просмотров: 262

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

87

X

Y

X

Y

X

Y

X

Y

1

7,1

10,0

14

14,8

35,3

27

10,9

18,2

40

16,1

30,1

2

9,5

6,7

15

17,2

36,3

28

11,4

18,7

41

18,2

27,2

3

11,0

14,0

16

19,2

37,4

29

12,3

17,6

42

19,1

30,9

4

12,3

15,1

17

22,3

38,0

30

13,2

18,1

43

17,9

35,1

5

11,8

24,2

18

17,2

40,2

31

13,1

24,1

44

18,7

36,1

6

14,1

19,9

19

19,9

42,4

32

13,6

21,3

45

12,4

17,6

7

15,1

24,3

20

20,1

44,5

33

13,7

19,8

46

12,5

18,6

8

14,7

22,2

21

21,7

42,4

34

14,6

24,1

47

12,7

19,2

9

16,1

21,0

22

8,5

12,2

35

14,2

21,3

48

14,1

26,2

10

13,1

30,1

23

9,7

12,4

36

15,2

25,2

49

14,6

27,4

11

13,8

28,1

24

10,2

12,5

37

16,1

21,1

50

14,9

30,1

12

16,9

30,3

25

11,1

12,9

38

17,2

24,6

 

 

 

13

19,1

27,3

26

11,3

16,1

39

18,0

23,3

 

 

 

Найдём оптимальные длины интервалов и количество интервалов, используя формулу Стэрджеса. Для переменной Х наименьшее значение - 7,1 наибольшее - 22,3, тогда оптимальное число интервалов равно 7 с шагом, равным 2,2, при этом получаем такие ин-

тервалы: [7,1;9,3),[9,3;11,5),[11,5;13,7),[13,7;15,9), [15,9;18,1),

[18,1;20,3), [20,3;22,5). Для переменной У минимальное значение -

6,7 наибольшее - 44,5, тогда оптимальное число интервалов 6 с шагом, равным 6,3. Получаем интервалы

[6,7;13,0), [13,0;19,3),[19,3;25,6),[25,6;31,9), [31,9;38,2),[38,2;44,5].

Распределим наблюдения по полученным интервалам получим корреляционную таблицу. В таблицу вместо интервалов запишем их середины

У

 

 

 

 

 

 

Х

ny

8,2

10,4

12,6

14,8

17,0

19,2

21,4

9,85

2

4

 

 

 

 

 

6

16,15

 

4

6

 

 

 

 

10

22,45

 

 

3

7

4

 

 

14

28,75

 

 

1

4

2

3

 

10

35,05

 

 

 

1

2

2

1

6

41,35

 

 

 

 

1

1

2

4

nx

2

8

10

12

9

6

3

50


88

Для упрощения расчётов перейдём к условным вариантам

ui =

 

xi C x

=

 

xi 14,8

и vi =

yi C y

=

yi 22

,45

. Составим рас-

 

 

 

hx

 

2

,2

 

hy

 

6,3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

чётную таблицу.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

V

 

 

 

 

 

 

 

 

 

 

 

 

 

U

 

 

 

 

 

 

nv

vi nv

nvvi2

 

 

 

 

-3

 

 

-2

 

-1

 

 

0

1

 

2

 

3

 

-2

 

 

 

 

2

 

 

4

 

 

 

 

 

 

 

 

 

 

 

6

-12

24

-1

 

 

 

 

 

 

 

4

 

6

 

 

 

 

 

 

 

 

 

10

-10

10

0

 

 

 

 

 

 

 

 

 

 

3

 

 

7

4

 

 

 

 

 

14

0

0

1

 

 

 

 

 

 

 

 

 

 

1

 

 

4

2

 

3

 

 

 

10

10

10

2

 

 

 

 

 

 

 

 

 

 

 

 

 

1

2

 

2

 

1

 

6

12

24

3

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

1

 

2

 

4

12

36

nu

 

 

 

 

2

 

 

8

 

10

 

12

9

 

6

 

3

 

50

12

104

nuui

 

-6

 

 

-16

-10

 

0

9

12

 

9

 

 

 

 

-2

 

nuui2

 

18

 

 

32

 

10

 

0

9

24

 

27

 

 

 

 

120

 

v

i

 

 

 

 

-2

 

 

-1,5

 

-0,5

 

0,5

1

53

 

83

 

 

 

 

 

 

nuui

v

i

 

12

 

 

24

 

5

 

 

0

9

20

 

24

 

 

 

 

94

 

Для вычисления выборочного коэффициента корреляции исполь-

зуем формулу

r =

 

uv u

v

 

 

,

где u =

1

n

u =

1

(2)=−0,04;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в

S2(u)S2(v)

 

 

 

 

n

 

u

i

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

120

 

 

 

 

 

 

 

 

2,4 (0,04)2 1,549;

 

 

 

 

=

 

 

 

 

 

u2 =

= 2,4; S(u)=

 

u2 u2 =

 

u2

n

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

u

 

i

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

=

104

=2,08;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

v

 

=

 

=0,24; v

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

50

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

94

 

 

S(v)=

 

 

 

 

(

v

)2 =

2,080,242 1,422;

 

=

 

 

 

 

 

 

 

v2

nuui

v

i =

=1,88;

 

 

 

 

uv

 

 

 

 

n

50

 

 

 

 

 

 

 

 

 

 

 

u

v

 

 

 

 

1,88 +0,04 0,24

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

r

=

 

uv

 

 

0,854.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S(u)S(v)

 

1,549 1,422

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

57. Проверка гипотезы о значимости коэффициента корреляции

На практике коэффициент корреляции r обычно неизвестен. По результатам выборки может быть найдена его точечная оценка

– выборочный коэффициент корреляции rв. Равенство нулю вы-


89

борочного коэффициента корреляции ещё не свидетельствует о равенстве нулю самого коэффициента корреляции, а следовательно, о некоррелированности случайных величин Х и У. Чтобы выяснить, находятся ли случайные величины в корреляционной зависимости, нужно проверить значимость выборочного коэффициента корреляции rв, то есть установить, достаточна ли его вели-

чина для обоснованного вывода о наличии корреляционной связи. Для этого проверяют нулевую гипотезу H0 : r = 0. Предполагает-

ся наличие двухмерного нормального распределения случайных переменных; объём выборки может быть любым. Вычисляют ста-

тистику t = r

n 2

, которая имеет распределение Стьюдента с

в

1r 2

 

 

в

 

k = n 2 степенями свободы. Для проверки нулевой гипотезы по уровню значимости α и числу степеней свободы k находят по таблице распределения Стьюдента критическое значение tα ,k .

Если t tα ,k , то нулевую гипотезу об отсутствии корреляцион-

ной связи между переменными Х и У следует отвергнуть. Переменные считают зависимыми. При t < tα ,k , нет оснований от-

вергнуть нулевую гипотезу.

В случае значимого выборочного коэффициента корреляции есть смысл построить доверительный интервал для коэффициента корреляции r . Однако для этого нужно знать закон распределения выборочного коэффициента корреляции rв. Плотность вероятно-

сти выборочного коэффициента корреляции имеет сложный вид, поэтому прибегают к специально подобранным функциям от выборочного коэффициента корреляции, которые сводятся к хорошо изученным распределениям, например к нормальному или Стьюдента. Чаще всего для подбора функции применяют преобразова-

 

 

1

 

1

+rв

 

 

ние Фишера. Вычисляют статистику

z =

 

 

, где rв = th z -

 

 

 

 

 

1

 

2 ln

r

 

 

 

 

 

 

в

 

гиперболический тангенс от z . Распределение статистики z хорошо аппроксимируется нормальным распределением с парамет-

 

M (z)=

1

 

1

+r

 

рами

 

ln

 

 

 

 

+

2

1

r

рительный интервал для

r

σz2

1

 

 

,

=

 

. В этом случае дове-

2(n 1)

n 3

r имеет вид th z1 < r < th z2 . Величины z1



90

и

 

z

2

 

находятся

по формулам z

= 1 ln1

+rв

zα ;

 

 

 

 

 

 

 

 

1

r

n 3

 

 

 

 

 

 

 

 

 

 

 

2 1

 

 

= 1 ln1

+rв +

zα

 

1

α

 

 

в

 

z

2

, где Ф(z )=

.

 

 

 

 

 

 

 

 

 

2

1

r

n 3

α

2

 

 

 

 

 

 

 

 

 

в

 

 

 

 

 

 

 

 

Пример 52. Проверить значимость выборочного коэффициента корреляции из примера 51 и найти доверительный интервал с надёжностью 0,95 для него.

Решение. Для проверки значимости найдём статистику

t = r

n 2

= 0,854

48

11,37 . По

уровню

значимости

в

1r 2

 

10,8542

 

 

 

 

в

 

 

 

 

 

α = 0,05 и числу степеней свободы k = 48

найдём

tα ,k = 2,009

(см. приложение табл.3). Так как t tα ,k , то нулевую гипотезу об

отсутствии корреляционной связи между переменными Х и У следует отвергнуть. Следовательно, выборочный коэффициент корреляции значим. Найдём доверительный интервал для выборочного коэффициента корреляции, вычислим

z = 1 ln1

+0,854

1,96

0,9849 , z

2

= 1 ln 1,854

+ 1,96

1,5566 ,

1

2 1

0,854

50 3

 

2 0

,146

47

 

 

 

 

 

тогда th z1 = th0,9849 0,755 и th z2 = th1,5566 0,9149 . Следова-

тельно, доверительный интервал для выборочного коэффициента корреляции имеет вид 0,755 < r < 0,9149.

58. Эмпирическая и теоретическая линии регрессии

Определить форму связи – значит выявить механизм получения зависимой случайной величины.

Кривой регрессии У по Х (или Х по У) называют условное среднее значение случайной величины У, рассматриваемое как функция определённого класса, параметры которой находятся методом наименьших квадратов по наблюдённым значениям двухмерной случайной величины. То есть уравнение линейной регрессии имеет вид y = β0 + β1x . Оценке в этом случае подлежат па-

раметры β0 и β1, называемые коэффициентами регрессии, а также σост2 - остаточная дисперсия. Остаточной дисперсией называ-