Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.06.2024

Просмотров: 243

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

-90-

чим. Найдём доверительный интервал для выборочного коэффициен-

та

 

корреляции,

 

вычислим

z = 1 ln1

+0

,854

1,96

0,9849 ,

 

 

 

 

 

 

1

2

1

0

,854

50 3

 

 

 

 

= 1 ln 1,854 + 1,96

 

 

 

 

z

2

1,5566 ,

тогда

 

th z

= th0,9849 0,755

и

 

 

2 0,146

47

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

th z2 = th1,5566 0,9149 . Следовательно, доверительный

интервал

для

выборочного

коэффициента

 

корреляции

имеет

вид

0,755 < r < 0,9149.

 

 

 

 

 

 

 

 

 

58. Эмпирическая и теоретическая линии регрессии

Определить форму связи – значит выявить механизм получения зависимой случайной величины.

Кривой регрессии У по Х (или Х по У) называют условное среднее значение случайной величины У, рассматриваемое как функция определённого класса, параметры которой находятся методом наименьших квадратов по наблюдённым значениям двухмерной случайной величины. То есть уравнение линейной регрессии имеет вид y = β0 + β1x . Оценке в этом случае подлежат параметры β0 и β1,

называемые коэффициентами регрессии, а также σост2 - остаточная

дисперсия. Остаточной дисперсией называется та часть рассеивания результативного признака, которую нельзя объяснить действием наблюдаемого признака.

Пример 53. Построить эмпирическую и теоретическую линии регрессии по данным примера 51.

Решение. Уравнение теоретической линии регрессии имеет вид

y = r

S(y)

(x x)+ y ,

 

 

 

 

 

 

 

 

 

 

в S(x)

 

 

 

где: x = hxu +C x = 2,2 (0,04)+14,8 =14,792,

 

 

y = hy

v

+C y = 6,3 0,24 +22,45 = 23,962 ,

 

 

S(x)= hx S(u)2,2 1,549 3,408,

S(y)= hy S(v)6,3 1,422 8,959 .

Тогда

 

 

 

 

уравнение

регрессии

имеет

вид

y = 0,854

8,959

(x 14,792)+23,962 или y = 2,245x 9,245.

Для по-

 

 

3,408

 

 

 

 


-91-

строения возьмём точки (8,2;9,2) и (21,4;38,8). При построении эмпирической линии регрессии используем точки вида (xi ; yi ), где значения yi находятся по формуле yi = hyvi +C y . Получаем

y1 = −2 6,3 +22,45 = 9,85,

y2 = −1,5 6,3 + 22,45 =13, y3 = −0,5 6,3 +22,45 =19,3, y4 = 0,5 6,3 +22,45 = 25,6 , y5 = 6,3 +22,45 = 28,75,

y6 =

4

6,3 +22

,45 = 30,85 , y7 =

8

6,3 +22,45 = 39,25 . Построим на

 

 

3

 

 

 

3

плоскости

точки с координатами (8,2;9,9), (10,4;13), (12,6;19,3),

(14,8;25,6),

(17

;28,8), (19,2;30,9),

(21,4;39,3) и, соединив их в порядке

возрастания х, получим эмпирическую линию регрессии.

45

40

35

30

25

20

15

10

5

0

0

5

10

15

20

25

5

9. Значимость коэффициентов регрессии Проверить значимость оценок коэффициентов регрессии – зна-

чит установить, достаточна ли величина оценки для статистически обоснованного вывода о том, что коэффициенты регрессии отличны от нуля. Для этого проверяют гипотезу о равенстве нулю коэффициентов регрессии, соблюдая предпосылки нормальной регрессии.

Вычисляем статистику t =

 

b

 

, которая имеет k = n 2 степе-

Sb

 

 

 

ней свободы, b – оценка коэффициента регрессии, Sb - оценка сред-

него квадратического отклонения коэффициента, иначе стандартная ошибка оценки. По уровню значимости и числу степеней свободы по


-92-

таблице находят tα ,k . Если t > tα ,k , то гипотезу о равенстве нулю

коэффициента регрессии отвергают, следовательно при заданном уровне значимости коэффициент регрессии значим. Оценки среднего

квадратического отклонения находятся по формулам Sb

=

Sост

,

 

 

 

 

 

 

 

0

 

n 2

 

Sост

 

 

 

 

 

 

 

 

 

Sb =

,

где

S(x)=

1

(xi x)2

 

 

и

S(x) n 2

n

 

 

1

 

 

 

 

 

 

 

 

Sост2 = n 12 (yi y(xi ))2 .

Доверительные интервалы для коэффициентов регрессии находятся по формулам b tα ,k Sb < β < b +tα ,k Sb .

Пример 54. Найти коэффициенты регрессии, проверить их значимость и построить доверительные интервалы при уровне значимости α = 0,05 по данной выборке

 

xi

 

 

 

 

 

 

1

 

 

2

3

 

 

 

4

 

5

 

6

7

8

9

10

 

 

yi

 

 

 

 

 

7

 

 

 

9

 

 

11

15

 

15

 

19

20

23

24

27

по формулам

 

 

 

 

 

 

 

 

 

Решение.

 

Найдём

коэффициенты

регрессии

 

β

1

 

=

 

 

 

 

 

xy x y

и β

0

= y β

1

x . Вычислим значения входящих в фор-

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x2 (x)2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

мулы величин:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x =

 

1

xi =

 

1

 

(1+2 +3 +4 +5 +6 +7 +8 +9 +10)= 5,5,

 

 

 

 

 

10

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y =

1

 

 

yi

=

 

1

 

 

(7 +9 +11+15 +15 +19 +20 +23 +24 +27)=17 ,

n

 

 

 

 

 

 

 

 

 

 

1

 

(12

10

 

 

+32 +42 +52 +62 +72 +82 +92 +102 )= 38,5 ,

 

 

 

 

=

 

 

 

 

 

+22

 

 

x

2

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

(72

 

 

 

 

 

 

+112 +152 +152 +192 +202 +232 +242 +272 )=329,6,

 

 

 

=

 

 

 

 

 

1

 

+92

 

 

y

2

 

 

 

 

 

 

 

 

10

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xy =101 (7 +2 9 +3 11+4 15 +5 15 +6 19 +7 20 +8 23+9 24 +270)= =111,1.


-93-

Тогда

 

 

β =

 

 

 

111,15,5 17

2,13

и

β

0

=17 2,13 5,5 5,27 , следова-

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

38,5 5,52

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y = 2,13x +5,27 .

Проверим

тельно, уравнение регрессии имеет вид

значимость

 

 

 

коэффициентов

регрессии.

Для

этого

вычислим

S(x)=

 

 

 

 

 

 

 

(x)2 =

38,5 5,52 2,872 .

 

 

y(xi ),

 

 

 

 

x2

Найдём

используя

уравнение регрессии

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y(1)

7,4; y

(2)9,53; y(3)11,66; y(4)13,79;

 

 

 

y(5)15,92; y(6)

18,05; y

(7)20,18; y(8)

22,31; y(9)24,44;

 

y(10)26,57 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Найдём

 

 

 

 

 

остаточную

 

 

 

дисперсию

по

формуле

S2

 

 

=

 

 

1

 

 

(y y(x ))2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ост

 

 

 

 

 

 

 

i

 

 

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=

1

(0,42

+0,532 +0,662 +1,212 +0,922 +0,952 +0,182 +0,692 +0,442 +0,432)Вы-

 

 

 

8

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

0,622

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sост =

0,7887 0,279

 

числим

 

 

 

Sост 0,7887 ,

тогда

 

Sb

 

=

и

 

 

 

 

 

 

 

 

 

 

Sост

 

 

 

0,7887

 

 

 

 

 

0

 

 

n 2

8

 

 

Sb

 

=

 

 

 

 

 

 

=

0,097 .

 

 

 

 

Статистики

равны

 

 

1

 

 

S(x)

 

 

 

 

 

n 2

 

 

 

2,872

8

 

 

 

 

 

 

 

 

 

 

 

 

 

t

0

=

 

β0

 

=

 

 

5,27

 

 

18,9 и t

=

 

β1

 

=

 

2,13

21,96 . По таблице

(см.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Sb

 

 

 

 

 

 

0,279

 

 

 

 

1

 

Sb

 

 

 

0,097

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

приложение табл. 5) находим tкр(8; 0,05)= 2,31. Так как t0 > tкр и

t1 > tкр, то оба коэффициента значимы. Доверительный интервал для b0 имеет вид

5,27 0,279 2,31 < b0 < 5,27 + 0,279 2,31 или 4,626 < b0 < 5,914 .

До-

верительный

интервал

для

b1

имеет

вид

2,13 0,097 2,31 < b1 < 2,13 + 0,097 2,31 или 1,906 < b1 < 2,354 .

60. Корреляционное отношение На практике часто предпосылки корреляционного анализа на-

рушаются: один из признаков оказывается неслучайным, или признаки не имеют нормального распределения. Однако статистическая


-94-

связь между ними существует. Для изучения связи между ними в этом случае существует показатель зависимости признаков, основанный на показателе изменчивости общей (или полной) дисперсии.

Полной называется дисперсия признака относительно его математического ожидания. Так для признака У это σ 2y = M (Y M (y))2.

Дисперсию σ 2y можно разложить на две составляющие, одна из ко-

торых характеризует влияние фактора Х на У, другая - влияние прочих факторов. Очевидно, чем меньше влияние прочих факторов, тем теснее связь, тем более приближается она к функциональной.

По выборочным данным рассчитываем выборочное корреляци-

S 2y

онное отношение η2 =

 

x

, где

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

S 2y

 

 

 

 

 

 

 

 

S 2 =

y2m y

 

yi m y

 

2

 

 

 

1

(y(x

 

)y)2 m

 

 

i

 

 

 

и S

y

=

 

i

x

. Значения

 

 

 

 

y

m y

 

m y

 

 

 

x

m

 

 

 

 

 

 

 

 

 

 

 

 

 

 

η2 лежащие в интервале 0 η2 1,

являются показателями тесноты

группировки точек около кривой регрессии независимо от её вида

(формы связи). Корреляционное отношение η2 является показателем тесноты группировки точек около кривой регрессии независимо от её

вида (формы связи) и связано с r 2 следующим образом: 0 r 2 η2 1. В случае линейной зависимости между переменными: r 2 =η2.