Файл: Т.М. Сергеева Парная корреляция.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 19.06.2024

Просмотров: 82

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

6

Используя данные из табл. 3, по формулам (6) и (7) вычисляем

b =

27 117 ,56 29,2 77,7

= 2,05 ;

27 47,92 ( 29,2 )2

 

 

a = 2,88–2,05·1,08 = 0,666.

Уравнение связи между себестоимостью строительства и численностью рабочих имеет выражение

~y = 0,666+2,05 x. (8)

Коэффициент корреляции между этими показателями определяем по формуле (1):

r =

27 117,56 29,2 77,7

= 0,99.

27 47,92 ( 29,2 )2 27 293,38 (77,7 )2

Корреляционная зависимость между себестоимостью и численностью рабочих в организации выражается в виде прямой линии, r приближается к единице, это означает, что зависимость между параметрами приближается к функциональной.

ПРИМЕР 2. Установить корреляционную зависимость между y (выработкой на одного рабочего в тысячах рублей) и x (коэффициентом текучести рабочих кадров). Результаты наблюдений приведены в табл. 4.

 

 

 

 

 

Таблица 4

Наблю-

y

x

Наблю-

y

x

дение

 

 

дение

 

 

1

10,3

0,14

10

4,0

0,3

2

10,5

0,13

11

4,9

0,36

3

9,2

0,18

12

5,0

0,34

4

8,2

0,12

13

4,0

0,37

5

7,2

0,18

14

4,8

0,4

6

5,9

0,24

15

4,0

0,42

7

5,2

0,22

16

2,2

0,38

8

4,8

0,24

17

4,1

0,5

9

4,3

0,29

18

2,0

0,48

 

 

 

 

 

 


7

Аналогично примеру 1 зададимся гипотезой, что между выработкой и текучестью рабочих имеется линейная зависимость. По методу наименьших квадратов определим параметры этой прямой и коэффициент корреляции r.

 

 

 

 

Таблица 5

 

 

 

 

 

y

x

xy

x2

y2

 

 

 

 

 

10,3

0,14

1,442

0,0196

106,09

10,5

0,13

1,365

0,0169

110,25

9,2

0,18

1,656

0,0324

84,64

8,2

0,12

0,984

0,0144

67,24

7,2

0,18

1,296

0,0324

51,84

5,9

0,24

1,416

0,0576

34,81

5,2

0,22

1,144

0,0484

27,04

4,8

0,24

1,151

0,0576

23,04

4,3

0,29

1,247

0,0841

18,49

4,0

0,30

1,20

0,090

16,00

4,9

0,36

1,764

0,1296

24,01

5,0

0,34

1,70

0,1156

25,0

4,0

0,37

1,48

0,1369

16,00

4,8

0,40

1,92

0,16

23,04

4,0

0,42

1,68

0,1764

16,00

2,2

0,38

0,836

0,1444

4,84

4,1

0,50

2,05

0,25

16,81

2,0

0,48

0,96

0,2304

4,00

∑100,6

∑5,29

∑29,098

∑1,7967

∑970,12

 

 

 

 

 

b =

18 29,098 5,29 100,6

= −2,716 ;

18 1,7267 5,292

 

 

a = 5,589–(–2,716)·0,294 = 6,388; y = 5,589;


8

x = 0,294.

Уравнение связи между выработкой рабочего и коэффициентом текучести кадров имеет выражение

~y = 6,388–2,716 x.

Коэффициент корреляции между этими показателями определяем по формуле (1):

r =

18 29,098 5,29 100,6

= −0,149 .

18 1,7967 5,292 18 970,12 100,6 2

Коэффициент корреляции представляет собой незначительную величину, и, следовательно, можно сомневаться в целесообразности линейной аппроксимации этой зависимости.

Попробуем эту зависимость аппроксимировать другой формулой, которая более точно соответствовала бы этим статистическим наблюдениям.

На рис. 2 приведено поле корреляции между показателем выработки и коэффициентом текучести рабочих кадров.

В ы р а б о т к а, т ы с. р у б.

1 1

10

9

8

7

6

5

4

3

2

1

0

0

0 , 1

0 , 2

0 , 3

0 , 4

0 , 5

0 , 6

 

К о э ф ф и ц и е н т

т е к у ч е с т и

 

Рис. 2. Поле корреляции

По форме облака рассеяния видно, что кроме прямой линии в центре тяготения точек можно провести кривую. Аппроксимируем эту кривую степенной зависимостью

 

9

 

 

 

~

= ax

b

.

(9)

y

 

Для определения параметров степенной зависимости воспользуемся процедурой метода наименьших квадратов, но предварительно произведем линеализацию (спрямление) кривой. Для этого прологарифмируем правую и левую части формулы (9), в результате получим выражение

ℓg

y = ℓg a + b ℓg x.

(10)

 

~

 

Параметры ℓg a и b найдем методом наименьших квадратов. Систему линейных уравнений (5) преобразуем, и решение получим по формулам

ℓg a =

А

 

;

 

 

 

Д

 

 

 

 

 

 

 

 

 

 

b =

B

,

(11)

где А = ∑ℓg

Д

 

 

 

y ∑(ℓg x)²–∑ℓg x ∑ℓg

y · ℓg x;

B = N ∑ℓg x · ℓg y –∑ℓg x∑ℓg;

Д= N ∑(ℓg x)² – (∑ℓg x)².

Врезультате вычислений получим ℓg a, для получения параметра a формулы степенной зависимости (9) это выражение следует потен-

цировать, в то время как

b получается в чистом виде.

Оценка точности аппроксимации криволинейной зависимости

производится при помощи корреляционного отношения

n =

~

2

.

(12)

1 ( y y )

 

 

( y y )2

 

 

Корреляционное отношение всегда

 

0 ≤ η ≤ 1, оно всегда положи-

тельно. Если η > r, то кривая точнее аппроксимирует зависимость, чем прямая; для прямой r= η.

Табл. 6 и 7 содержат форму записи исходных данных для определения степенной зависимости между параметрами и оценки точности аппроксимации.

Дополнительной оценкой точности аппроксимации, часто применяемой при оценке нелинейной корреляции, является средняя относительная ошибка аппроксимации ε, которая определяется по формуле

 

1

 

 

~

 

 

 

 

 

 

ε =

 

 

y y

·100.

(13)

N

y

 

 

 

 

 

 



10

 

 

 

 

 

Таблица 6

 

 

 

 

 

 

y

x

ℓg x

(ℓg x)2

ℓg y

ℓgx ℓgy

 

 

 

 

 

 

10,3

0,14

–0,8539

0,7291

1,0128

–0,8648

10,5

0,13

–0,8861

0,7852

1,0212

–0,9049

9,2

0,18

–0,7447

0,5546

0,9638

–0,7177

8,2

0,12

–0,9208

0,8479

0,9138

–0,8414

7,2

0,18

–0,7447

0,5546

0,8573

–0,6384

5,9

0,24

–0,6198

0,3842

0,7708

–0,4777

5,2

0,22

–0,6576

0,4324

0,7160

–0,4708

4,8

0,24

–0,6198

0,3842

0,6812

–0,4222

4,3

0,29

–0,5376

0,2890

0,6335

–0,3403

4,0

0,3

–0,5229

0,2734

0,6020

–0,3148

4,9

0,36

–0,4437

0,1969

0,6902

–0,3062

5,0

0,34

–0,4685

0,2195

0,6990

–0,3275

4,0

0,37

–0,4318

0,1864

0,6020

–0,2599

4,8

0,4

–0,3979

0,1583

0,6812

–0,2710

4,0

0,42

–0,3768

0,1420

0,6020

–0,2268

2,2

0,38

–0,4202

0,1766

0,3424

–0,1439

4,1

0,5

–0,3010

0,0906

0,6128

–0,1845

2,0

0,48

–0,3188

0,1016

0,3010

–0,0960

∑100,6

∑5,29

∑–10,2666

∑6,5065

∑12,703

∑–7,8088