5. Постройте график зависимости между x и y по регионам для первых 10 регионов, уравнение регрессии, определите тесноту связи, коэффициент эластичности.
Решение.
Построим ряды распределения признаков x и y. Рассмотрим вначале признак x – товарооборот. Составим ряд распределения, складывая накопленные частоты при увеличении значений x. Результаты приведены в таблице.
Таблица. Ряд распределения товарооборота.
x |
≤ 141 |
150 |
200 |
310 |
380 |
407 |
410 |
440 |
504 |
510 |
520 |
540 |
600 |
630 |
710 |
F(x) |
0 |
0,029 |
0,057 |
0,086 |
0,114 |
0,143 |
0,171 |
0,2 |
0,229 |
0,257 |
0,286 |
0,314 |
0,343 |
0,371 |
0,4 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
740 |
750 |
760 |
770 |
780 |
790 |
800 |
840 |
845 |
860 |
870 |
880 |
950 |
970 |
980 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
F(x) |
0,486 |
0,514 |
0,543 |
0,571 |
0,629 |
0,657 |
0,714 |
0,743 |
0,771 |
0,8 |
0,829 |
0,857 |
0,914 |
0,943 |
0,971 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
При x > 980 F(x) = 1.
Из полученного ряда распределения видно, что медиана – это квантиль x(0,5) (такое x,
|
при котором F(x) = 0,5) равна x(0,5) |
= |
740 + |
750 |
= 745 . |
|
|
2 |
|
|
|
|
|
|
|
|
|
|
Аналогично, третий квартиль равен x(0,75) |
= |
840 +845 |
= 842,5 , |
|
2 |
|
|
|
|
|
|
|
и восьмой дециль равен x(0,8) = 860 .
Мода – наиболее часто встречающееся значение. Поскольку в выборке явно можно указать такую величину, то моду можно найти без группировки данных. Мода признака x равна 740, т.к. это значение присутствует в выборке трижды.
Аналогичным образом построим ряд распределения средних товарных запасов. Ряд распределения показан в таблице.
Таблица. Ряд распределения средних товарных запасов
y |
≤ 60 |
93 |
120 |
160 |
170 |
189 |
210 |
260 |
280 |
290 |
|
|
|
|
|
|
|
|
|
|
|
F(y) |
0 |
0,057 |
0,086 |
0,114 |
0,143 |
0,171 |
0,2 |
0,229 |
0,257 |
0,4 |
|
|
|
|
|
|
|
|
|
|
|
y |
300 |
304 |
308 |
310 |
310 |
315 |
320 |
340 |
350 |
360 |
|
|
|
|
|
|
|
|
|
|
|
F(y) |
0,457 |
0,514 |
0,543 |
0,571 |
0,714 |
0,743 |
0,771 |
0,857 |
0,886 |
0,971 |
|
|
|
|
|
|
|
|
|
|
|
При y > 360 F(y) = 1.
Медиана равна y(0,5) |
= |
300 + |
304 |
= 302 . |
|
2 |
|
|
|
|
|
|
|
|
|
|
Третий квартиль равен y(0,75) |
= |
315 + |
320 |
= 317,5 . |
2 |
|
|
|
|
|
|
|
|
Восьмой дециль равен y(0,8) |
= |
320 +340 |
= 330 . |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
Мода распределения средних товарных запасов равна 310, т.к. это значение встречается |
наиболее часто (шесть раз). |
|
|
|
|
|
|
|
|
Для определения средних групповых и общей средней сгруппируем данные. |
Количество интервалов в ряде распределения определим по формуле Старджесса |
|
L =1+[3,322lg n]=1+[3,322 lg35]= 6 . |
|
|
|
|
Рассмотрим вначале признак x – товарооборот. Сгруппируем данные товарооборота, |
поделив все возможные значения на 6 равных интервалов величиной |
|
|
|
|
x = |
|
xmax − xmin |
= |
980 −141 |
=139,833 |
д.е. |
|
|
|
|
|
|
L |
|
|
|
|
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Результаты группирования приведены в таблице. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица. Группировка товарооборота. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ группы |
|
|
|
|
Диапазон |
|
|
Кол-во |
Сумма |
Среднее |
|
|
|
|
|
|
|
|
значений, ni |
групповое, Xi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
140 - 280,33 |
|
|
3 |
491 |
163,67 |
|
|
|
|
|
2 |
|
|
|
280,33 - 420,67 |
|
|
4 |
1507 |
376,75 |
|
|
|
|
|
3 |
|
|
|
|
420,67 - 560,5 |
|
|
5 |
2514 |
502,8 |
|
|
|
|
|
4 |
|
|
|
|
560,5 - 700,33 |
|
|
2 |
1230 |
615 |
|
|
|
|
|
5 |
|
|
|
700,33 - 840,17 |
|
|
13 |
10000 |
769,23 |
|
|
|
|
|
6 |
|
|
|
|
840,17 - 980 |
|
|
8 |
7305 |
913,13 |
|
Среднее значение товарооборота определим по формуле средней арифметической |
взвешенной: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑X i ni |
|
23047 |
|
|
|
|
|
|
|
|
|
|
X = |
= |
= 658,486 д.е. |
|
|
|
|
|
|
|
∑ni |
|
|
|
|
|
|
|
|
|
|
|
35 |
|
|
|
|
|
|
Для расчета показателей вариации составим промежуточную таблицу.
Таблица. Расчет показателей вариации.
|
Группировка |
Кол-во |
графа 3 |
графа 4 |
графа 5 |
|
графа 6 |
графа 7 |
графа 8 |
|
данных по |
значе- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
товарообороту, Xi |
ний, ni |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X i |
X i ni |
|
X i − |
|
|
|
X i − |
|
ni |
(X i − |
|
)2 |
(X i − |
|
)2 ni |
|
|
|
|
|
|
|
X |
X |
|
|
|
|
X |
X |
|
|
|
|
|
|
|
|
|
|
|
140 - 280,33 |
3 |
163,6667 |
491 |
494,819 |
|
1484,457 |
244845,9 |
734537,7 |
|
280,33 - 420,67 |
4 |
376,75 |
1507 |
281,7357 |
1126,943 |
79375,01 |
317500,1 |
|
420,67 - 560,5 |
5 |
502,8 |
2514 |
155,6857 |
778,4286 |
24238,04 |
121190,2 |
|
560,5 - 700,33 |
2 |
615 |
1230 |
43,48571 |
86,97143 |
1891,007 |
3782,015 |
|
700,33 - 840,17 |
13 |
769,2308 |
10000 |
110,7451 |
1439,686 |
12264,47 |
159438,1 |
|
840,17 - 980 |
8 |
913,125 |
7305 |
254,6393 |
2037,114 |
64841,17 |
518729,3 |
|
Итого |
35 |
|
23047 |
|
|
|
|
6953,6 |
|
|
|
1855177 |
Определим показатели вариации. Размах вариации равен
R = xmax − xmin = 980 −141 = 839 .
Среднее линейное отклонение равно
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑ |
|
X i − |
|
|
ni |
|
|
|
|
|
|
|
|
|
|
X |
|
6953,6 |
|
|
d = |
|
= |
=198,67 . |
|
|
|
∑ni |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
35 |
|
Дисперсия: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑(X i − |
|
)2 ni |
|
|
|
|
σ |
2 |
= |
X |
= |
1855177 |
= 53005,067 . |
|
|
|
∑ni |
|
|
|
|
|
|
|
|
|
|
35 |
Среднее квадратическое отклонение |
σ = |
|
σ2 = |
53005,067 = 230,23 . |
Коэффициент осцилляции:
Ko = XR 100% = 658839,486 100% =127,41% .
Относительное линейное отклонение:
K |
|
= |
|
|
|
d |
|
|
100% = |
198,67 |
100% = 30,17% . |
|
|
|
d |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
658,486 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Коэффициент вариации: |
|
|
|
|
|
|
|
|
Ko = |
|
|
σ |
|
100% = |
|
230,23 |
|
100% = 34,96% . |
|
|
|
|
|
|
|
658,486 |
|
|
|
|
|
|
|
|
|
X |
|
|
|
|
|
|
|
Рассмотрим теперь признак y – средние товарные запасы. Сгруппируем данные, |
поделив все возможные значения на 6 равных интервалов величиной |
|
|
|
|
x |
= |
|
|
ymax − ymin |
|
= |
360 − |
60 |
= 50 |
д.е. |
|
|
|
|
|
|
|
|
|
|
|
L |
6 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Результаты группирования приведены в таблице. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Таблица. Группировка товарооборота. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№ группы |
|
|
|
|
|
Диапазон |
|
Кол-во |
Сумма |
Среднее |
|
|
|
|
|
|
|
|
значений, ni |
групповое, Yi |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
60 - 110 |
|
3 |
60 |
20 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
110 - 160 |
|
2 |
55 |
27,5 |
|
|
|
|
|
|
|
3 |
|
|
|
|
|
160 - 210 |
|
3 |
40 |
13,3333 |
|
|
|
|
|
|
|
4 |
|
|
|
|
|
210 - 260 |
|
1 |
33 |
33 |
|
|
|
|
|
|
|
5 |
|
|
|
|
|
260 - 310 |
|
17 |
291 |
17,1176 |
|
|
|
|
|
|
|
6 |
|
|
|
|
|
310 - 360 |
|
9 |
151 |
16,7778 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
225 |
|
|
|
Среднее значение товарных запасов определим по формуле средней арифметической взвешенной:
Y = ∑Yi ni = 9513 = 271,8 д.е. ∑ni 35
Для расчета показателей вариации составим промежуточную таблицу.
Таблица. Расчет показателей
вариации.
Группировка |
Кол-во |
графа 3 |
графа 4 |
графа 5 |
|
графа 6 |
графа 7 |
графа 8 |
данных по |
значе- |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
товарным |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ний, ni |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
запасам, Yi |
Yi |
Yi ni |
|
Yi − |
|
|
|
Yi − |
|
ni |
(Yi − |
|
)2 |
(Yi − |
|
)2 ni |
|
Y |
|
|
Y |
Y |
Y |
|
|
|
|
|
|
|
|
|
60 - 110 |
3 |
71 |
213 |
200,8 |
|
602,4 |
40320,64 |
120961,9 |
110 - 160 |
2 |
140 |
280 |
131,8 |
|
263,6 |
17371,24 |
34742,48 |
160 - 210 |
3 |
189,6667 |
569 |
82,13333 |
246,4 |
6745,884 |
20237,65 |
210 - 260 |
1 |
260 |
260 |
11,8 |
|
11,8 |
|
139,24 |
139,24 |
260 - 310 |
17 |
300,3529 |
5106 |
28,55294 |
485,4 |
815,2704 |
13859,6 |
310 - 360 |
9 |
342,7778 |
3085 |
70,97778 |
638,8 |
5037,845 |
45340,6 |
Итого |
35 |
0 |
9513 |
0 |
|
|
2248,4 |
0 |
|
|
235281,5 |
Размах вариации равен
R = ymax − ymin = 360 −60 = 300 .
Среднее линейное отклонение равно
d= ∑Yi −Y ni = 2248,4 = 64,24 .
∑ni 35
Дисперсия:
σ2 = ∑(Yi −Y )2 ni = 235281,5 = 6722,328 . ∑ni 35
Среднее квадратическое отклонение
σ = σ2 = 6722,328 = 81,99 .
Коэффициент осцилляции:
Ko = YR 100% = 271300,8 100% =110,38% .
Относительное линейное отклонение:
Kd = Yd 100% = 64271,24,8 100% = 23,64% .
Коэффициент вариации:
Ko = Yσ 100% = 81271,99,8 100% = 30,17% .
Построим корреляционное поле между x и y по регионам для первых 10 регионов.
400
y
350
300
250
200
150
100
50
0
x
Из рисунка видно, что зависимость имеет линейный характер y) = b0 +b1 x ,
где b0, b1 − коэффициенты уравнения парной линейной регрессии.
2. Коэффициенты регрессии b0, b1 находим методом наименьших квадратов, решая систему линейных уравнений
b0 n +b1 ∑xi = ∑yi ,b0 ∑ti +b1 ∑xi2 = ∑yi xi ,
где n = 10. Предварительные вычисления приведены в таблице:
i |
xi |
yi |
xi2 |
xiyi |
yi2 |
1 |
870 |
360 |
756900 |
313200 |
129600 |
2 |
740 |
300 |
547600 |
222000 |
90000 |
3 |
800 |
304 |
640000 |
243200 |
92416 |
4 |
800 |
300 |
640000 |
240000 |
90000 |
5 |
630 |
304 |
396900 |
191520 |
92416 |
6 |
710 |
290 |
504100 |
205900 |
84100 |
7 |
520 |
210 |
270400 |
109200 |
44100 |
8 |
600 |
310 |
360000 |
186000 |
96100 |
9 |
200 |
93 |
40000 |
18600 |
8649 |