Тема 8. Основы корреляционного и регрессионного анализа
Задача 8.1.
По пяти рабочим цеха имеются данные о квалификации и месячной выработке. Для изучения связи между квалификацией рабочих и их выработкой определить линейное уравнение связи и коэффициент корреляции. Дать интерпретацию коэффициентам регрессии и корреляции.
|
Табельный номер |
Разряд |
Выработка продукции за |
|
рабочего |
смену, шт. |
|
|
|
1 |
6 |
130 |
|
2 |
2 |
60 |
|
3 |
3 |
70 |
|
4 |
5 |
110 |
|
5 |
4 |
90 |
Решение.
Парная линейная корреляционная связь характеризуется линейной регрессией yx = a +bx ,
Коэффициенты a, b регрессионной модели находим методом наименьших квадратов, решая систему линейных уравнений
an + b∑x = ∑y,a∑x + b∑x2 = ∑yx,
где n − число рабочих (для данной задачи n = 5).
Для решения данной системы уравнений составим расчетную таблицу 1.
|
|
|
|
Таблица 1 |
|
|
|
|
|
|
№№ |
x |
y |
x2 |
y2 |
yx |
1 |
6 |
130 |
36 |
16900 |
780 |
2 |
2 |
60 |
4 |
3600 |
120 |
4 |
3 |
70 |
9 |
4900 |
210 |
9 |
5 |
110 |
25 |
12100 |
550 |
5 |
4 |
90 |
16 |
8100 |
360 |
Всего |
20 |
460 |
90 |
45600 |
2020 |
Подставим в систему уравнений найденные значения сумм:
5a + 20b = 460,20a +90b = 2020.
Решив данную систему, получим
a = 20; b =18 .
Отсюда выборочное уравнение регрессионной зависимости месячной выработки Y от квалификации X имеет вид
yx = 20 +18x .
Коэффициент линейной корреляции между двумя признаками X и Y вычисляется по формуле
ryx = |
n∑xi yi −(∑xi ) (∑yi ) |
]. |
[n∑xi2 −(∑xi )2 ][n∑yi2 −(∑yi )2 |
Подставив исходные данные в эту формулу, получим: ryx = 0,994 .
Полученное значение коэффициента линейной корреляции свидетельствует о наличии сильной положительной линейной корреляционной связи между признаками X и Y.
Задача 8.2.
По группе предприятий отрасли имеются следующие данные:
№ предприятия |
Продукция, тыс. шт. |
Потребление сырья, тыс. т |
1 |
24,6 |
3,2 |
2 |
37,4 |
4,1 |
3 |
45,4 |
2,2 |
4 |
46,7 |
1,6 |
5 |
50,1 |
4,4 |
6 |
51,3 |
10,5 |
7 |
55,0 |
2,6 |
1)постройте уравнение прямой и определите коэффициент регрессии;
2)определите тесноту связи;
3)сделайте экономические выводы.
Решение.
Парная линейная корреляционная связь характеризуется линейной регрессией yx = a +bx ,
Коэффициенты a, b регрессионной модели находим методом наименьших квадратов, решая систему линейных уравнений
an + b∑x = ∑y,a∑x + b∑x2 = ∑yx,
где n − число предприятий (для данной задачи n = 7).
Для решения данной системы уравнений составим расчетную таблицу 1.
|
|
|
|
|
|
|
|
|
Таблица 1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
№№ |
|
x |
y |
x2 |
|
y2 |
|
yx |
|
|
|
|
1 |
|
3,2 |
24,6 |
10,24 |
|
605,16 |
|
78,72 |
|
|
|
|
2 |
|
4,1 |
37,4 |
16,81 |
|
1398,76 |
|
153,34 |
|
|
|
|
3 |
|
2,2 |
45,4 |
4,84 |
|
2061,16 |
|
99,88 |
|
|
|
|
4 |
|
1,6 |
46,7 |
2,56 |
|
2180,89 |
|
74,72 |
|
|
|
|
5 |
|
4,4 |
50,1 |
19,36 |
|
2510,01 |
|
220,44 |
|
|
|
|
6 |
|
10,5 |
51,3 |
110,25 |
|
2631,69 |
|
538,65 |
|
|
|
|
7 |
|
2,6 |
55 |
6,76 |
|
3025 |
|
143 |
|
|
|
|
Всего |
|
28,6 |
310,5 |
170,82 |
|
14412,7 |
|
1308,75 |
|
Подставим в систему уравнений найденные значения сумм: |
|
|
|
|
7a + 28,6b = 310,5, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
28,6a +170,82b =1308,75. |
|
|
|
|
|
|
|
Решив данную систему, получим |
|
|
|
|
|
|
|
a = 41,319; b = 0,744 . |
|
|
|
|
|
|
|
|
Отсюда выборочное уравнение регрессионной зависимости выпуска продукции Y от |
потребления сырья X имеет вид |
|
|
|
|
|
|
|
yx |
= 41319 + 0,744x . |
|
|
|
|
|
|
|
|
Коэффициент линейной корреляции между двумя признаками X и Y вычисляется по формуле |
ryx = |
n∑xi yi −(∑xi ) (∑yi ) |
]. |
|
|
|
|
|
[n∑xi2 −(∑xi )2 |
][n∑yi2 −(∑yi )2 |
|
|
|
|
|
Подставив исходные данные в эту формулу, получим: |
ryx = 0,216 . |
|
|
Полученное значение коэффициента линейной корреляции свидетельствует об отсутствии линейной корреляционной связи между признаками X и Y.
Задача 8.3.
По 8 однородным магазинам имеются следующие данные:
|
Товарооборот, тыс. руб. |
7 |
10 |
15 |
20 |
30 |
45 |
60 |
120 |
|
|
Уровень издержек обращения по |
10,0 |
9,0 |
7,5 |
6,0 |
6,3 |
5,8 |
5,4 |
5,0 |
|
|
отношению к товарообороту, % |
|
|
|
|
|
|
|
|
|
|
|
|
Найдите уравнение корреляционной связи товарооборота и уровня издержек |
обращения. |
|
|
|
|
|
|
|
|
|
Вычислите коэффициенты эластичности, показатели тесноты корреляционной связи. Сделайте выводы.
Решение.
Парная линейная корреляционная связь характеризуется линейной регрессией yx = a +bx ,
Коэффициенты a, b регрессионной модели находим методом наименьших квадратов, решая систему линейных уравнений
an + b∑x = ∑y,a∑x + b∑x2 = ∑yx,
где n − число магазинов (для данной задачи n = 8).
Для решения данной системы уравнений составим расчетную таблицу 1. Таблица 1
|
|
№№ |
|
x |
y |
x2 |
y2 |
yx |
|
|
1 |
|
7 |
10 |
49 |
100 |
70 |
|
|
2 |
|
10 |
9 |
100 |
81 |
90 |
|
|
3 |
|
15 |
7,5 |
225 |
56,25 |
112,5 |
|
|
4 |
|
20 |
6 |
400 |
36 |
120 |
|
|
5 |
|
30 |
6,3 |
900 |
39,69 |
189 |
|
|
6 |
|
45 |
5,8 |
2025 |
33,64 |
261 |
|
|
7 |
|
60 |
5,4 |
3600 |
29,16 |
324 |
|
|
8 |
|
120 |
5 |
14400 |
25 |
600 |
|
|
Всего |
|
307 |
55 |
21699 |
400,74 |
1766,5 |
Подставим в систему уравнений найденные значения сумм: |
|
|
8a +307b = 55, |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
307a + 21699b =1766,5. |
|
|
|
|
|
Решив данную систему, получим a = 8,207; b = −0,0347 .
Отсюда выборочное уравнение регрессионной зависимости уровня издержек обращения Y от товарооборота X имеет вид
yx = 8,207 −0,0347x .
Коэффициент линейной корреляции между двумя признаками X и Y вычисляется по формуле
ryx = |
n∑xi yi −(∑xi ) (∑yi ) |
]. |
[n∑xi2 −(∑xi )2 ][n∑yi2 −(∑yi )2 |
Подставив исходные данные в эту формулу, получим: ryx = −0,727 .
Полученное значение коэффициента линейной корреляции свидетельствует о наличии тесной отрицательной линейной корреляционной связи между признаками X и Y.
212