Файл: Задача состоит в том, чтобы увидеть, есть связь между признаками или нет прямая связь или обратная линейная или нелинейная.docx
Добавлен: 30.11.2023
Просмотров: 13
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Данные группируются по признаку-фактору. Затем по каждой группе рассчитывается среднее значение. Задача состоит в том, чтобы увидеть, есть связь между признаками или нет; прямая связь или обратная; линейная или нелинейная.
Так как в основание группировки положен непрерывный количественный признак, то число групп определяют одновременно с размером интервала.
Когда совокупность единиц более или менее однородна (вариация по группировочному признаку мала), прибегают к равным интервалам, размер которых приближенно определяется по формуле Стэрджесса:
n = 1 + 3,322log n = 1 + 3,322log(25) = 6
Ширина интервала составит:
Для каждого значения ряда подсчитаем, какое количество раз оно попадает в тот или иной интервал. Для этого сортируем ряд по возрастанию.
X | Интервал | Количество | Y1 | Y2 |
25 | 25 - 30.6 | 1 | 31.4 | 11.1 |
27 | 25 - 30.6 | 2 | 40.5 | 10.7 |
27.2 | 25 - 30.6 | 3 | 45.9 | 10.7 |
27.7 | 25 - 30.6 | 4 | 41.3 | 8.3 |
28.3 | 25 - 30.6 | 5 | 47.5 | 10.4 |
28.6 | 25 - 30.6 | 6 | 45.4 | 8.3 |
28.7 | 25 - 30.6 | 7 | 46.3 | 10.7 |
29 | 25 - 30.6 | 8 | 43.5 | 8.3 |
29.9 | 25 - 30.6 | 9 | 31 | 11 |
32.6 | 30.6 - 36.2 | 1 | 42.5 | 8.3 |
34 | 30.6 - 36.2 | 2 | 41 | 8 |
34 | 30.6 - 36.2 | 3 | 38.9 | 9.3 |
35.2 | 30.6 - 36.2 | 4 | 40 | 11.6 |
36 | 30.6 - 36.2 | 5 | 44.7 | 8 |
39.2 | 36.2 - 41.8 | 1 | 45.6 | 11 |
40.8 | 36.2 - 41.8 | 2 | 44.7 | 8 |
41.2 | 36.2 - 41.8 | 3 | 53.8 | 16 |
41.9 | 41.8 - 47.4 | 1 | 48.5 | 12.1 |
43.1 | 41.8 - 47.4 | 2 | 44.7 | 8 |
43.6 | 41.8 - 47.4 | 3 | 49.7 | 13.8 |
45 | 41.8 - 47.4 | 4 | 48.7 | 14 |
51.2 | 47.4 - 53 | 1 | 52.3 | 11.5 |
52.2 | 47.4 - 53 | 2 | 52.3 | 15.3 |
53.9 | 53 - 58.6 | 1 | 56 | 22 |
58.5 | 53 - 58.6 | 2 | 55.2 | 25 |
Аналитическая группировка по X и Y1.
Группы | № | Кол-во, nj | ∑X | Xcp = ∑Xj / nj | ∑Y | Ycp = ∑Yj / nj |
25 - 30.6 | 3,4,6,11,7,10,5,9,1 | 9 | 251.4 | 27.93 | 372.8 | 41.42 |
30.6 - 36.2 | 23,14,17,2,22 | 5 | 171.8 | 34.36 | 207.1 | 41.42 |
36.2 - 41.8 | 24,21,25 | 3 | 121.2 | 40.4 | 144.1 | 48.03 |
41.8 - 47.4 | 12,20,18,8 | 4 | 173.6 | 43.4 | 191.6 | 47.9 |
47.4 - 53 | 16,19 | 2 | 103.4 | 51.7 | 104.6 | 52.3 |
53 - 58.6 | 13,15 | 2 | 112.4 | 56.2 | 111.2 | 55.6 |
Итого | | 25 | 933.8 | | 1131.4 | |
Аналитическая группировка по X и Y2.
Группы | № | Кол-во, nj | ∑X | Xcp = ∑Xj / nj | ∑Y | Ycp = ∑Yj / nj |
25 - 30.6 | 3,4,6,11,7,10,5,9,1 | 9 | 251.4 | 27.93 | 89.5 | 9.94 |
30.6 - 36.2 | 23,14,17,2,22 | 5 | 171.8 | 34.36 | 45.2 | 9.04 |
36.2 - 41.8 | 24,21,25 | 3 | 121.2 | 40.4 | 35 | 11.67 |
41.8 - 47.4 | 12,20,18,8 | 4 | 173.6 | 43.4 | 47.9 | 11.98 |
47.4 - 53 | 16,19 | 2 | 103.4 | 51.7 | 26.8 | 13.4 |
53 - 58.6 | 13,15 | 2 | 112.4 | 56.2 | 47 | 23.5 |
Итого | | 25 | 933.8 | | 291.4 | |
Итоговая аналитическая группировка.
Группы | № | Кол-во, nj | X | Y1 | Y2 |
25 - 30.6 | 3,4,6,11,7,10,5,9,1 | 9 | 27.93 | 41.42 | 9.94 |
30.6 - 36.2 | 23,14,17,2,22 | 5 | 34.36 | 41.42 | 9.04 |
36.2 - 41.8 | 24,21,25 | 3 | 40.4 | 48.03 | 11.67 |
41.8 - 47.4 | 12,20,18,8 | 4 | 43.4 | 47.9 | 11.98 |
47.4 - 53 | 16,19 | 2 | 51.7 | 52.3 | 13.4 |
53 - 58.6 | 13,15 | 2 | 56.2 | 55.6 | 23.5 |
Итого | | 25 | | | |
Исходные данные
X | f1 | f2 | Итого |
27.93 | 41.42 | 9.94 | 51.36 |
34.36 | 41.42 | 9.04 | 50.46 |
40.4 | 48.03 | 11.67 | 59.7 |
43.4 | 47.9 | 11.98 | 59.88 |
51.7 | 52.3 | 13.4 | 65.7 |
56.2 | 55.6 | 23.5 | 79.1 |
Итого | 286.67 | 79.53 | |
Тогда имеем 2 группы, для которых необходимо рассчитать групповую среднюю и внутригрупповые дисперсии.
1. Находим средние значения каждой группы.
2. Находим среднее квадратическое каждой группы.
Результаты расчета сведем в таблицу:
Номер группы | Групповая средняя | Внутригрупповая дисперсия |
1 | 43.35 | 92.24 |
2 | 45.18 | 97.37 |
3. Внутригрупповая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака в пределах группы под действием на него всех факторов, кроме фактора, положенного в основание группировки:
Среднюю из внутригрупповых дисперсий рассчитаем по формуле:
4. Межгрупповая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака под действием на него фактора (факторного признака), положенного в основание группировки.
Межгрупповую дисперсию определим как:
где
Тогда
Общая дисперсия характеризует изменение (вариацию) изучаемого (результативного) признака под действием на него всех без исключения факторов (факторных признаков).
Общая дисперсия будет равна: σ = 93.35 + 0.57 = 93.92
Общую дисперсию также можно рассчитать и по формуле:
Эмпирическое корреляционное отношение измеряет, какую часть общей колеблемости результативного признака вызывает изучаемый фактор. Это отношение факторной дисперсии к общей дисперсии:
Определяем эмпирическое корреляционное отношение:
Связи между признаками могут быть слабыми и сильными (тесными). Их критерии оцениваются по шкале Чеддока:
0.1 < η < 0.3: слабая;
0.3 < η < 0.5: умеренная;
0.5 < η < 0.7: заметная;
0.7 < η < 0.9: высокая;
0.9 < η < 1: весьма высокая;
В нашем примере связь между признаком Y фактором X слабая
Коэффициент детерминации.
Определим коэффициент детерминации:
Таким образом, на 0.61% вариация обусловлена различиями между признаками, а на 99.39% – другими факторами.