Файл: Статистика тема Статистика как наука. Статистическое наблюдение.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.12.2023
Просмотров: 205
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Структурная группировка предназначена для изучения состава совокупности по какому-либо признаку. Например, изучение возрастной структуры безработных в Российской Федерации.
Аналитическая группировка выявляет взаимосвязи между изучаемыми признаками. В статистике выделяют факторные и результативные признаки. Факторными называются признаки, под воздействием которых изменяются другие результативные признаки.
Взаимосвязь проявляется в том, что с возрастанием или убыванием значения факторного признака систематически возрастает или убывает значение признака результативного и наоборот.
При построении аналитической группировки, как правило, единицы совокупности группируются по факторному признаку; каждая выделенная группа характеризуется средними величинами результативного признака.
По способу построения группировки бывают простые и комбинационные. Простой называется группировка, в которой группы образованы только по одному признаку.
Комбинационной
называется группировка, в которой образование групп производится по двум и более признакам, взятым в сочетании (комбинации). Рекомендуется сначала группировать единицы по качественным признакам, а затем - по количественным.
Например, в группировке водителей автопарка по уровню квалификации (классу) и производительности труда вначале все водители делятся на две группы по классу, а затем внутри каждого класса производится деление по проценту выполнения плана
Вопрос 8. Принципы построения статистических группировок
Построение статистических группировок включает следующие этапы:
1. Определение группировочного признака.
2. Определение числа групп.
3. Расчет ширины интервала группировки.
4. Выбор признаков, которые будут характеризовать выделенные группы.
Группировочным (или основанием группировки) называется количественный или качественный признак, по которому проводится разбиение единиц совокупности на группы.
Число выделяемых групп зависит от вида группировочного показателя, степени его вариации и объема изучаемой совокупности.
Если группировочный признак качественный, то число групп будет равно числу вариантов этого признака. Например, группируя сотрудников по полу, мы получим 2 группы: сотрудники-мужчины и сотрудники- женщины.
При определении числа групп необходимо учесть размах
вариации группировочного признака (R), который определяется по формуле:
???? = ????
????????????
− ????
????????????
Где ????
????????????
- максимальное значение группировочного признака;
????
????????????
- минимальное значение группировочного признака.
Чем больше размах вариации группировочного признака, тем большее число групп может быть образовано. Однако при слишком большом их числе возникает проблема «пустых» групп, т.е. не содержащих ни одного объекта.
Число групп можно определить математически или экспертным путем. Математический способ предполагает использование формулы
Стерджесса, которая дает хорошие результаты при большом объеме совокупности:
???? = 1 + 3,322 × lg ????, где m - число выделяемых групп; n - общее число единиц совокупности.
Интервал - это значения признака, лежащие в определенных границах. Нижней границей называется наименьшее, а верхней -
наибольшее значение признака в интервале. Ширина интервала - это разность между его верхней и нижней границами. По ширине интервалы группировки бывают равные (одинаковые) и неравные
Ширина равного интервала h определяется по следующей формуле:
ℎ =
????
????
=
????
????????????
− ????
????????????
????
где ????
????????????
,
????
????????????
- максимальное и минимальное значения признака в совокупности; m - число выделяемых в совокупности групп.
Существуют следующие правила округления ширины интервала
h:
1.
Если h имеет один знак до запятой (например: 0,67; 1,487; 3,82), полученные значения округляют до десятых ( 0,7; 1,5; 3,8.).
2.
Если h имеет две значащие цифры до запятой (например: 14,876), это значение округляют до целого числа (15).
3.
В случае, когда h является трех-, четырех- или еще более значимым числом, его величину следует округлить до ближайшего числа, кратного 100 или 50. Например, 652 следует округлить до 650 или до 700.
Интервалы группировки бывают также закрытыми и открытыми
Если максимальные или минимальные значения сильно отличаются от других значений группировочного признака, то для определения ширины интервала используют значения, несколько превышающие минимум, и несколько меньше, чем максимум.
Полученную по формуле величину округляют и используют в качестве ширины интервала, а первый и/или последний интервалы группировки открывают по верхней или нижней границе. Это делается для того,
чтобы учесть в открытых интервалах единицы, имеющие аномально большие или малые значения группировочного признака.
Если значение признака у какой-то единицы совпадает с верхней границей интервала (например, в табл. 3.8 40 млн. руб. - это верхняя граница 1 интервала (20- 40) и нижняя граница 2 (40-60)), такая единица, как правило, относится к следующему интервалу (ко 2-му, 40-
60).
Если в основании группировки лежит дискретный признак, то нижняя граница каждого интервала, начиная со второго, берется равной верхней границе предыдущего интервала, увеличенной на 1.
Например, группируя страховые кампании числу занятого персонала, можно выделить следующие группы (чел.): 100-150, 151-200,201-300,
301-400.
Вопрос 9. Ряды распределения
Ряд
распределения
представляет собой простейшую группировку, в которой каждая выделенная группа характеризуется только количеством входящих в нее единиц совокупности. Различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам. Вариационными называют ряды распределения, построенные по количественному признаку.
Вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами называются отдельные значения признака.
Варианты признака обозначаются как Х
i
Частотами называются численности отдельных вариантов или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности и обозначаются через Fi.
Сумма всех частот определяет объем совокупности. Частностями
называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частностей равна 1 или 100%.
Дискретный вариационный ряд характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, группы студентов по баллу в сессию.
Интервальный вариационный ряд распределения – это ряд распределения, в котором группировочный признак задан интервалами значений. Например, распределение консалтинговых фирм по величине прибыли.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон и
гистограмму.
Полигон
используется для изображения дискретных вариационных рядов. По оси абсцисс (X) в одинаковом масштабе откладываются значения признака, а по оси ординат (Y) - частоты.
Если значение признака у какой-то единицы совпадает с верхней границей интервала (например, в табл. 3.8 40 млн. руб. - это верхняя граница 1 интервала (20- 40) и нижняя граница 2 (40-60)), такая единица, как правило, относится к следующему интервалу (ко 2-му, 40-
60).
Если в основании группировки лежит дискретный признак, то нижняя граница каждого интервала, начиная со второго, берется равной верхней границе предыдущего интервала, увеличенной на 1.
Например, группируя страховые кампании числу занятого персонала, можно выделить следующие группы (чел.): 100-150, 151-200,201-300,
301-400.
Вопрос 9. Ряды распределения
Ряд
распределения
представляет собой простейшую группировку, в которой каждая выделенная группа характеризуется только количеством входящих в нее единиц совокупности. Различают атрибутивные и вариационные ряды распределения.
Атрибутивными называют ряды распределения, построенные по качественным признакам. Вариационными называют ряды распределения, построенные по количественному признаку.
Вариационный ряд состоит из двух элементов: вариантов и частот.
Вариантами называются отдельные значения признака.
Варианты признака обозначаются как Х
i
Частотами называются численности отдельных вариантов или каждой группы вариационного ряда. Частоты показывают, как часто встречаются те или иные значения признака в изучаемой совокупности и обозначаются через Fi.
Сумма всех частот определяет объем совокупности. Частностями
называются частоты, выраженные в долях единицы или в процентах к итогу. Соответственно сумма частностей равна 1 или 100%.
Дискретный вариационный ряд характеризуют распределение единиц совокупности по дискретному признаку, принимающему только целые значения. Например, группы студентов по баллу в сессию.
Интервальный вариационный ряд распределения – это ряд распределения, в котором группировочный признак задан интервалами значений. Например, распределение консалтинговых фирм по величине прибыли.
Анализ рядов распределения наглядно можно проводить на основе их графического изображения. Для этой цели строят полигон и
гистограмму.
Полигон
используется для изображения дискретных вариационных рядов. По оси абсцисс (X) в одинаковом масштабе откладываются значения признака, а по оси ординат (Y) - частоты.
Полученные на пересечении осей X и Y точки соединяются прямыми линиями, в результате чего получают ломаную линию, называемую полигоном частот (рис. 6).
Рис. 6. Полигон распределения студентов по баллам в сессию
Гистограмма применяется для изображения интервального вариационного ряда. При ее построении на оси X откладываются величины интервалов, а на оси Y - частоты, которые изображаются прямоугольниками, построенными на соответствующих интервалах.
Гистограмма может быть преобразована в полигон распределения, если середины верхних сторон прямоугольников соединить прямыми линиями (рис. 7).
При построении гистограммы распределения вариационного ряда с неравными интервалами по оси Y наносят не частоты, а плотность распределения признака в соответствующих интервалах.
Плотность распределения - это частота, рассчитанная на единицу ширины интервала.
Рис. 7. Гистограмма и полигон распределения консалтинговых фирм
по величине прибыли за 2019 г.
Вопросы для самопроверки:
1. Как Вы понимаете термин «статистика»?
2. Дайте характеристику основным чертам определения предмета статистики.
3. Почему статистика изучает массовые явления?
4. К каким видам (количественным или качественным) относятся следующие признаки: а) количество работников на предприятии; б) пол и возраст человека; в) этажность жилых помещений; г) количество детей в семье; д) прибыль торговых объединений.
5. Назовите наиболее существенные варьирующие признаки, при помощи которых можно охарактеризовать студенческую группу.
6. Что такое перепись населения и почему необходимо ее проводить?
7. Для чего формируются регистры предприятий?
8. К какому виду наблюдения относится регистрация факта смерти или рождения человека?
9. Почему все зарегистрированные хозяйствующие субъекты обязаны предоставлять статистическую отчетность в органы статистики?
10. В чем заключается основная задача | метода группировки? Какие виды группировок применяются?
11. Что такое ряд распределения и чем он отличается от группировки?
12. Как можно определить число групп при группировке данных?
13. Может ли качественный признак являться основанием группировки?
14. Можно ли построить гистограмму по данным о распределении семей по числу детей?