Файл: Методические указания по выполнению лабораторных работ и организации самостоятельной работы для студентов, обучающихся по направлению подготовки.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 38

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Охарактеризуйте стадии статистического исследования?
4.
Проведите классификацию статистических признаков
5.
Приведите примеры признаков, измеренных в номинальной шкале
6. . Укажите преимущества выборочного наблюдения перед сплошным наблюдением
7. Запишите соотношение средней и предельной ошибками выборки
2.3.2. Тема «Выявление типологии социально-экономических явлений»
Содержание темы
Роль типологии в социально-экономических исследованиях.
Группировка и сводка материалов статистического наблюдения. Виды статистических группировок и задачи, решаемые методом группировок.
Классификация и характеристика основных задач распознавания образов. Методы кластеризации и дискриминации. Постановка задачи кластеризации.
Меры близости, основанные на расстояниях, используемые в алгоритмах кластеризации. Базовые алгоритмы кластеризации.
Литература: [1, 3, 9].
Методические указания по изучению темы
Группировкой называется разбиение единиц изучаемой совокупности на однородные группы по определенным существенным признакам. При изучении темы важно уяснить, что группировки не являются самоцелью, а позволяют выявить социально-экономические типы явления, изучить структуру явлений и изменение структуры, выявить связи и зависимости между признаками.
Необходимо отметить, что метод группировок тесно связан с представлением данных в виде групповых и комбинационных таблиц, а также с графическим представлением структуры совокупности, ее частей и соотношений между ними.
Различия в целевом назначении группировки выражаются в классификации группировок: типологические, структурные, аналитические. В процессе изучения каждого вида важно увидеть различия между видами группировок, общее и связи между видами.
Оценить качество проведенной группировки можно различными способами. В частности, на основе правила сложения дисперсий: полная дисперсия признака равна сумме средней из групповых

21
дисперсий и межгрупповой дисперсии. Если исходная совокупность может быть разбита на группы и группировка проведена правильно, то группы однородны (дисперсия внутри групп достаточно мала), а полная дисперсия образуется в основном за счет различий в значениях признака, относящихся к разным группам (межгрупповая дисперсия относительно велика). В этом случае значение коэффициента детерминации близко к единице.
Многомерная группировка
(размерность признакового пространства равна р) относится к задачам распознавания образов.
Задача распознавания образов состоит в следующем: объекты, обладающие типичными для всех чертами, образуют характерный класс, называемый образом. Требуется построить некоторый оптимальный алгоритм, который бы позволил по этим типичным чертам определить принадлежность данного объекта к тому или иному классу, то есть распознать образ. В данном курсе рассматриваются алгоритмы кластер – анализа: отыскание набора кластеров (классов, групп)
}
{
i
S
в заданном признаковом пространстве
}
{
i
x
с известной решающей функцией



i
. Для усвоения материала студенту необходимо познакомиться в основными определениями, идеей алгоритмов и прорешать предложенные задачи.
Вопросы и упражнения для самопроверки:
1. Сформулируйте принцип построения группировок.
2. Приведите примеры простой и сложной группировок.

3. Какой вывод можно сделать, если квадратичный показатель структурных сдвигов равен нулю?
4.
Предположим, проведена аналитическая группировка на 3 группы. Поясните, почему при линейной зависимости должно выполняться равенство
2 3
2 3
1 2
1 2
x
x
y
y
x
x
y
y





5.

Если средняя внутригрупповых дисперсий равна полной дисперсии признака в совокупности, чему равна межгрупповая дисперсия?
6.
В таблице приведена информация о городах, описанных двумя признаками:
х – количество студентов: тыс.чел.
y – число театров


22
Пичтаун
Эплвиль
Черриль
Грейп
Лемонск
x
6 7
0 2
1
y
3 3
0 1
0
Используя алгоритмы ближайшего соседа, дальнего соседа, медианной связи, проведите разбиение объектов на 2 класса. Постройте дендрограмму.
2.3.3. Тема «Информационно-программные средства статистического анализа данных»
Содержание темы
Технология анализа социально-экономической информации средствами статистических пакетов. Обзор рынка инструментов статистического анализа данных.
Средства массового применения
(Microsoft
Excel), специализированные инструментальные средства (Statistica, SPSS и др.), средства создания информационных хранилищ и обеспечения различного вида анализа. Анализ и обработка экспериментальных данных с помощью пакетов «Statistica», «SPSS».
Литература: [2, 4, 6, 8].
Методические указания по изучению темы
Аспекты проблемы анализа и необходимые для их разрешения функции нашли выражение в соответствующих программных продуктах.
Соответственно средства автоматизации анализа представлены в различных видах.
Имеются комплексные информационно-аналитические системы, выполняющие в той или иной степени функции в соответствии с рассмотренными аспектами.
Как правило, все инструментальные средства, предназначенные для автоматизации аналитических работ, приспособлены для обработки многомерных массивов информации; имеют также возможность импорта/экспорта данных в другие операционные среды, развитые средства визуального двумерного (2D) и трехмерного (3D) представления информации. Развитой системой в отношении возможностей, предоставляемых модулями и автономными подсистемами интеллектуального анализа, является инструментарий
ИАС фирмы США «SAS Institute Inc».
Необходимо отметить следующее обстоятельство. Целевые программные продукты весьма дороги и пока малодоступны для массового российского потребителя. Выходом из этого положения является использование редко применяемых на практике

23
возможностей массовых программных инструментальных средств
Excel, Mathcad, Stadia, Statistica и др. Пакет «Statistica» — с его помощью возможно решение всех задач статистического анализа, а также выявления закономерностей и прогнозирования.
Вопросы и упражнения для самопроверки:
1. Сформулируйте понятие
«информационно-аналитические системы».
2. Проведите обзор рынка программных систем статистического анализа данных.
3. Проведите сравнение состава статистических процедур в пакетах Excel и Statistica.
4. Рассмотрите реализацию регрессионного анализа в пакетах
Excel и Statistica.
5. Какой пакет вы использовали при решении задачи прогнозирования динамического ряда? Ответ обоснуйте.
2.3.4. Тема «Методы снижения размерности в задачах анализа данных»
Содержание темы
Проблемы и критерии информативности признаков. Логико- эвристические методы формирования признакового пространства.
Статистические методы формирование признакового пространства.
Методы снижения размерности.
Метод главных компонент.
Факторный анализ, основные проблемы его применения. Экспертно- статистический метод построения единого сводного показателя..
Литература: [2, 4, 6, 8].
Методические указания по изучению темы
В многомерном статистическом анализе каждый объект описывается вектором, размерность которого произвольна. Однако уже в трехмерном пространстве человеку трудно анализировать скопления точек. Поэтому вполне естественным является желание перейти от многомерной выборки к данным небольшой размерности, чтобы «на них можно было посмотреть». Кроме того, студенту важно понять, что могут быть малоинформативные переменные, которые лишь мешают статистическому анализу. Поэтому желательно избавиться от таких факторов.


24
При анализе многомерных данных обычно рассматривают не одну, а множество задач, в частности, по-разному выбирая независимые и зависимые переменные. Поэтому задачу снижения размерности можно рассмотреть в следующей формулировке. Дана многомерная выборка. Требуется перейти от нее к совокупности векторов меньшей размерности, максимально сохранив структуру исходных данных, по возможности не теряя информации, содержащихся в данных. Задача конкретизируется в рамках каждого конкретного метода снижения размерности.
Метод главных компонент является одним из наиболее часто используемых методов снижения размерности.
Для визуального анализа данных часто используют проекции исходных векторов на плоскость первых двух главных компонент.
Различные алгоритмы факторного анализа объединены тем, что во всех них происходит переход к новому базису в исходном р-мерном пространстве. Важным является понятие «нагрузка фактора», применяемое для описания роли исходного фактора (переменной) в формировании определенного вектора из нового базиса.
Новая идея по сравнению с методом главных компонент состоит в том, что на основе нагрузок происходит разбиение факторов на группы. В одну группу объединяются факторы, имеющие сходное влияние на элементы нового базиса. Затем из каждой группы рекомендуется оставить одного представителя. Иногда вместо выбора представителя расчетным путем формируется новый фактор, являющийся центральным для рассматриваемой группы. Снижение размерности происходит при переходе к системе факторов, являющихся представителями групп.
Остальные факторы отбрасываются.
Вопросы и упражнения для самопроверки:
1. Чем обоснована необходимость решения задачи снижения размерности признакового пространства?.
2. Определите сущность задачи снижения размерности.
3. Сформулируйте различия компонентного и факторного анализов.
4. Перечислите проблемы факторного анализа.

5. Какими методами определяется число главных факторов?
6. Сформулируйте идею варимакс-вращения.
7. Рассмотрите реализацию факторного анализа в программной системе Statistica.

25 2.3.5. Тема «Исследование взаимосвязей социально- экономических явлений и прогнозирование»
Содержание темы
Математические задачи и методы в проблематике экспертного оценивания, шкалирования, латентного анализа, контент-анализа.
Методы исследования взаимосвязей различных типов данных. Анализ таблиц сопряженностей. Анализ ранговых признаков. Методы исследования взаимосвязей и зависимостей числовых данных. Методы прогнозирования социально-экономических показателей.
Литература: [1, 2, 4, 6, 9].
Методические указания по изучению темы
Применимость методов анализа социально-экономических явлений ограничена уровнем измерения переменных или шкалой, в которой измеряются переменные (шкала наименований, интервальная шкала, порядковая, шкала отношений).
Изучая методы анализа нечисловой информации, студенту необходимо понять, что поиск статистической связи между номинальными признаками – не самоцель. Например, выявленная в ходе опроса отрицательная связь между номинальными признаками
«Занятия спортом» и «Курение» позволяет сделать прогноз «При развитии массового спорта снизится число курящих».
Методы анализа ранговых корреляций используются для измерения связи между признаками, измеренными в порядковой шкале, а также в экспертных обследованиях для оценки согласованности мнений экспертов и построения интегральной
(совокупной) оценки признака. Следует отметить, что понятия
«статистическая связь» и «согласованность мнений» имеют в некотором смысле противоположный смысл. Если установлена сильная статистическая связь между признаками и есть возможность перейти от шкалы наименований к ранговой шкале, то вычисленные по тем же данным ранговые коэффициенты будут иметь малую величину.
При изучении данной темы большое внимание уделяется анализу временных рядов и построению модели тренда. Метод экстраполяции тренда - один из пассивных методов прогнозирования, - и называется
«наивным» прогнозом, так как предполагает строгую инерционность развития, которая представляется в виде проектирования прошлых тенденций в будущее, а главное — независимость показателей развития


26
от тех или иных факторов. Студенту следует на примере линейной модели уяснить методику построения модели, а для более сложных случаев необходимо использовать статистические пакеты прикладных программ.
Вопросы и упражнения для самопроверки:
1. Укажите различия трендовых и эконометрических моделей.
2. Приведите примеры различных форм связей.

3. Что такое «наивный прогноз»?
4. Определите понятие «ранг».
5. Проведен опрос населения по поводу планирующегося строительства магазина. Из 150 опрошенных мужчин 30 человек высказались против строительства, а из 100 женщин отрицательно отнеслись к строительству 50 человек. Есть ли связь между полом респондентов и их отношением к проекту?
6. Три эксперта оценили инвестиционную привлекательность 5 регионов следующим образом:
Регион 1
Регион 2
Регион 3
Регион 4
Регион 5
Иванов
1 2
5 4
3
Перов
1 3
4 5
2
Сонин
1 2
4 5
3
Оцените степень согласованности мнений экспертов.
7.
Покажите, что для постоянных маргинальных частот разность между наблюденной и «независимой» частотами в любой клетке таблицы 2х2 будут равны
D


27
ПРИЛОЖЕНИЕ 1
Таблица Заработная плата работников, тыс.руб.
№ Варианта
1
2
3
4
5
23 23 18 20 30 20 20 22 18 20 25 25 32 20 20 20 20 18 20 18 20 20 20 23 18 18 18 16 20 20 20 20 20 18 18 18 18 18 22 20 20 20 24 18 20 20 20 20 22 23 23 23 23 32 20 20 20 20 18 16 18 18 18 20 22 22 22 22 23 23 18 18 16 20 30 22 22 22 30 20 32 32 23 20 18 18 18 20 20 20 20 20 24 18 20 16 17 20 18 23 20 20 20 20 20 18 18 18 18 18 20 20 20 20 22 20 20 18 20 18 23 23 20 23 22 20 20 20 20 32 18 18 23 18 18 22 22 20 22 20 16 17 18 23 23 22 22 22 30 20
Число равных
интервалов
K=4
К=3
К=4
К=3
К=4

28
Продолжение табл.
№ Варианта
6
7
8
9
10
23 23 18 20 25 20 20 22 18 20 25 25 28 20 20 20 20 18 20 18 20 20 20 23 18 18 18 16 20 20 20 20 20 18 18 18 18 18 22 20 20 20 24 18 20 20 20 20 22 23 23 23 23 27 20 20 20 20 18 18 18 18 18 20 22 22 16 22 23 23 18 18 16 20 23 22 22 22 27 20 29 32 23 20 17 18 18 20 20 20 20 20 24 18 20 17 17 20 18 23 20 20 20 20 20 18 18 18 18 18 20 20 20 20 22 20 20 18 20 18 23 23 20 23 22 20 20 20 20 25 18 18 23 18 18 22 22 20 22 20 25 17 18 23 23 22 22 22 25 20
Число равных
интервалов
K=3
К=4
К=4
К=3
К=4

29
ПРИЛОЖЕНИЕ 2
ОСНОВНЫЕ СОЦИАЛЬНО-ЭКОНОМИЧЕСКИЕ ПОКАЗАТЕЛИ
Площадь территории
1)
, тыс. км
2
Численность населения на 1 января
2012 г., тыс. человек
Средне- годовая численность занятых в экономике, тыс. человек
Средне- душевые денежные доходы
(в месяц), руб.
Потреби- тельские расходы в среднем на душу населения
(в месяц), руб.
1 2
3 4
5
Сибирский
ФО
5145,0 19261,0 9018,6 16567,9 11824,8
Республика
Алтай
92,9 208,4 91,7 13836,9 7179,0
Республика
Бурятия
351,3 971,4 417,4 15715,5 11340,0
Республика
Тыва
168,6 309,4 106,0 10962,8 4944,6
Республика
Хакасия
61,6 532,2 239,2 14222,8 9680,5
Алтайский край
168,0 2407,2 1075,6 12499,9 9765,7
Забайкальский край
431,9 1099,4 489,4 15968,8 10572,7
Красноярский край
2366,8 2838,4 1437,5 20145,5 14105,7
Иркутская область
774,8 2424,4 1121,7 16017,2 10580,2
Кемеровская область
95,7 2750,8 1302,0 16666,0 11237,2
Новосибирская область
177,8 2686,9 1305,1 18244,1 14898,1
Омская область
141,1 1974,8 945,5 17247,9 12663,1
Томская область
314,4 1057,7 487,5 16516,0 11199,4


30
Продолжение Таблицы
Средне- месячная номиналь- ная начис- ленная заработная плата работ- ников, руб.
Валовой региональ- ный продукт в 2010 г. , млн. руб.
Основные фонды в экономике
(по полной учетной стоимости; на конец года)
2)
, млн. руб.
Ввод в действие общей площади жилых домов, тыс. м
2
Оборот розничной торговли, млн. руб.
6 7
8 9
10
Сибирский
ФО
20889,9 4093589,0 10256100 7213,8 2064138
Республика
Алтай
15632,4 21635,8 61628 76,6 14312
Республика
Бурятия
19924,0 136374,0 430210 304,4 100938
Республика
Тыва
19163,1 30601,0 47409 52,4 13742
Республика
Хакасия
20689,5 93709,0 292915 156,2 46034
Алтайский край
13822,6 299715,3 757632 663,2 218077
Забайкальский край
21099,6 162100,2 650405 276,9 106366
Красноярский край
25658,6 1050158,5 1815754 1047,1 361607
Иркутская область
22647,7 539245,6 1975486 755,2 225846
Кемеровская область
20478,8 622513,0 1406912 1082,6 287279
Новосибирская область
20308,5 482026,5 1229181 1505,2 368292
Омская область
19087,8 371218,1 725451 836,7 228595
Томская область
24001,0 284292,0 863117 457,6 93050

31
ПРИЛОЖЕНИЕ 3
Таблица - Основные показатели развития регионов Сибирского федерального округа
Валовой региональ- ный продукт в 2010 г. , млн. руб.
Площадь территории
)
, тыс. км
2
Численность населения на 1 января
2012 г., тыс. человек
Средне- годовая численность занятых в экономике, тыс. человек
Средне- душевые денежные доходы
(в месяц), руб.
Потреби- тельские расходы в среднем на душу населения
(в месяц), руб.
Средне- месячная номиналь- ная начис- ленная заработная плата работников, руб.
Основные фонды в экономике
(по полной учетной стоимости; на конец года)
2)
, млн. руб.
1 2
3 4
5 6
7 8
Республика Алтай
21635,8 92,9 208,4 91,7 13836,9 7179,0 15632,4 61628
Республика Бурятия
136374,0 351,3 971,4 417,4 15715,5 11340,0 19924,0 430210
Республика Тыва
30601,0 168,6 309,4 106,0 10962,8 4944,6 19163,1 47409
Республика Хакасия
93709,0 61,6 532,2 239,2 14222,8 9680,5 20689,5 292915
Алтайский край
299715,3 168,0 2407,2 1075,6 12499,9 9765,7 13822,6 757632
Забайкальский край
162100,2 431,9 1099,4 489,4 15968,8 10572,7 21099,6 650405
Красноярский край
1050158,5 2366,8 2838,4 1437,5 20145,5 14105,7 25658,6 1815754
Иркутская область
539245,6 774,8 2424,4 1121,7 16017,2 10580,2 22647,7 1975486
Кемеровская область
622513,0 95,7 2750,8 1302,0 16666,0 11237,2 20478,8 1406912
Новосибирская область
482026,5 177,8 2686,9 1305,1 18244,1 14898,1 20308,5 1229181
Омская область
371218,1 141,1 1974,8 945,5 17247,9 12663,1 19087,8 725451
Томская область
284292,0 314,4 1057,7 487,5 16516,0 11199,4 24001,0 863117
Продолжение Таблицы

32
Объем отгруженных товаров собственного производства по ВЭД, млн. руб. в том числе добыча полезных ископаем ых обрабаты- вающие производст ва
Производство и распределе- ние электро- энергии, газа и воды
Продукция сельского хозяйства - всего, млн. руб. растение- водства животн о- водства
Ввод в действие общей площади жилых домов, тыс. м
2
Оборот розничной торговли, млн. руб.
Инвестици и в основной капитал, млн. руб.
9 10 11 12 13 14 15 16 17 862 1296 1654 8020 1205 6815 76,6 14312 11802
Республика Алтай
12808 51115 19826 13044 4605 8439 304,4 100938 41017
Республика Бурятия
3376 514 2868 4648 827 3821 52,4 13742 7033
Республика Тыва
26536 56595 21462 9371 3216 6155 156,2 46034 38064
Республика Хакасия
6041 189279 31991 93784 46670 47114 663,2 218077 70833
Алтайский край
40377 14365 18311 15154 3433 11721 276,9 106366 51557
Забайкальский край
266636 628113 95432 68598 32708 35890 1047,1 361607 303885
Красноярский край
129795 299406 81275 43610 18748 24862 755,2 225846 137995
Иркутская область
507993 385413 85949 38044 19621 18423 1082,6 287279 225131
Кемеровская область
19674 249816 61592 60425 26860 33565 1505,2 368292 142078
Новосибирская область
4411 529355 36013 66911 33535 33376 836,7 228595 83342
Омская область
137513 100598 25617 19420 7225 12195 457,6 93050 101927
Томская область