Файл: Методические указания по выполнению лабораторных работ и организации самостоятельной работы для студентов, обучающихся по направлению подготовки.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.11.2023
Просмотров: 45
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
12
Порядок выполнения лабораторной работы
1)
На основе исходных данных построить структурные группировки для категории «прибывшие в РФ»
2)
Определить среднее линейное и среднее квадратическое изменение структуры прибывших в РФ.
3)
Построить диаграммы структуры прибывших в исследуемых и базовом году
4)
На основе исходных данных построить структурные группировки для категории «выбывшие из РФ»
5)
Определить среднее линейное и среднее квадратическое изменение структуры выбывших из РФ.
6)
Построить диаграммы структуры выбывших в исследуемых и базовом году
7)
Сделать выводы относительно изменения структур.
8)
Оформить отчет.
ЛАБОРАТОРНАЯ РАБОТА 6 ( 4 часа)
Цель работы:
Построение информативной системы признаков. Снижение размерности признакового пространства. Применение алгоритмов факторного анализа для построения интегрированных показателей.
Исходные данные.. Определить вариант лабораторной работы и выбрать данные из таблицы ПРИЛОЖЕНИЯ 3
Вари- ант
Номера исследуемых показателей
Вари- ант
Номера исследуемых показателей
1.
2 1
11 6.
7 1
2 2.
3 1
10 7.
8 1
3 3.
4 1
9 8.
9 1
4 4.
5 1
8 9.
10 1
5 5.
6 1
7 10.
11 1
6
Исходные данные
Сформировать в EXCEL исходную таблицу, содержащую названия регионов и указанные в варианте показатели социально- экономического развития регионов СФО (ПРИЛОЖЕНИЕ 3).
Регион
Показатель Показатель
Показатель
13
x
y
z
…
…
…
Порядок выполнения лабораторной работы
1). Запустить модуль STA_FAC.EXE.
Скопировать файл исходных данных из EXCEL в систему
STATISTICA, предварительно увеличив число строк (случаев – case) до нужного количества.
2).. Определить средствами STATISTICA описательные статистики показателей (среднее, дисперсия и др.), коэффициент корреляции
3). Построить диаграммы распределения регионов по значению признаков.
4). Провести факторный анализ:
на стартовой панели модуля Factor Analysis (Факторный анализ) выберите все 3 переменные
задайте метод выделения факторов
(по умолчанию принимается метод Главных компонент),
число факторов (максимальное число факторов в случае трех переменных равно 3)
5). В окне Factor Analysis Results проанализировать результаты факторного анализа:
объясненная дисперсия
собственные значения
таблица факторных нагрузок
общности решения
значения факторов для каждого региона.
6). Сделать содержательную интерпретацию полученных результатов.
7). Оформить отчет
ЛАБОРАТОРНАЯ РАБОТА 7 ( 4 часа)
Цель работы:
Методы исследования взаимосвязей нечисловых данных. Анализ таблиц сопряженностей в программных системах EXCEL и
STATISTICA,
ЗАДАНИЕ
Исходные данные
. В файле ДляЛАБ_ТАБЛИЦЫ.xls приведены данные 50 респондентов о предпочитаемых напитках. При этом данные закодированы следующим образом: первая переменная ПОЛ (1- мужской, 2- женский), НАПИТОК (1-pepsi, 2-cola).
14
В соответствии с вариантом отобрать для анализа 20 анкет (строк).
№ варианта
1 2
3 4
5
Строки
2-21 5-24 10-29 15-34 20-39
№ варианта
6 7
8 9
10
Строки
25-44 30-49 32-51 3-22 6-25
Порядок выполнения лабораторной работы.
1.
Построить четырехклеточную таблицу вида
НАПИТОК
ПОЛ
1-pepsi
2-cola
Мужской (1) n
11
n
12
Женский (2) n
21
n
21
Для удобства подсчета n
11
, n
12, n
21, n
21 провести сортировку данных по первой переменной, а затем по второй.
Заполнение таблицы
2х2 можно провести
«вручную» или воспользоваться функцией СЧЁТЕСЛИ.
2). Провести одномерный анализ данных: рассчитать частоты, относительные частоты по каждому признаку, построить диаграммы различных видов (гистограммы, секторные; линейные и др.
3). провести анализ таблицы 2х2: установить наличие связи, рассчитать коэффициенты ассоциации, контингенции
4). Объяснить полученные результаты
5) Запустить модуль базовых характеристик STA_BAS.EXE.
6) Создать файл с исходными данными: скопировать данные из
EXCEL
7) Провести анализ таблицы сопряженностей 2х2:
Используя процедуру < Tables and banners >, построить таблицу сопряженности 2х2, получить Хи-квадрат, сравнить его с табличным, получить коэффициенты Ф, Крамера, контингенции
8) Объяснить полученные результаты
9) Оформить отчет.
ЛАБОРАТОРНАЯ РАБОТА 8 ( 4 часа)
Цель работы:
Исследование взаимосвязей и зависимостей числовых данных.
Применение алгоритмов регрессионного анализа в программной системе STATISTICA.
15
Исходные данные.. Определить вариант лабораторной работы и выбрать данные из таблицы ПРИЛОЖЕНИЯ 3
Вариант Фактор
(номер показа- теля)
Результат-
ВРП
Вариант Фактор
(номер показа- теля)
Результат-
ВРП
1.
2 1
6.
7 1
2.
3 1
7.
8 1
3.
4 1
8.
9 1
4.
5 1
9.
10 1
5.
6 1
10.
11 1
Порядок выполнения лабораторной работы
1). Запустить модуль STA_FAC.EXE.
2) Сформировать исходную таблицу, содержащую названия регионов и указанные в варианте показатели социально-экономического развития регионов СФО
3) Для проведения регрессионного анализа (линейная регрессия) использовать модуль Multiple Regression. В стартовом диалоговом окне модуля при помощи кнопки Variables указываются зависимая
(dependent) и независимые(ая) (independent) переменные. В поле Input file указывается тип файла с данными:
4) По окончании выполнения процедуры в окне Multiple Regressions
Results (результаты регрессионного анализа) отобразятся результаты расчетов:
Multiple R- коэффициент множественной корреляции:
RI (R
2
)- коэффициент детерминации;
F- F-критерий используется для проверки значимости регрессии.
df - число степеней свободы для F-критерия;
p- вероятность нулевой гипотезы для F-критерия;
Intercept– оценка свободного члена уравнения;
Beta- -коэффициенты уравнения.
ЛАБОРАТОРНАЯ РАБОТА 9 ( 4 часа)
Цель работы:
16
Анализ и прогнозирование динамики развития социально- экономических процессов. Построение моделей временного ряда в МS
Excel
Исходные данные. В соответствии с номером варианта необходимо выбрать данные из таблицы ПРИЛОЖЕНИЯ 5 исходных данных о численности персонала инновационных предприятий.
Вариант 1
Республика
Алтай
Вариант 7
Красноярский край
Вариант 2
Республика
Бурятия
Вариант 8
Иркутская область
Вариант 3
Республика Тыва Вариант 9
Кемеровская область
Вариант 4
Республика
Хакасия
Вариант 10
Новосибирская область
Вариант 5
Алтайский край
Вариант 11
Омская область
Вариант 6
Забайкальский край
Вариант 12
Томская область
Порядок выполнения лабораторной работы
1) построить линейную модель для выбранных данных,
2)
Для построенной в пункте (1) провести оценку модели по критерию Фишера, рассчитать коэффициент детерминации.
3)
Построить график динамики исходных и выровненных значений.
4)
Рассчитать точечный прогноз на следующий период
5)
5). Пользуясь средствами МS Excel, провести исследования различного вида моделей тренда. Рассмотреть линейную модель, полиномы 2-й и т.д. степеней, помещая на график уравнение тренда и значения коэффициента детерминации. Сделать прогноз на следующие периоды для разных трендов.
17 2. ОРГАНИЗАЦИЯ САМОСТОЯТЕЛЬНОЙ РАБОТЫ
СТУДЕНТА
2.1. ОБЩИЕ ПОЛОЖЕНИЯ
Цель самостоятельной работы по дисциплине – повышение эффективности изучения теоретической части дисциплины и полноценной работы на лабораторных занятиях, а также получение навыков самостоятельного проведения поиска, сбора и анализа информации по отдельным направлениям статистического анализа данных..
В соответствии с рабочей программой дисциплины «Статистика» на проведение самостоятельной работы студенту отводится 108 часов
(ПРИЛОЖЕНИЕ 6), включая 36 на самостоятельную подготовку к сдаче экзамена.
Более половины времени (55 часов) студенту необходимо использовать на подготовку к аудиторным занятиям и контрольным работам.. При проработке лекционного материала по каждой теме студент должен внимательно ознакомиться с конспектом лекций, а затем для углубленного изучения материала следует обратиться к литературным источникам
(учебникам, учебным пособиям, монографиям, статьям, статистическим сборникам), а также материалам, размещенным в сети Интернет. Для закрепления материала темы необходимо ответить на предлагаемые в пособиях вопросы и прорешать задачи по теме.
2.2. РЕКОМЕНДУЕМАЯ ЛИТЕРАТУРА
Основная литература
1)
Прасолов А.В. Математические методы экономической динамики [Электронный ресурс] : учебное пособие. — Электрон. дан.
— СПб. : Лань, 2015. — 350 с. Гриф УМО — Режим доступа: http://e.lanbook.com/books/element.php?pl1_id=67480 2)
Управление данными [Электронный ресурс] : учебник / В.В.
Цехановский, В.Д. Чертовской. — Электрон. дан. — СПб. : Лань, 2015.
—
432 с.
Гриф
УМО
—
Режим доступа: http://e.lanbook.com/books/element.php?pl1_id=65152
Дополнительная литература
3)
Симчера В.М Методы многомерного анализа статистических данных. М.: Финансы и статистика,2008. – 400с. ISBN:978-5-279-
18 03184-4. Гриф УМО. -[Электронный ресурс]. — URL: http://e.lanbook.com/books/element.php?pl1_cid=25&pl1_id=1005 4)
Божко В.П. Информационные технологии в статистике. М.:
Финансы и статистика, 2011. – 152 с. ISBN 978-5-279-03514-4. Гриф
УМО. [Электронный ресурс] : http://e.lanbook.com/books/element.php?pl1_cid=25&pl1_id=5686 5)
Информационные системы и технологии в экономике и управлении : Учебное пособие для вузов / Санкт-Петербургский государственный университет экономики и финансов ; ред. : В. В.
Трофимов. - 2-е изд., перераб. и доп. - М. : Высшее образование, 2007.
- 480 с. : ил. - (Университеты России). - В библиотеке ТУСУРа: 20 экз.
6)
Васильев А.Н. Числовые расчеты в Excel [Электронный ресурс] : учебное пособие. — Электрон. дан. — СПб. : Лань, 2014. —
598 с. — Режим доступа: http://e.lanbook.com/books/element.php?pl1_id=45683 7)
Бураков, П.В. Корпоративные информационные системы
[Электронный ресурс] : учебное пособие. — Электрон. дан. — Спб. :
НИУ ИТМО (Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики), 2014.
—
100 с.
—
Режим доступа: http://e.lanbook.com/books/element.php?pl1_id=70882 8)
Боровиков В.П. Прогнозирование в системе STATISTICA в среде Windows: Основы теории и интенсивная практика на компьютере : Учебное пособие для вузов / Владимир Павлович
Боровиков, Григорий Иванович Ивченко. - М. : Финансы и статистика,
2000. - 384 с. В библиотеке ТУСУР: 8 экз.
9)
Лепихина
З.П.
Основы социального прогнозирования:
Учебное пособие.
–
Томск:
Томский межвузовский центр дистанционного образования,
2006.–112с.
(Имеется в
ФДО, библиотеке ТУСУРа –2 экз., на каф.АОИ).
2.3. МЕТОДИЧЕСКИЕ УКАЗАНИЯ ПО ИЗУЧЕНИЮ ТЕМ
ДИСЦИПЛИНЫ
2.3.1. Тема «Основные положения анализа данных и специфика социально-экономических данных»
Содержание темы
Информационное обеспечение органов государственной власти.
Основные задачи государственной статистики. Современное состояние и перспективы развития информационных технологий в российской
19
статистике. Природа социально-экономической информации, виды и способы ее представления. Измерительные шкалы. Статистические показатели и статистические величины. Исследование статистических закономерностей: этапы, методы, показатели. Выборочный метод в изучении социально-экономических явлений и процессов. .Data mining как современное направление прикладного статистического анализа данных. Основные понятия и типы задач, решаемых Data Mining..
Литература: [1, 2, 4, 5].
Методические указания по изучению темы
Существует множество определений термина «анализ данных». В настоящее время большинство авторов подчеркивают, что Data Mining
- мультидисциплинарная область, возникшая и развивающаяся на базе таких наук как прикладная статистика, распознавание образов, искусственный интеллект, теория баз данных и др. При изучении методологических основ следует обратить внимание на связь прогностики с законами диалектики, на необходимость системного анализа исследуемого явления, процесса, объекта. Важно понять необходимость статистического анализа данных при принятии управленческих задач, сходство и различие понятий «данные»,
«информация», «прогноз», «план».
Теория статистических показателей занимает одно из центральных мест в общей теории статистики, так как отчетность организаций, планирование, исследовательская и аналитическая работа, моделирование и прогнозирование базируется на использовании различных систем статистических показателей. Все использующиеся в статистической практике показатели по форме выражения классифицируются на абсолютные, относительные и средние.
При изучении математических методов, применяемых при анализе данных, следует уяснить связь формальную постановку задачи с содержательной. Важным является правильный выбор метода, выбор вида модели для исследуемой предметной области.
Следует обратить внимание, что важными вопросами являются вопросы формирования выборочной совокупности, определение способа отбора единиц совокупности, вычисление ошибок выборки и построение доверительных интервалов выборочных характеристик, расчет необходимого объема выборки.
Вопросы и упражнения для самопроверки:
1. Охарактеризуйте понятия «информация» и «данные».
20 2. Сформулируйте задачи Data Mining.
3.