Файл: Работа с электронными таблицами. Часть Анализ данных.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2023
Просмотров: 26
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
МИНОБРНАУКИ РОССИИ
Федеральное государственное бюджетное образовательное учреждение
высшего образования
«Ижевский государственный технический университет имени М. Т. Калашникова»
Кафедра АСОИУ
ОТЧЁТ
по лабораторной работе № 3
по дисциплине «Информационные технологии»
на тему «Работа с электронными таблицами. Часть 2. Анализ данных»
Вариант 6
Выполнил
студент гр. Б22-780-4 А. Д. Харламова
Проверил
к.т.н., доцент кафедры АСОИУ А. Н. Соловьева
Ижевск, 2022
1. Задание
На сайте https://trudvsem.ru/opendata/datasets загрузите файл с расширением csv по своему варианту вакансий Северо-Кавказского федерального округа. Создайте новую книгу и импортируйте в неё файл. При импорте укажите кодировку текста Юникод (UTF-8), а также, что в качестве разделителя используется символ | (вертикальная черта). Убедитесь, что данные таблицы загружаются корректно.
Рисунок 1.1 - Скриншот табличного редактора с импортированным CSV-файлом вакансий Северо-Западного федерального округа.
2. Основные характеристики набора данных
Количество строк данных в исходном файле – 25667.
Количество строк после удаления неверно загруженных строк – 25423.
Количество вакансий, размещенных с начала этого календарного года – 24910.
Доля этих вакансий относительно общего количества предложений – 0,97986.
Формула расчета количества вакансий, размещенных с начала этого календарного года:
1. Из столбца date_create выносим год в столбец Год_создания_вакансии по формуле =ГОД(@H:H)
2. Рассчитываем количество вакансий, размещённых с начала этого календарного года по формуле =СЧЁТЕСЛИ(vacancy_6[Год_создания_вакансии];2022) в ячейку AJ5.
Формула расчета доли этих вакансий относительно общего количества предложений:
1. Делим количество вакансий, размещённых с начала 2022 года на общее количество вакансий по формуле =AJ5/СЧЁТ(vacancy_6[Год_создания_вакансии]), где AJ5 – количество вакансий, размещённых с начала 2022 года, а СЧЁТ(vacancy_6[Год_создания_вакансии]) – количество всех вакансий.
Формула для преобразования значений столбца state_region_code в код субъекта РФ: =ЛЕВСИМВ(@W:W;2).
На рисунке 2.1 представлены результаты расчета средних значений долготы и широты по каждому из субъектов РФ, представленных в наборе данных.
Рисунок 2.1 - Результаты расчета средних значений долготы и широты по каждому из субъектов РФ.
С помощью веб-сервиса https://www.bing.com/maps отметим на карте точки вычисленных значений координат, карта с точками представлена на рисунке 2.2.
Рисунок 2.2 - Карта с отмеченными на ней точками из расчетов.
Формула для заполнения столбцов salary_min:
=(ЕСЛИ(ИЛИ([@[old_salary_min]] = 0; ЕПУСТО([@[old_salary_min]] )); [@[old_salary_max]]; [@[old_salary_min]]))
Формула для заполнения столбцов salary_max:
=(ЕСЛИ(ИЛИ([@[old_salary_max]] = 0; ЕПУСТО([@[old_salary_max]])); [@[old_salary_min]]; [@[old_salary_max]]))
Минимальное значения заработной платы salary_min – 1528.
Максимальное значения заработной платы salary_min – 300000.
Среднее значение заработной платы – 21212,79.
Медиана заработной платы – 16806.
Мода заработной платы – 15279.
Среднее значение заработной платы вычисляется по формуле: =СРЗНАЧ(vacancy_6[salary_min]), где столбец vacancy_6[salary_min] хранит в себе значения salary_min.
Медиана заработной платы вычисляется по формуле: =МЕДИАНА(vacancy_6[salary_min]). Мода заработной платы вычисляется по формуле: =МОДА(vacancy_6[salary_min]). Результаты вычислений представлены на рисунке 2.3.
Рисунок 2.3 – Результаты расчета среднего значения, медианы, моды заработной платы.
Стандартное отклонение минимальной заработной платы – 10684,48.
Стандартное отклонение максимальной заработной платы – 12719,24.
Формула для расчета стандартного отклонения минимальной и макимальной заработной платы:
=СТАНДОТКЛОН(vacancy_6[salary_min])
=СТАНДОТКЛОН(vacancy_6[salary_max])
Результаты вычислений представлены на рисунке 2.4.
Рисунок 2.4 – Результаты расчета стандартного отклонения минимальной и максимальной заработной платы.
3. Распределение значений заработной платы
Построение гистограммы распределения заработной платы по столбцу salary_min происходит с помощью подключаемой надстройки “Пакет анализа”. Гистограмма представлена на рисунке 3.1.
Рисунок 3.1 – Гистограмма распределения заработной платы по столбцу salary_min.
Построение гистограмму распределения логарифма заработной платы происходит с помощью подключаемой надстройки “Пакет анализа” и вычисления логарифма от значений столбца salary_min. Гистограмма представлена на рисунке 3.2.
Рисунок 3.2 – Гистограмма распределения логарифма заработной платы.
Расчёт диапазонов средней заработной платы, заработной платы ниже средней и выше средней: сначала вычисляем логарифм по формулам: =10^4,26 - 1(нижняя граница диапазона средней заработной платы), =10^4,47 - 1(верхняя граница диапазона средней заработной платы). Если вычисленный логарифм <= 18196, то выводится «Ниже средней». Если вычисленный логарифм находится в диапазоне от 18196 до 29511, то выводится «Средняя». Если вычисленное значение превышает 29511, то выводится «Выше средней».
Формула для вычисления столбца “Величина заработной платы”: =ЕСЛИ([@[salary_min]]<$AK$8; "Ниже средней";ЕСЛИ(И([@[salary_min]] >= $AK$8; [@[salary_min]] <= $AK$9); "Средняя"; "Выше средней"))
4 Исследование характеристик вакансий
4.1 Количество вакансий по каждому уровню образования
На рисунке 4.1 представлена столбчатая диаграмма количества предложений по каждому уровню образования. Предварительно данные были перенесены из основного листа, отсортированы и сделан промежуточный итог.
Рисунок 4.1 - Столбчатая диаграмма количества предложений по каждому уровню образования.
4.2 Количество вакансий по типам предприятий
На рисунке 4.2 представлена круговая диаграмма количества предложений по каждому типу предприятий.
Рисунок 4.2 - Круговая диаграмма количества предложений по типу предприятий.
4.3 Количество вакансий с разным видом занятости
На рисунке 4.3 представлена, круговая диаграмма количества предложений по каждому виду занятости.
Рисунок 4.3 - Круговая диаграмма количества предложений по виду занятости.
4.4 Средняя заработная плата для вакансий с разным видом занятости
На рисунке 4.4 представлена, столбчатая диаграмма значений средней заработной платы.
Рисунок 4.4 - Столбчатая диаграмма значений средней заработной платы.