Добавлен: 07.11.2023
Просмотров: 508
Скачиваний: 18
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Вот примеры программного кода который создает новый объект pandas DataFrame с названием "data".
import random
import pandas as pd
data_list = [] # создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-10000, 10000)) # генерируем случайное число и добавляем в список
data = pd.DataFrame(data_list, columns=['values'])
Рис.4
Он заполняется данными из "data_list", и каждый элемент этого списка помещается в столбец с названием "values". Таким образом, "data" является таблицей с одним столбцом ("values") и количеством строк, которое соответствует размеру "data_list".
-
Рассчет стандартных числовых характеристик для набора данных Series
В Pandas наборы данных могут быть представлены в виде Series, которые содержат одну колонку и множество строк. Для рассчета стандартных числовых характеристик для набора данных Series в питоне можно использовать различные методы.
1. Минимальное значение:
Минимальное значение (Min) - это наименьшее значение в наборе данных. В питоне, чтобы найти минимальное значение в наборе данных можно использовать метод `min()`.
Вот примеры программного кода
import pandas as pd
import random
data_list = [] # создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-10000, 10000
))
# преобразуем список в объект Series
data_series = pd.Series(data_list)
# находим минимальное значение
min_value = data_series.min()
print(min_value)
Рис.5
2. Подсчет количества повторяющихся элементов:
Подсчет количества повторяющихся элементов в Python - это процесс определения того, сколько раз каждый элемент встречается в заданной последовательности, например в списке. Это может быть полезно при анализе данных, например, чтобы найти наиболее часто встречающиеся элементы или обнаружить паттерны в данных.
Для подсчета количества повторяющихся элементов в Python можно использовать различные способы, включая циклы, словари, множества и другие структуры данных. Например, можно использовать цикл `for` для перебора элементов списка и счетчик для подсчета количества повторов каждого элемента. Можно также использовать структуру данных `collections.Counter`, которая позволяет создавать словари, содержащие количество каждого элемента в последовательности.
Более эффективные способы подсчета повторяющихся элементов включают использование алгоритмов сортировки и агрегации данных, а также библиотек, таких как `pandas` и `numpy`.
Вот примеры программного кода:
import pandas as pd
import random
data_list = [] # создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-10000, 10000))
# преобразуем список в объект Series
data_series = pd.Series(data_list)
counts = {}
for i in
data_list:
counts[i] = counts.get(i, 0) + 1
print(counts)
Рис.6
3. Максимальное значение:
Максимальное значение - это наибольшее значение, которое может принимать переменная или объект в Python. Для разных типов данных максимальное значение может быть разным.
Например, для целых чисел (int) максимальное значение зависит от используемой архитектуры и может быть разным для 32-битного и 64-битного Python. В 32-битном Python максимальное значение будет примерно 2 миллиарда, а в 64-битном - примерно 9 квинтиллионов.
Для чисел с плавающей точкой (float) максимальное значение зависит от используемого типа и может быть разным для float и double.
Для строк (str) максимально допустимая длина зависит от версии Python и используемого типа кодировки (например, UTF-8 или UTF-16).
Также максимальное значение может быть ограничено операционной системой или аппаратными возможностями компьютера.
В Python можно найти максимальное значение в списке или кортеже с помощью функции `max()`. Функция `max()` принимает один аргумент - последовательность элементов, для которой нужно найти максимальное значение.
Вот пример программного кода:
import random
data_list = [] # создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-10000, 10000))
max_num = max(data_list)
print(max_num)
Рис.7
4. Сумма значений:
Сумма значений - это сумма всех числовых значений, которые находятся в последовательности. В Python, существуют различные типы данных, для которых можно вычислить сумму. Для списка чисел можно воспользоваться функцией `sum()`. Кроме этого, можно вычислять сумму значений для других структур данных, таких как множества и словари.
Вот пример программного кода:
import random
data_list = [] # создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-10000, 10000))
data_sum = 0
for number in data_list:
data_sum += number
print(data_sum) # выведет сумму всех чисел в списке data_list
Рис.8
-
Выводы по разделу
Количественный анализ данных это неотъемлемая часть прохождения данной практики. Очень важно визуализировать, делать расчёты и выполнять другие преобразования информации при анализе данных. Основываясь на информации в данном разделе можно сделать следующие выводы (табл.2.1):
Таблица 2.1
Выводы по разделу 2
Выводы | Код и наименование компетенции выпускника программы бакалавриата | Код и наименование индикатора достижения компетенции |
ЭТО ПРИМЕР ФОРМУЛИРОВКИ ВЫВОДОВ На основе методов математического анализа получены расчетные значения статистических характеристик числовых данных | ОПК-1. Способен проводить моделирование, анализ и совершенствование бизнес-процессов и информационно-технологической инфраструктуры предприятия в интересах достижения его стратегических целей с использованием современных методов и программного инструментария | ОПК-1.1. Знать методы анализа бизнес-процессов предприятия ОПК-1.2. Уметь использовать программный инструментарий для моделирования бизнес-процессов ОПК-1.3. Владеть навыками анализа и модернизации информационно-технологической инфраструктуры предприятия. |
ОПК-4. Способен понимать принципы работы информационных технологий; использовать информацию, методы и программные средства ее сбора, обработки и анализа для информационно-аналитической поддержки принятия управленческих решений | ОПК-4.1. Знать основы моделирования задач поддержки принятия управленческих решений, решаемых аналитическими методами. ОПК-4.2. Уметь использовать соответствующий математический аппарат для обработки, анализа и систематизации информации. ОПК-4.3. Владеть навыками использования инструментальных средств для обработки, анализа и систематизации информации для поддержки принятия управленческих решений. | |
ЭТО ПРИМЕР ФОРМУЛИРОВКИ ВЫВОДОВ Разработаны процедуры и функции для визуализации данных с помощью стандартных библиотек по заданным критериям. Разработаны процедуры для объединения и дополнения данных расчетными значениями. Разработаны программы для визуализации данных, полученных в результате промежуточного анализа. | ОПК-6. Способен выполнять отдельные задачи в рамках коллективной научно-исследовательской, проектной и учебно-профессиональной деятельности для поиска, выработки и применения новых решений в области информационно-коммуникационных технологий. | ОПК-6.1. Знать основные методы естественнонаучных дисциплин при решении задач научно-исследовательской, проектной и учебно-профессиональной деятельности ОПК-6.2. Уметь использовать методы и инструментальные средства естественнонаучных дисциплин в профессиональной деятельности ОПК-6.3. Владеть навыками использования методов естественнонаучных дисциплин для теоретического и экспериментального исследования в области информационно-коммуникационных технологий |
УК-2. Способен определять круг задач в рамках поставленной цели и выбирать оптимальные способы их решения, исходя из действующих правовых норм, имеющихся ресурсов и ограничений | УК-2.1. Знает необходимые для осуществления профессиональной деятельности правовые нормы и методологические основы принятия управленческого решения. УК-2.2. Умеет анализировать альтернативные варианты решений для достижения намеченных результатов; разрабатывать план, определять целевые этапы и основные направления работ. УК-2.3. Владеет методиками разработки цели и задач проекта; методами оценки продолжительности и стоимости проекта, а также потребности в ресурсах. | |
ОПК-3. Способен управлять процессами создания и использования продуктов и услуг в сфере информационно-коммуникационных технологий, в том числе разрабатывать алгоритмы и программы для их практической реализации | ОПК-3.1. Знать методы проектирования и развертывания программных продуктов и услуг, обеспечивающих поддержку бизнес-процессов предприятия. ОПК-3.2. Уметь использовать современные технологические платформы и средства разработки для создания программных продуктов и услуг в сфере информационно-коммуникационных технологий. ОПК-3.3. Владеть методами проектирования и развертывания продуктов и услуг в сфере информационно-коммуникационных технологий. | |
ЭТО ПРИМЕР ФОРМУЛИРОВКИ ВЫВОДОВ Проведен анализ технической документации с описанием возможностей библиотеки matplotlib в источнике на английском языке https://matplotlib.org/: функции «get_ticks_by_series», отвечающей за деления на осях абсцисс и ординат. | УК-4. Способен осуществлять деловую коммуникацию в устной и письменной формах на государственном языке Российской Федерации и иностранном(ых) языке(ах) | УК-4.1. Знает принципы построения устного и письменного высказывания на государственном и иностранном языках; требования к деловой устной и письменной коммуникации. УК-4.2. Умеет вести академическую и профессиональную дискуссии на государственном языке Российской Федерации и иностранном(ых) языке(ах). УК-4.3. Владеет методикой составления суждения в межличностном деловом общении на государственном и иностранном языках. |
-
визуализация результатов количествнного анализа данных -
Визуализация наборов данных с помощью стандартных библиотек по заданным критериям
Линейный график отображает зависимость одной переменной от другой на плоскости с помощью прямой линии. Это позволяет наглядно представить тенденции и изменения в данных, которые могут быть связаны с временем, количеством или любым другим фактором.
Гистограмма — это графическое представление распределения данных на интервалы. Она состоит из столбцов разной высоты, каждый из которых отображает количество значений, попавших в заданный интервал. Она широко используется в статистических исследованиях и анализе данных для представления распределения данных.
Matplotlib — это популярная библиотека для визуализации данных, диаграмм и других визуализаций данных. Она предоставляет множество инструментов и функций для настройки графиков, таких как изменение шрифта, цветовой палитры, масштаба осей, подписей и т.д.
Matplotlib поддерживает большое количество типов графиков, включая линейные, столбчатые, круговые диаграммы, гистограммы, scatter plots и многие другие. Библиотека также поддерживает трехмерные графики и анимации.
В Matplotlib можно создавать не только статические графики, но и взаимодействующие графические пользовательские интерфейсы (GUI), например, для визуализации в реальном времени.
Matplotlib является частью экосистемы Python для научных вычислений, которая включает множество других библиотек, таких как NumPy, SciPy, Pandas и др. Сочетание этих библиотек позволяет удобно и эффективно работать с данными, проводить исследования и визуализировать результаты.
Вот примеры программного кода:
import random
import pandas as pd
import matplotlib.pyplot