Файл: 1 выбор платформы и данных.docx

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 508

Скачиваний: 18

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Вот примеры программного кода который создает новый объект pandas DataFrame с названием "data".

import random

import pandas as pd

data_list = []
# создаем пустой список для данных

for i in range(1000):
data_list.append(random.randint(-
10000, 10000)) # генерируем случайное число и добавляем в список

data = pd.DataFrame(data_list, columns=['values'])

Рис.4

Он заполняется данными из "data_list", и каждый элемент этого списка помещается в столбец с названием "values". Таким образом, "data" является таблицей с одним столбцом ("values") и количеством строк, которое соответствует размеру "data_list".

  • Рассчет стандартных числовых характеристик для набора данных Series

В Pandas наборы данных могут быть представлены в виде Series, которые содержат одну колонку и множество строк. Для рассчета стандартных числовых характеристик для набора данных Series в питоне можно использовать различные методы.

1. Минимальное значение:

Минимальное значение (Min) - это наименьшее значение в наборе данных. В питоне, чтобы найти минимальное значение в наборе данных можно использовать метод `min()`.

Вот примеры программного кода

import pandas as pd
import random

data_list = []
# создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-
10000, 10000
))

# преобразуем список в объект Series
data_series = pd.Series(data_list)

# находим минимальное значение
min_value = data_series.min()

print(min_value)

Рис.5

2. Подсчет количества повторяющихся элементов:

Подсчет количества повторяющихся элементов в Python - это процесс определения того, сколько раз каждый элемент встречается в заданной последовательности, например в списке. Это может быть полезно при анализе данных, например, чтобы найти наиболее часто встречающиеся элементы или обнаружить паттерны в данных.
Для подсчета количества повторяющихся элементов в Python можно использовать различные способы, включая циклы, словари, множества и другие структуры данных. Например, можно использовать цикл `for` для перебора элементов списка и счетчик для подсчета количества повторов каждого элемента. Можно также использовать структуру данных `collections.Counter`, которая позволяет создавать словари, содержащие количество каждого элемента в последовательности.
Более эффективные способы подсчета повторяющихся элементов включают использование алгоритмов сортировки и агрегации данных, а также библиотек, таких как `pandas` и `numpy`.
Вот примеры программного кода:

import pandas as pd
import random

data_list = []
# создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-
10000, 10000))

# преобразуем список в объект Series
data_series = pd.Series(data_list)

counts = {}
for i in

data_list:
counts[i] = counts.get(i
, 0) + 1
print(counts)

Рис.6

3. Максимальное значение:

Максимальное значение - это наибольшее значение, которое может принимать переменная или объект в Python. Для разных типов данных максимальное значение может быть разным.
Например, для целых чисел (int) максимальное значение зависит от используемой архитектуры и может быть разным для 32-битного и 64-битного Python. В 32-битном Python максимальное значение будет примерно 2 миллиарда, а в 64-битном - примерно 9 квинтиллионов.
Для чисел с плавающей точкой (float) максимальное значение зависит от используемого типа и может быть разным для float и double.
Для строк (str) максимально допустимая длина зависит от версии Python и используемого типа кодировки (например, UTF-8 или UTF-16).
Также максимальное значение может быть ограничено операционной системой или аппаратными возможностями компьютера.
В Python можно найти максимальное значение в списке или кортеже с помощью функции `max()`. Функция `max()` принимает один аргумент - последовательность элементов, для которой нужно найти максимальное значение.

Вот пример программного кода:

import random

data_list = []
# создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-
10000, 10000))

max_num =
max(data_list)
print(max_num)

Рис.7

4. Сумма значений:

Сумма значений - это сумма всех числовых значений, которые находятся в последовательности. В Python, существуют различные типы данных, для которых можно вычислить сумму. Для списка чисел можно воспользоваться функцией `sum()`. Кроме этого, можно вычислять сумму значений для других структур данных, таких как множества и словари.


Вот пример программного кода:

import random

data_list = []
# создаем пустой список для данных
for i in range(1000):
data_list.append(random.randint(-
10000, 10000))

data_sum =
0
for number in data_list:
data_sum += number
print(data_sum) # выведет сумму всех чисел в списке data_list

Рис.8

  • Выводы по разделу 

Количественный анализ данных это неотъемлемая часть прохождения данной практики. Очень важно визуализировать, делать расчёты и выполнять другие преобразования информации при анализе данных. Основываясь на информации в данном разделе можно сделать следующие выводы (табл.2.1): 

Таблица 2.1

Выводы по разделу 2

Выводы

Код и наименование компетенции выпускника программы бакалавриата

Код и наименование индикатора достижения компетенции

ЭТО ПРИМЕР ФОРМУЛИРОВКИ ВЫВОДОВ
На основе методов математического анализа получены расчетные значения статистических характеристик числовых данных

ОПК-1. Способен проводить моделирование, анализ и совершенствование бизнес-процессов и информационно-технологической инфраструктуры предприятия в интересах достижения его стратегических целей с использованием современных методов и программного инструментария

ОПК-1.1.

Знать методы анализа бизнес-процессов предприятия

ОПК-1.2.

Уметь использовать программный инструментарий для моделирования бизнес-процессов

ОПК-1.3.

Владеть навыками анализа и модернизации информационно-технологической инфраструктуры предприятия.

ОПК-4. Способен понимать принципы работы информационных технологий; использовать информацию, методы и программные средства ее сбора, обработки и анализа для информационно-аналитической поддержки принятия управленческих решений

ОПК-4.1.

Знать основы моделирования задач поддержки принятия управленческих решений, решаемых аналитическими методами.

ОПК-4.2.

Уметь использовать соответствующий математический аппарат для обработки, анализа и систематизации информации.

ОПК-4.3.

Владеть навыками использования инструментальных средств для обработки, анализа и систематизации информации для поддержки принятия управленческих решений.

ЭТО ПРИМЕР ФОРМУЛИРОВКИ ВЫВОДОВ
Разработаны процедуры и функции для визуализации данных с помощью стандартных библиотек по заданным критериям.

Разработаны процедуры для объединения и дополнения данных расчетными значениями.

Разработаны программы для визуализации данных, полученных в результате промежуточного анализа.

ОПК-6. Способен выполнять отдельные задачи в рамках коллективной научно-исследовательской, проектной и учебно-профессиональной деятельности для поиска, выработки и применения новых решений в области информационно-коммуникационных технологий.

 

ОПК-6.1.

Знать основные методы естественнонаучных дисциплин при решении задач научно-исследовательской, проектной и учебно-профессиональной деятельности

ОПК-6.2.

Уметь использовать методы и инструментальные средства естественнонаучных дисциплин в профессиональной деятельности

ОПК-6.3.

Владеть навыками использования методов естественнонаучных дисциплин для теоретического и экспериментального исследования в области информационно-коммуникационных технологий

УК-2. Способен определять круг задач в рамках поставленной цели и выбирать оптимальные способы их решения, исходя из действующих правовых норм, имеющихся ресурсов и ограничений

УК-2.1.

Знает необходимые для осуществления профессиональной деятельности правовые нормы и методологические основы принятия управленческого решения.

УК-2.2.

Умеет анализировать альтернативные варианты решений для достижения намеченных результатов; разрабатывать план, определять целевые этапы и основные направления работ.

УК-2.3.

Владеет методиками разработки цели и задач проекта; методами оценки продолжительности и стоимости проекта, а также потребности в ресурсах.

ОПК-3. Способен управлять процессами создания и использования продуктов и услуг в сфере информационно-коммуникационных технологий, в том числе разрабатывать алгоритмы и программы для их практической реализации

ОПК-3.1.

Знать методы проектирования и развертывания программных продуктов и услуг, обеспечивающих поддержку бизнес-процессов предприятия.

ОПК-3.2.

Уметь использовать современные технологические платформы и средства разработки для создания программных продуктов и услуг в сфере информационно-коммуникационных технологий.

ОПК-3.3.

Владеть методами проектирования и развертывания продуктов и услуг в сфере информационно-коммуникационных технологий.

ЭТО ПРИМЕР ФОРМУЛИРОВКИ ВЫВОДОВ

Проведен анализ технической документации с описанием возможностей библиотеки matplotlib в источнике на английском языке https://matplotlib.org/:

функции «get_ticks_by_series», отвечающей за деления на осях абсцисс и ординат.

УК-4. Способен осуществлять деловую коммуникацию в устной и письменной формах на государственном языке Российской Федерации и иностранном(ых) языке(ах)

УК-4.1.

Знает принципы построения устного и письменного высказывания на государственном и иностранном языках; требования к деловой устной и письменной коммуникации.

УК-4.2.

Умеет вести академическую и профессиональную дискуссии на государственном языке Российской Федерации и иностранном(ых) языке(ах).

УК-4.3.

Владеет методикой составления суждения в межличностном деловом общении на государственном и иностранном языках.





  • визуализация результатов количествнного анализа данных

  • Визуализация наборов данных с помощью стандартных библиотек по заданным критериям


Линейный график отображает зависимость одной переменной от другой на плоскости с помощью прямой линии. Это позволяет наглядно представить тенденции и изменения в данных, которые могут быть связаны с временем, количеством или любым другим фактором.
Гистограмма — это графическое представление распределения данных на интервалы. Она состоит из столбцов разной высоты, каждый из которых отображает количество значений, попавших в заданный интервал. Она широко используется в статистических исследованиях и анализе данных для представления распределения данных.
Matplotlib — это популярная библиотека для визуализации данных, диаграмм и других визуализаций данных. Она предоставляет множество инструментов и функций для настройки графиков, таких как изменение шрифта, цветовой палитры, масштаба осей, подписей и т.д.
Matplotlib поддерживает большое количество типов графиков, включая линейные, столбчатые, круговые диаграммы, гистограммы, scatter plots и многие другие. Библиотека также поддерживает трехмерные графики и анимации.
В Matplotlib можно создавать не только статические графики, но и взаимодействующие графические пользовательские интерфейсы (GUI), например, для визуализации в реальном времени.
Matplotlib является частью экосистемы Python для научных вычислений, которая включает множество других библиотек, таких как NumPy, SciPy, Pandas и др. Сочетание этих библиотек позволяет удобно и эффективно работать с данными, проводить исследования и визуализировать результаты.
Вот примеры программного кода:

import random
import pandas as pd
import matplotlib.pyplot