Файл: Беспятый Г. Ю. должность, уч степень, звание подпись, дата инициалы, фамилия отчет о лабораторной работе 1 по курсу теория систем и системный анализ.docx

ВУЗ: Не указан

Категория: Отчет по практике

Дисциплина: Не указана

Добавлен: 23.11.2023

Просмотров: 70

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

федеральное государственное автономное образовательное учреждение высшего образования

«САНКТ-ПЕТЕРБУРГСКИЙ ГОСУДАРСТВЕННЫЙ УНИВЕРСИТЕТ
АЭРОКОСМИЧЕСКОГО ПРИБОРОСТРОЕНИЯ»

Кафедра 2

ОТЧЕТ
ЗАЩИЩЕН С ОЦЕНКОЙ

ПРЕПОДАВАТЕЛЬ

ассистент










Беспятый Г.Ю.

должность, уч. степень, звание




подпись, дата




инициалы, фамилия




ОТЧЕТ О ЛАБОРАТОРНОЙ РАБОТЕ №1


по курсу: ТЕОРИЯ СИСТЕМ И СИСТЕМНЫЙ АНАЛИЗ






РАБОТУ ВЫПОЛНИЛ

СТУДЕНТ ГР. №

М122










Комаренко М.Ю.










подпись, дата




инициалы, фамилия

Санкт-Петербург 2023

Описание задачи

  1. Выберите данные формате CSV на сайте kaggle.

  2. Загрузите набор данных в формате CSV с помощью Pandas.

  3. Используя Pandas, выполните операции по обработке данных:

  • вычисление среднего и медианы

  • вычисление дисперсии и стандартного отклонения

  • вычисление корреляции между различными переменными

  • нахождение зависимостей между различными переменными


  • Используйте SciPy для выполнения статистических тестов:

    • t-тест для сравнения средних значений двух выборок

    • анализ дисперсии (ANOVA) для сравнения средних значений многих выборок

    • корреляционный анализ для оценки зависимостей между переменными

  • Визуализируйте полученные результаты с помощью библиотеки Matplotlib.



    Код программы

    import pandas as pd

    from scipy import stats

    import matplotlib.pyplot as plt

     

    # загрузка данных из CSV-файла

    data = pd.read_csv("starbucks.csv")

    print(data)

    print()

     

    # вычисление среднего и медианы

    mean = data.mean()

    print("\nСреднее значение\n", mean)

    median = data.median()

    print("\nМедиана\n", median)

     

    # вычисление дисперсии и стандартного отклонения

    variance = data.var()

    print("\nДисперсия\n", variance)

    std_dev = data.std(ddof=0)

    print("\nСтандартное отклонение\n", std_dev)

     

    # вычисление корреляций

    corr_coef = data.corr()

    print("\nКорреляция\n", corr_coef)

     

    # t-тест

    t_stat, p_value = stats.ttest_ind(data['calories'], data['carb'])

    print("\nt-тест\n", t_stat, p_value)

     

    # ANOVA

    f_stat, p_value = stats.f_oneway(data['fat'], data['carb'], data['protein'])

    print("\nANOVA\n", f_stat, p_value)

     

    # корреляционный анализ

    r, p_value = stats.pearsonr(data['calories'], data['carb'])

    print("\nКорреляционный анализ\n", r, p_value)

     

    # визуализация результатов

    plt.hist(data['calories'], bins=10)

    plt.title("Калории")

    plt.xlabel("Количество калорий")

    plt.ylabel("Частота")

    plt.show()

    plt.hist(data['carb'], bins=10)

    plt.title("Углеводы")

    plt.xlabel("Количество углеводов")

    plt.ylabel("Частота")

    plt.show()

     

    plt.scatter(data['calories'], data['carb'])

    plt.title("Диаграмма рассеяния между количеством углеводов и количеством жиров")

    plt.xlabel("Количество калорий")

    plt.ylabel("Количество углеводов")

    plt.show()


    Результат программы













    Выводы

    1) Корреляция. Проанализировав полученные корреляты, можно сделать вывод

    , что все единицы пищевой ценности связаны с калорийностью, в большей степени: углеводы и жиры, в меньшей: клетчатка.

    2) t – тест. Значение t довольно низкое, что говорит о маленькой разнице средних значений.

    3) ANOVA. Высокое значение f показателя говорит о значимой разнице между средними группами.

    4) Корреляционный анализ. Показатель r положителен достаточно высокий, что говорит о высокой корреляции значений калорий и углеводов.

    5) Получившиеся изображения.

    Большинство продуктов имеют калорийность больше 300, набирают они данную калорийность преимущественно за счет жиров и углеводов, также размеры порций не очень большие, учитывая всё выше сказанное, можно сделать вывод, что данные продукты не очень полезные.

    Самый низкокалорийный продукт – «Deluxe Fruit Blend», 80 килокалорий, 20г углеводов

    Самый высококалорийный продукт – «Sausage & Cheddar Classic Breakfast Sandwic», 500 килокалорий, 41г углеводов

    Самый низкоуглеводный продукт – «"Double Fudge Mini Doughnut», 130 килокалорий, 16г углеводов

    Самый высокоуглеводный продукт – «Reduced-Fat Banana Chocolate Chip Coffee Cake», 400 килокалорий, 80г углеводов

    Категория с самыми высококалорийными продуктами: «sandwich» - 395,7

    Категория с самыми низкокалорийными продуктами: «salad» - 80