Файл: Контрольная работа По дисциплине Анализ больших данных.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.12.2023

Просмотров: 20

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ФЕДЕРАЛЬНОЕ АГЕНТСТВО СВЯЗИ

Федеральное государственное бюджетное образовательное учреждение

высшего образования

«Санкт-Петербургский государственный университет телекоммуникаций

им. проф. М.А. Бонч-Бруевича»

Институт непрерывного образования (ИНО)


Контрольная работа

По дисциплине «Анализ больших данных»

7 вариант

Студент: Юшкин Игорь Вадимович

Группа: ИБ-06с

Студ. Билет №: 2010659
Санкт-Петербург

2022

Лабораторная работа №1

Задание: Используя набор данных precip, определите города США с минимальным и максимальным уровнем годовых осадков.

Набор данных precip представлен в виде именованного вектора, поэтому выборку данных лучше делать через переменные.

Создадим переменную p и в нее запишем вектор. Далее в переменную min запишем минимальное значение по осадкам. А уже в переменную minCity определим город, который соответствует этому минимальному значению. То же самое проделаем, чтобы определить город с максимальным количеством осадков.





Лабораторная работа №2

Задание: Скачайте тексты трех русских народных сказок. Сформируйте облако слов, используя stopwords("russian"). Какие слова следует исключить? Добавьте эти слова в вектор исключаемых слов и сформируйте новое облако.

Продемонстрируйте приемы формирования различной цветовой гаммы.

Я скачал три сказки: «Каша из топора», «Гуси-лебеди», «Курочка ряба» и сформировал их текст в файл skazki.txt. Скачаем библиотеки необходимые для работы: tm, wordcloud. Далее с помощью метода Corpus определяем источник сказок (файл skazki.txt). Файл поддаем сортировке, чистке от символов, знаков препинания и т.д. с помощью tm_map.




Результат вывода работы программы:



Попробуем другой стиль цветов палитры (brewer.pal(6, "Paired"))):



Лабораторная работа №3

Задание: Создайте веб презентацию, включающую как минимум 7 слайдов, посвященных семи чудесам света. Каждый слайд должен содержать географическую карту места расположения чуда, время его создания и назначение сооружения.

Для начала установим библиотеки knitr. Создадим презентацию.



Код презентации:





Вывод презентации: