Файл: Тесты по дисциплине Введение в анализ Big Data.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 30.10.2023

Просмотров: 2472

Скачиваний: 343

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тесты по дисциплине «Введение в анализ Big Data»

  1. Большие данные – это: 

  1. Данные объемом более 10Тб 

  2. Данные объемом более 100Тб 

  3. Данные объемом более 150Тб 

  4. Нет ограничений на минимальный объем




  1. Объём накопленных человечеством цифровых данных на 2023 год измеряется:

  1. Петабайтами

  2. Зеттабайтами

  3. Экзабайтами

  4. Йоттабайтами





  1. Кто создал первую модель искусственных нейронных сетей?

  1. Фрэнк Розенблатт

  2. Уоррен Мак-Каллок и Уолтер Питтс

  3. Ян Лекун

  4. Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс



  1. Определите правильную последовательность модели распределенных вычислений MapReduce:

  1. выбирает

  2. Reduce

  3. их

  4. Map

  5. предварительные

  6. агрегирует

  7. данные

Ответ: dbfea

  1. Не верно утверждение о том, что:

  1. Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных.

  2. Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации.

  3. Удешевление систем хранения на единицу информации привело к росту рынка больших данных.

  4. Большое разнообразие источников данных.




  1. Не верно, что Variety в контексте характеристик Big Data означает:

  1. Высокая скорость генерирования данных.

  2. Разные типы данных в колонках таблиц реляционных СУБД.

  3. Разнообразие отраслей, являющихся источниками данных.

  4. Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные.




  1. Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к сервисным услугам




  1. К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:


  1. программное обеспечение;

  2. оборудование;

  3. социальные сети;

  4. сервисные услуги;

  5. СУБДД.




  1. Определите правильную последовательность термина «Big Data»:

  1. быстро поступающей

  2. огромные объемы

  3. цифровой информации

  4. неоднородной

  5. которые

  6. обработать

  7. традиционными

  8. невозможно

  9. инструментами

Ответ: badcehfgi


  1. Сколько Петабайт в Зеттабайте

Ответ 10048576


  1. Укажите фактор(ы), способствовавший появлению тренда больших данных:

  1. маркетинговые кампании крупных корпораций;

  2. снижение издержек на хранение данных;

  3. появление новых технологий обработки потоковых данных;

  4. выпуск баз данных с обработкой данных в памяти.




  1. Отметьте значимые события, повлиявшие на формирование тренда больших данных:

  1. разработка Hadoop;

  2. изобретение принципа MapReduce;

  3. разработка языка Pyhton;

  4. победа Deepblue в матче с Г.Каспаровым.




  1. Не верно утверждение о том, что:

  1. Большие данные это данные объёма свыше 1 Тб.

  2. Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна.

  3. Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров.

  4. Большие данные как правило не структурированы.




  1. Найдите соответствие между понятием и его описанием

1) Data lake d

2) Data science b

3) Data mining a

4) Machine learning c

  1. Интеллектуальный анализ данных с целью выявления закономерностей.

  2. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме.

  3. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.

  4. Хранилище больших данных в необработанном виде.




  1. Не верно, что технология Web Mining применяет Data Mining для анализа:

  1. Неоднородной информации

  2. Неструктурированной информации

  3. Структурированной информации

  4. Распределенной и значительной по объему информации




  1. Установите соответствие между функциями и их определениями:

  1. mutate_at с

  2. transmute b

  3. mutate a

  1. изменяет определенные переменные по имени

  2. добавляет новые переменные во фрейм данных и удаляет существующие переменные

  3. добавляет новые переменные во фрейм данных, сохраняя существующие переменные






  1. Какой пакет позволяет загружать данные из листа Excel файла?

  1. readxl

  2. excelreadr

  3. googlesheets

  4. vroom

  5. sheets_read





  1. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?

  1. 168

  2. 4

  3. 42

  4. 126




  1. Data Mining — это процесс обнаружения в сырых данных…

  1.   ранее сформулированных гипотез  

  2.   неочевидных закономерностей 

  3.  практических закономерностей  

  4.  объективных закономерностей  

  5.  большого количества закономерностей




  1. В процессе работы Data Mining программы пользователь может получить:

  1.  некоторый процент недостоверных результатов 

  2.  только верные результаты, ложные выводы исключены 

  3.  только статистически достоверные результаты




  1. Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:

  1.  быть очевидными 

  2.  быть неочевидными 

  3.  быть практически полезными  

  4.  быть объективными  




  1. Интервальная шкала – это шкала…

  1.  содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла 

  2.  разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла 

  3.  содержащая только категории, которые не могут упорядочиваться 




  1. Такие данные как температура воздуха относятся к …

  1. атрибутивным данным

  2. непрерывным данным 

  3. дискретным данным  

  4. альтернативным данным





  1. Для какой шкалы применимы только такие операции как равно и не равно?

  1. номинальная шкала 

  2.  порядковая шкала 

  3.  интервальная шкала 




  1. Деревья решений относятся к группам …

  1.  статистических методов 

  2.  кибернетических методов 

  3.  логических методов 

  4.  методов кросс-табуляции 





  1. Регрессионный и дискриминантный анализ относятся…

  1.  к статистическим методам Data mining 

  2.  к кибернетическим методам Data mining 

  3.  не являются методами Data mining 




  1. Большинство методов Data mining были разработаны в рамках …

  1.  классического анализа данных 

  2.  теории баз данных 

  3.  теории искусственного интеллекта 




  1. Классификация относится к стратегии:

  1.  обучения с учителем 

  2.  обучения без учителя 

  3.  обучения с подкреплением 




  1. Алгоритм k-средних предназначен для решения задачи: 

  1. Классификации 

  2. Кластеризации

  3. Прогнозирования 

  4. Снижения размерности 




  1. Кластер можно охарактеризовать как …

  1.  группу объектов, имеющих общие свойства 

  2.  один объект, изолированный от других 

  3.  группу объектов, имеющую внутреннюю однородность




  1. Найдите соответствие между функцией в R и еe описанием:

1) str(object) b

2) summary(object) a

3) head(x) c

4) tail(x) d

  1. Общая информация об объекте

  2. Внутренняя структура объекта

  3. Посмотреть начальные строки объекта

  4. Посмотреть последние строки объекта




  1. Найдите соответствие между функцией в R и еe описанием:

1) с(…) a

2) seq(from, to, by=) b

3) list(…) c

4) cbind(…) d

  1. Объединяет объекты по столбцам

  2. Создает список объектов

  3. Объединяет аргументы в вектор

  4. Генерирует последовательность чисел с шагом




  1. Установите соответствие между функциями и их определениями:

  1. mutate_at c

  2. transmute b

  3. mutate a

  1. изменяет определенные переменные по имени

  2. добавляет новые переменные во фрейм данных и удаляет существующие переменные

  3. добавляет новые переменные во фрейм данных, сохраняя существующие переменные





  1. Какой пакет позволяет загружать данные из листа Excel файла?

  1. readxl

  2. excelreadr

  3. googlesheets

  4. vroom

  5. sheets_read





  1. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?

  1. 168

  2. 4

  3. 42

  4. 126





  1. Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?


  1. format(x)

  2. paste(…)

  3. tolower(x)

  4. nchar(x)





  1. Какая функция в R возвращает количество знаков в строке x?

  1. format(x)

  2. paste(…)

  3. tolower(x)

  4. nchar(x)





  1. Какая функция в R приводит строку к нижнему регистру?

  1. format(x)

  2. paste(…)

  3. tolower(x)

  4. nchar(x)





  1. Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?

  1. format(x)

  2. paste(…)

  3. tolower(x)

  4. nchar(x)




  1. Какие типы данных используются в R:

  1. logical

  2. numeric

  3. integer

  4. attributive

  5. complex

  6. character