ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 30.10.2023
Просмотров: 2472
Скачиваний: 343
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Тесты по дисциплине «Введение в анализ Big Data»
-
Большие данные – это:
-
Данные объемом более 10Тб -
Данные объемом более 100Тб -
Данные объемом более 150Тб -
Нет ограничений на минимальный объем
-
Объём накопленных человечеством цифровых данных на 2023 год измеряется:
-
Петабайтами -
Зеттабайтами -
Экзабайтами -
Йоттабайтами
-
Кто создал первую модель искусственных нейронных сетей?
-
Фрэнк Розенблатт -
Уоррен Мак-Каллок и Уолтер Питтс -
Ян Лекун -
Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс
-
Определите правильную последовательность модели распределенных вычислений MapReduce:
-
выбирает -
Reduce -
их -
Map -
предварительные -
агрегирует -
данные
Ответ: dbfea
-
Не верно утверждение о том, что:
-
Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных. -
Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации. -
Удешевление систем хранения на единицу информации привело к росту рынка больших данных. -
Большое разнообразие источников данных.
-
Не верно, что Variety в контексте характеристик Big Data означает:
-
Высокая скорость генерирования данных. -
Разные типы данных в колонках таблиц реляционных СУБД. -
Разнообразие отраслей, являющихся источниками данных. -
Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные.
-
Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к сервисным услугам
-
К технологиям, используемым для сбора и обработки Больших Данных, можно отнести:
-
программное обеспечение; -
оборудование; -
социальные сети; -
сервисные услуги; -
СУБДД.
-
Определите правильную последовательность термина «Big Data»:
-
быстро поступающей -
огромные объемы -
цифровой информации -
неоднородной -
которые -
обработать -
традиционными -
невозможно -
инструментами
Ответ: badcehfgi
-
Сколько Петабайт в Зеттабайте
Ответ 10048576
-
Укажите фактор(ы), способствовавший появлению тренда больших данных:
-
маркетинговые кампании крупных корпораций; -
снижение издержек на хранение данных; -
появление новых технологий обработки потоковых данных; -
выпуск баз данных с обработкой данных в памяти.
-
Отметьте значимые события, повлиявшие на формирование тренда больших данных:
-
разработка Hadoop; -
изобретение принципа MapReduce; -
разработка языка Pyhton; -
победа Deepblue в матче с Г.Каспаровым.
-
Не верно утверждение о том, что:
-
Большие данные это данные объёма свыше 1 Тб. -
Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна. -
Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров. -
Большие данные как правило не структурированы.
-
Найдите соответствие между понятием и его описанием
1) Data lake d
2) Data science b
3) Data mining a
4) Machine learning c
-
Интеллектуальный анализ данных с целью выявления закономерностей. -
Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме. -
Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта. -
Хранилище больших данных в необработанном виде.
-
Не верно, что технология Web Mining применяет Data Mining для анализа:
-
Неоднородной информации -
Неструктурированной информации -
Структурированной информации -
Распределенной и значительной по объему информации
-
Установите соответствие между функциями и их определениями:
-
mutate_at с -
transmute b -
mutate a
-
изменяет определенные переменные по имени -
добавляет новые переменные во фрейм данных и удаляет существующие переменные -
добавляет новые переменные во фрейм данных, сохраняя существующие переменные
-
Какой пакет позволяет загружать данные из листа Excel файла?
-
readxl -
excelreadr -
googlesheets -
vroom -
sheets_read
-
Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
-
168 -
4 -
42 -
126
-
Data Mining — это процесс обнаружения в сырых данных…
-
ранее сформулированных гипотез -
неочевидных закономерностей -
практических закономерностей -
объективных закономерностей -
большого количества закономерностей
-
В процессе работы Data Mining программы пользователь может получить:
-
некоторый процент недостоверных результатов -
только верные результаты, ложные выводы исключены -
только статистически достоверные результаты
-
Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами:
-
быть очевидными -
быть неочевидными -
быть практически полезными -
быть объективными
-
Интервальная шкала – это шкала…
-
содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла -
разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла -
содержащая только категории, которые не могут упорядочиваться
-
Такие данные как температура воздуха относятся к …
-
атрибутивным данным -
непрерывным данным -
дискретным данным -
альтернативным данным
-
Для какой шкалы применимы только такие операции как равно и не равно?
-
номинальная шкала -
порядковая шкала -
интервальная шкала
-
Деревья решений относятся к группам …
-
статистических методов -
кибернетических методов -
логических методов -
методов кросс-табуляции
-
Регрессионный и дискриминантный анализ относятся…
-
к статистическим методам Data mining -
к кибернетическим методам Data mining -
не являются методами Data mining
-
Большинство методов Data mining были разработаны в рамках …
-
классического анализа данных -
теории баз данных -
теории искусственного интеллекта
-
Классификация относится к стратегии:
-
обучения с учителем -
обучения без учителя -
обучения с подкреплением
-
Алгоритм k-средних предназначен для решения задачи:
-
Классификации -
Кластеризации -
Прогнозирования -
Снижения размерности
-
Кластер можно охарактеризовать как …
-
группу объектов, имеющих общие свойства -
один объект, изолированный от других -
группу объектов, имеющую внутреннюю однородность
-
Найдите соответствие между функцией в R и еe описанием:
1) str(object) b
2) summary(object) a
3) head(x) c
4) tail(x) d
-
Общая информация об объекте -
Внутренняя структура объекта -
Посмотреть начальные строки объекта -
Посмотреть последние строки объекта
-
Найдите соответствие между функцией в R и еe описанием:
1) с(…) a
2) seq(from, to, by=) b
3) list(…) c
4) cbind(…) d
-
Объединяет объекты по столбцам -
Создает список объектов -
Объединяет аргументы в вектор -
Генерирует последовательность чисел с шагом
-
Установите соответствие между функциями и их определениями:
-
mutate_at c -
transmute b -
mutate a
-
изменяет определенные переменные по имени -
добавляет новые переменные во фрейм данных и удаляет существующие переменные -
добавляет новые переменные во фрейм данных, сохраняя существующие переменные
-
Какой пакет позволяет загружать данные из листа Excel файла?
-
readxl -
excelreadr -
googlesheets -
vroom -
sheets_read
-
Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки?
-
168 -
4 -
42 -
126
-
Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение?
-
format(x) -
paste(…) -
tolower(x) -
nchar(x)
-
Какая функция в R возвращает количество знаков в строке x?
-
format(x) -
paste(…) -
tolower(x) -
nchar(x)
-
Какая функция в R приводит строку к нижнему регистру?
-
format(x) -
paste(…) -
tolower(x) -
nchar(x)
-
Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране?
-
format(x) -
paste(…) -
tolower(x) -
nchar(x)
-
Какие типы данных используются в R:
-
logical -
numeric -
integer -
attributive -
complex -
character