Файл: Результат попытки теста.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 1491

Скачиваний: 69

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

РЕЗУЛЬТАТ ПОПЫТКИ ТЕСТА

# Вопрос Ответ Статус

1

К основным характеристикам Big Data относятся:

Variety, Velocity, Volume, Value Верно

2

Первый этап жизненного цикла данных в соответствии с методологией CRISP-DM:

Понимание бизнеса (Business understanding) Верно

3

На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?

Моделирование (Modeling) Верно

4

Объём накопленных человечеством цифровых данных на 2022 год измеряется:

Зеттабайтами Верно

5

Сколько в 1 зеттабайте тарабайт?

1,073742109

Верно

6

В каких из приведенных ниже случаев речь идет структурированных данных:

Данные о продажах фирмы, представленные в виде отчётов в MS Excel

Таблица с ежедневными показаниями температуры помещения за год в файле формата CSV Верно

7

Локальность данных Big Data – это:

Данные не стоит обрабатывать на сервере их хранения Верно

8

Отказоустойчивость Big Data – это, когда:

Сбой в одном звене системы не ведет к сбоям в других звеньях Верно

9

Заказчик бизнес-процесса – это должностное лицо:

Имеет в своем распоряжении ресурсы и полномочия для принятия решений о проведении работ по описанию, регламентации или аудиту бизнес - процесса Верно

10

Процессы маркетинга относят к группе:

Процессы управления Не верно

11

Процессы подбора персонала относят к группе:

Поддерживающие процессы Верно

12

Что такое Business Intelligence (Bl):

Cистема конкурентной разведки — сбор, обработка и анализ информации из различных источников с целью обоснования управленческих решений, позволяющих повысить конкурентоспособность бизнеса Не верно


13

Деревья решений относятся к группе (группам) …

логических методов

кибернетических методов Верно

14

Неверно, что Классификация относится к:

контролируемому обучению Не верно

15

Решение задачи прогнозирования ...

требует некоторой обучающей выборки данных Верно

16

Технология Web mining применяет технологию Data Mining для анализа:

неструктурированной информации

информации, содержащейся на Web-узлах Не верно

17

Медианой для выборки 1,__,3,7,10,15,16,18 является:

8,5 Верно

18

Алгоритм — это:

система правил, описывающая последовательность действий, которые необходимо выполнить для решения задачи Верно

19

Каким образом можно объявить переменную «а» на языке R:

а =

а >- Верно

20

Как можно получить помощь в R:

можно воспользоваться функцией help()

перед названием функции можно напечатать знак вопроса; Верно

21

Какие типы данных используются в R:

character

numeric

Не верно

22

Какая функция dplyr служит для вертикального объединения таблиц?

left_join() Верно

23

Как в R обозначаются пропущенные значения?

NA Верно

24

Какие циклы доступны в базовом синтаксисе языка R?

For

While Верно

25

Как назвается в R тип данных «числа с плавающей точкой»?

numeric Верно

26

Как назвается в R тип данных «целые числа»?

integer Верно

27

Как назвается в R тип данных «булевы»?

Boolen Не верно

28

Установите соответствие между способами обучения нейронной сети и их характеристиками:

Обучение без учителя - Модель использует неразмеченные данные, из которых алгоритм самостоятельно пытается извлечь признаки и зависимости



Обучение с учителем - Нейронная сеть обучается на размеченном наборе данных и предсказывает ответы, которые используются для оценки точности алгоритма на обучающих данных

Обучение с подкреплением - Система обучается в процессе взаимодействия с окружающей средой, а не на исторических данных Верно

29

Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:

SQL - Язык структурированных запросов, позволяющий работать с базами данных. С его помощью можно создавать и модифицировать данные, а управлением массива данных занимается соответствующая система управления базами данных (СУБД)

MapReduce - Модель распределения вычислений. Используется для параллельных вычислений над очень большими наборами данных (петабайты и более). В программном интерфейсе не данные передаются на обработку программе, а программа – данным. Таким образом, запрос представляет собой отдельную программу. Принцип работы заключается в последовательной обработке данных двумя методами

SAP HANA - Высокопроизводительная платформа для хранения и обработки данных. Обеспечивает высокую скорость обработки запросов. Еще одним отличительным признаком является то, что эта платформа упрощает системный ландшафт, уменьшая затраты на поддержку аналитических систем Верно

30

Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:

Метод дальнего соседа - Степень близости оценивается по степени близости между наиболее отдаленными объектами кластеров

Метод средней связи - Степень близости оценивается как средняя величина степеней близости между объектами кластеров

Метод медианной связи - Расстояние между любым кластером S и новым кластером, который получился в результате объединения кластеров P и Q, определяется как расстояние от центра кластера S до середины отрезка, соединяющего центры кластеров P и Q Ве