Файл: Анализ информативных признаков в базе kdd выполнили студенты 1го курса.pptx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 29.11.2023
Просмотров: 13
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Анализ информативных признаков в базе KDD
Выполнили студенты 1-го курса
Группы БС-21:
Кирилин Алексей
Хлобыстов Андрей
Руднов Никита
Рудаков Роман
Баранов Владислав
Переход из строковой формы в табличную
1. Выделим основной столбец, на котором записаны все символы
2. Следом переходим во вкладку «Данные» и находим действие «Текст по столбцам»
Разделение одного столбца на несколько
3. Далее высветиться окошко, в котором следует сделать несколько шагов:
Выбрать вид разделения «с разделителями»
Выбрать символ-разделитель: «знак табуляции» и «запятая»
4. Заменяем все точки на запятые
Заходим во вкладку «Главная», находим действие «Найти и выделить»
и выбираем пункт «заменить»
В появившемся окне, вводим элементы, которые нужно найти и
на которые нужно заменить
Пример таблицы после выполнения всех действий
Выбор типа атаки
На данном этапе, вам следует выбрать один любой
тип атаки и тип атаки «normal.»
В нашем случае, мы рассмотрели тип атаки «nmap.»
Фильтрация данных
Для того, чтобы выбрать именно тот тип атаки, который вам нужен, необходимо
сделать фильтрацию тип атак и разновидностей сетевых подключений
После фильтрации, в основной таблице всё так же будут все типы атак. Чтобы убрать их,
нужно выделить всю табличку, нажать на действие «Найти и выделить» =>«Выделение группы ячеек…»
Переход от качественных характеристик
к количественным
1. Удаление дубликатов
2.Нумерация и распределение численных обозначений
Этот анализ заключается в том, чтобы удалить ненужные (то есть имеющие только одну величину) столбцы, чтобы упростить поставленную задачу
Нормализация данных
Корреляция
Если нету функции пакет анализов
Корреляция
- Смотрим только те значения корреляции, которые превосходят 0,7
Внешний вид таблицы после Корреляции
Регрессия
Столбец со значениями типов атак
(в нашем случая 42-ой столбец)
Все остальные столбцы, с добавлением ещё
одного столбца, где будут только единицы
Расчет параметров уравнения
Х
Х
Х
Y
Расчет теоретического значения
Критерий Стьюдента
Х
Х
Стандартные ошибки
коэффициента регрессии
Доверительные интервалы
для коэффициента регрессии
Спасибо за внимание