Файл: Интеллектуальные информационные системы и технологии.doc
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.11.2023
Просмотров: 391
Скачиваний: 11
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
х
Рис. 1.1. Формирование нечетких множеств
При этом НМ определяются следующим образом:
«младенческий» = ;
«детский» = .
Итак, НМ позволяют при определении понятия учитывать субъективные мнения отдельных экспертов.
Для обработки нечетких знаний используется нечеткая логика, опирающаяся на теорию Байеса. Эта теория оперирует условными вероятностями и входит в качестве раздела в классическую теорию вероятности. Методика разработана на основе утверждения: «некоторое событие произойдет, потому что раньше уже произошло другое событие». Нечеткая логика играет ту же роль, что и двузначная (булева) логика в классической теории множеств. В общем случае вместо классических истинных значений «истина» и «ложь» рассматриваются классические величины, учитывающие различные степени неопределенности. Они могут принимать целый ряд значений: «верно», «неверно», «в высшей степени верно», «не совсем верно», «более или менее верно», «не совсем ошибочно», «в высшей степени ошибочно» и т.п. [5].
Нечеткая логика имеет дело с ситуациями, когда и сформулированный вопрос, и знания, которыми мы располагаем, содержат нечетко очерченные понятия. Однако нечеткость формулировки понятий является не единственным источником неопределенности, поскольку порой нет уверенности в самих фактах. Например, если утверждается: «Возможно, что студент Иванов сейчас находится на лекции по ИИС», то говорить о нечеткости понятия «студент Иванов» и «лекция по ИИС» не приходится. Неопределенность заложена в самом факте, действительно ли студент Иванов находится на лекции.
Теория возможностей является одним из направления в нечеткой логике, в котором рассматриваются точно сформулированные вопросы, базирующиеся на некоторых знаниях.
Пример 1.2. Пусть на занятии присутствуют 10 студентов и известно, что несколько из них готовы ответить на вопросы преподавателя. Какова вероятность того, что преподаватель вызовет отвечать того, кто готов?
Обозначим искомую вероятность через Р. Просто вычислить искомое значение, основываясь на знаниях, что несколько студентов знают материал, невозможно.
Согласно теории возможности понятие «несколько» определяется как НМ:
«несколько» = {(3; 0,2), (4; 0,6), (5; 1), (6; 1), (7;0,6), (8; 0,3)}
Здесь выражение (3; 0,2) означает, что 3 из 10 вряд ли можно признать за «несколько», а выражения (5; 1) и (6; 1) означают, что 5 и 6
из 10 идеально согласуются с понятием «несколько». В определении НМ не входят значения 1 и 10, поскольку интуитивно ясно, что «несколько» означает «больше одного» и не «все». Значение «9» не внесено в НМ, потому как 9 из 10 это «почти все».
Распределение возможностей для Р рассчитывается по обычной формуле
,
которая после подстановки дает
Р = {(0,3; 0,2), (0,4; 0,6), (0,5; 1), (0,6; 1), (0,7; 0,6), (0,8; 0,3)}
Выражение (0,3; 0,2) означает: шанс на то, что Р = 0,3, составляет 20 %. Р рассматривается как нечеткая вероятность.
4. Неполнота знаний и немонотонная логика. Абсолютно полных знаний не бывает, поскольку процесс познания бесконечен. В связи с этим состояние БЗ должно изменяться с течением времени. В отличие от простого добавления информации, как в БД, при добавлении новых знаний в БЗ возникает опасность получения противоречивых выводов, когда выводы, полученные с использованием новых знаний, могут опровергать те, что были получены ранее. Еще хуже, если новые знания будут находиться в противоречии со «старыми», тогда механизм логического вывода может стать неработоспособным. В качестве средств формальной обработки неполных знаний, для которых необходимы немонотонные выводы, разрабатываются методы немонотонной логики (например, немонотонная логика Макдермотта и Доула, в которой вводятся условные логические операции, логика умолчания Рейтера, немонотонная логика Маккартни). Для организации логических выводов в интеллектуальных системах с неполными знаниями вместо традиционных индукции и дедукции (см. п. 3.1) применяется абдукция [3]. Абдукцией называется процесс формирования объясняющей гипотезы на основе заданной теории и имеющихся наблюдений.
Пример 1.3. Пусть теория содержит правило:
«ЕСЛИ <студент отлично знает математику>, ТО <он может стать хорошим инженером>» и факт:
«Студент Иванов отлично знает математику».
Кроме того, имеется наблюдение:
«Студент Иванов стал хорошим экономистом», которое не выводится из заданной теории. Для того чтобы его вывести, необходимо сформировать абдуктивную (объясняющую) гипотезу, которая не будет противоречить вышеприведенной теории. Такой гипотезой может быть следующая:
«Хороший математик может стать хорошим экономистом».
5. Неточность знаний. Для учета неточности лингвистических знаний используется теория НМ. Развитие исследований в области нечеткой математики привело к появлению нечеткой логики и нечетких выводов, которые выполняются с использованием знаний, представленных НМ, нечеткими отношениями и нечеткими соответствиями.
Глава 2. Технология и методы извлечения знаний
2.1. Процедура извлечения знаний
Центральным понятием на стадиях получения и структурирования знаний является «поле знаний» Pz (см. п. 1.1) – условное нормальное описание основных понятий предметной области и взаимосвязей между ними, представленных в виде текста, графа, диаграммы или таблицы. Поле знаний представляет собой модель знаний о предметной области в том виде, в каком ее сумел выразить эксперт на некотором символьном либо графическом языке L, который должен обладать свойствами максимальной точности, минимальной избыточности и однозначности терминов [5, 24].
Учение о символах получило название «семиотика». В последнее время как ее ответвление сформировалась «прикладная семиотика». Семиотика включает в себя:
-
синтаксис – совокупность правил построения языка или отношения между знаками; -
семантику – связь между элементами языка и их значениями или отношения между знаками и реальностью;
- прагматику – отношения между знаками и их пользователями (область практических разработок и использования Pz).
При формировании Pz ключевым является сам процесс получения знаний, когда происходит перенос компетентности экспертов на когнитологов. Извлечение знаний – это процедура взаимодействия эксперта с когнитологом, в результате чего становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. При построении промышленной ЭС процесс извлечения знаний является самым «узким» местом, поскольку он сопряжен с преодолением ряда трудностей [2], таких как организационные неувязки; неудачный метод извлечения, не совпадающий со структурой знаний в данной области; неадекватная модель для представления знаний; неумение наладить контакт с экспертом; терминологический разнобой; отсутствие целостной системы знаний в результате извлечения только «фрагментов» знаний и т.д.
Процесс извлечения знаний – это длительная и трудоемкая процедура, когда когнитологу необходимо воссоздать модель предметной области, которой пользуются эксперты для принятия решения.
Приобретение знаний представляет собой процесс наполнения БЗ экспертом с использованием специализированных программных средств при прямом контакте с ЭС.
Формирование знаний – процесс анализа данных и выявления скрытых закономерностей с использованием специального математического аппарата и программных средств. Традиционно к задачам формирования знаний или машинного обучения относятся задачи прогнозирования, идентификации и распознавания образов. Извлечение, приобретение и формирование знаний определяют три основные стратегии получения знаний (рис. 2.1).
С применением
компьютера
Без применения
компьютера
Формирование
знаний
Приобретение
знаний
Извлечение
знаний
Рис. 2.1. Стратегии получения знаний
2.2. Основные аспекты извлечения знаний
Процедура извлечения знаний включает психологический, лингвистический и гносеологический аспекты. Психологический является ведущим, поскольку определяет успешность и эффективность взаимодействия когнитолога с экспертом.
Извлечение знаний происходит через общение, которое является процессом выработки новой информации, общей для общающихся людей и рождающей их общность.
Можно выделить следующие структурные компоненты модели общения при извлечении знаний:
участники общения (партнеры);
средства общения (процедура);
предмет общения (знания).
В соответствии с этой структурой выделяются три слоя психологических проблем, возникающих при извлечении знаний: контактный, процедурный и когнитивный.
Разработка проблематики контактного слоя позволяет выявить параметры партнеров, влияющие на результаты извлечения
знаний:
личность, под которой понимается устойчивая система психологических черт, характеризующая индивидуальность человека: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, собранность, настойчивость, общительность, находчивость;
темперамент (холерик, сангвиник, флегматик, меланхолик). Известно, что флегматики и меланхолики медленнее усваивают информацию. Их не нужно торопить с ответом, задавать быстрый темп диалогу. Зато они гораздо лучше усваивают новое, чем холерики, для которых характерно поверхностное усвоение информации;
мотивация, которая определяет стремление к успеху. Когнитолог должен изыскать различные стимулы для эксперта, в том числе и материальные. Знания – один из самых дорогих продуктов, и их отторжение от эксперта должно быть вознаграждено;