Файл: Интеллектуальные информационные системы и технологии.doc
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.11.2023
Просмотров: 384
Скачиваний: 11
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
поле знаний – условное описание основных объектов предметной области, их атрибутов и закономерностей, связывающих их;
знания, описанные на языках представления знаний (формально-логические, продукционные, фреймовые модели, семантические сети);
БЗ на машинных носителях информации.
В качестве источников знаний для построения БЗ выступают:
эксперты – высококвалифицированные специалисты в определенных проблемных областях;
протоколы рассуждений экспертов;
книги, справочники, инструкции;
примеры и прецеденты решения задач;
БД.
Существенными для понимания природы знаний являются способы определения понятий. Один из широко применяемых способов основан на идее интенсионала и экстенсионала. Интенсионал понятия – это определение его через соотнесение с понятием более высокого уровня абстракции с указанием специфических свойств. Экстенсионал –определение понятия через перечисление его конкретных примеров. При этом интенсионалы формируют знания об объектах, а экстенсионалы объединяют данные. В совокупности они формируют элементы поля знаний конкретной предметной области.
Простейший прагматический подход к формированию поля
знаний (Рz) включает этапы:
-
Определение входных и выходных данных. -
Составление словаря терминов и набора ключевых слов. -
Выявление объектов и понятий, т.е. формирование полного систематического набора терминов из области знаний. -
Выявление связей между понятиями. -
Выявление метапонятий и детализация понятий на более низком уровне. -
Построение пирамиды знаний – иерархической лестницы понятий, подъем по которой означает углубление понимания и повышение уровня обобщенности понятий. -
Определение отношений между понятиями как внутри каждого из уровней пирамиды, так и между уровнями. -
Определение стратегий принятия решений, т.е. выявление цепочек рассуждений, связывающих все сформированные ранее понятия и отношения. -
Структурирование Рz.
Знание имеет двоякую природу: предметную (фактуальную) и проблемную (операционную). Предметное знание – это известные сведения об объектах отражаемой реальности, которые накапливаются в БД. Проблемное знание отражает зависимости и отношения между объектами, позволяющие интерпретировать данные или извлекать из них информацию. Проблемные знания представляются в алгоритмической либо декларативной форме в виде БЗ. Часто предметные знания называют экстенсиональными (детализированными), а проблемные – интенсиональными (обобщенными).
В ИИС, основанных на БД, происходит разделение предметных и проблемных знаний. Первые организуются в виде БД, вторые – в виде алгоритмов и соответствующих программ. В качестве посредника при этом выступает некоторая СУБД. Концепция независимости программ от данных позволяет повысить гибкость ИИС по выполнению информационных запросов, но пользователь должен знать структуру БД и алгоритм решения задачи. Недостатками традиционных информационных систем являются слабая адаптивность к изменениям в предметной области и невозможность решения плохо формализуемых (неформализуемых) задач, которые обладают одной или несколькими из следующих характеристик:
- они не могут быть заданы полностью в числовой форме;
- цели не могут быть заданы в терминах точно определенной целевой функции;
- не существует алгоритмического решения задач;
- алгоритмическое решение существует, но оно труднореализуемо.
К числу неформализуемых относятся задачи интерпретации, диагностики, мониторинга, прогнозирования, планирования, обучения и управления.
Эти недостатки устраняются в ИИС, основанных на БЗ. При этом проблемные знания выделяются в БЗ, которая в декларативной форме хранит общие для различных задач единицы знаний. Управляющая структура приобретает характер универсального механизма решения задач (механизма логического вывода).
Следующим шагом в развитии ИИС стало выделение в самостоятельную подсистему (репозитарий) метазнаний (т.е. знаний о знаниях), которые описывают структуру предметных и проблемных знаний. Репозитарий отражает модель проблемной области в виде совокупности данных и правил. Интеллектуальные информационные системы, обрабатывающие метазнания, получили название систем, основанных на моделях. В таких системах и программы, и структуры данных генерируются или компонуются из единиц знаний, описанных в репозитарии, каждый раз при изменении модели проблемной области [22].
Знания могут быть классифицированы по категориям:
поверхностные – знания о видимых взаимосвязях между отдельными событиями и фактами в предметной области. Например, «если болит голова, то необходимо выпить лекарство»;
глубинные – абстракции, аналогии, схемы, отображающие структуры и природу процессов, протекающих в предметной области. Эти знания объясняют явления, например, знания квалифицированного врача о причинах головной боли.
Современные ЭС работают с поверхностными знаниями. Исторически первичными были процедурные знания, т.е. знания, «растворенные» в алгоритмах. Эти знания управляют данными. Для их изменения необходимо переделать программу. С развитием ИИ приоритет данных постепенно изменялся и все большая их часть сосредоточивалась в структурах данных (таблицах, списках, графах), т.е. возрастала роль декларативных знаний.
У знаний и данных много общего, однако знания имеют более сложную структуру, чем данные, полученные эмпирическим путем, и переход от данных к знаниям является закономерным следствием развития и усложнения информационных структур. Качественные свойства знаний характеризуются:
- более сложной, чем у данных, структурой. Знания – это данные о данных или метаданные;
- возможностью задавать знания как экстенсионально, так и
интенсионально (данные задаются только экстенсионально);
- внутренней интерпретируемостью знаний и возможностью их хранения в памяти компьютера вместе с данными;
- рекурсивной структурированностью знаний, т.е. возможностью их расчленения и объединения по принципу «матрешки»;
- возможностью установления различных отношений, отражающих семантику (смысл) и прагматику (отношение говорящего к тому, о чем он говорит) связей отдельных фактов, а также отношений, отражающих смысл системы в целом;
- наличием у знаний семантического пространства с метрикой, т.е. возможностью определять близость / удаленность информационных единиц;
- активностью знаний, что определяется возможностью ставить и достигать цели, формировать мотивы поведения, строить процедуры решения задач;
- функциональной целостностью знаний.
1.2. НЕ-факторы и нечеткие знания
При попытках выявления и формализации человеческих знаний возникают проблемы, типичные только для знаний, – так называемые
НЕ-факторы (недостоверные, неопределенные, неполные, нечеткие знания). Недостоверные – это знания, которые содержат НЕ-факторы, проявляющиеся в рассуждениях эксперта. Степень неуверенности, которую приписывает своим высказываниям эксперт в модальностях «я думаю», «я предполагаю», «я знаю», является неопределенностью. Неполнота связана с тем, что эксперт не знает какого-либо факта, необходимого для решения задачи. Нечеткость есть свойство количественной оценки экспертом качественных понятий и отношений, которые он использует в своих рассуждениях [19, 25]. Многозначность термина «нечеткость» проявляется в следующем:
1. Недетерминированность выводов означает, что путь решения конкретной задачи в пространстве ее состояний невозможно определить заранее. Поэтому в большинстве случаев методом проб и ошибок выбирается некоторая цепочка логических заключений, согласующихся с имеющимися знаниями, а если она не приводит к успеху, организуется перебор с возвратом для поиска другой цепочки. Для решения подобных задач предложено множество эвристических процедур. Недетерминированность выводов является неустранимой компонентой нечеткости знаний. Ее следует учитывать при выработке эффективных способов представления и хранения знаний, при построении алгоритмов поиска
и обработки знаний, которые позволяют получить решение задачи за меньшее число шагов. Для построения таких алгоритмов обычно применяются метазнания.
-
Многозначность интерпретации, как правило, связана с решением задач распознавания. Проблемы понимания смысла возникают в любой системе, взаимодействующей с пользователем на естественном языке. При компьютерной обработке знаний многозначность необходимо устранять путем выбора правильной интерпретации, для чего разработаны специальные методы (например, метод релаксации). -
Ненадежность знаний и выводов означает, что для оценки их достоверности нельзя применять булеву шкалу. Широкое применение на практике получили нечеткие выводы на базе нечеткой логики, опирающейся на теорию нечетких множеств (НМ). В последующем
это направление получило название «мягкие вычисления». Лотфи Заде введено одно из главных понятий в нечеткой логике – лингвистическая переменная (ЛП). Это переменная, значение которой определяется набором вербальных (словесных) характеристик некоторого
свойства или НМ. Например, ЛП «рост человека» определяется НМ: {карликовый, низкий, средний, высокий, очень высокий}.
Таким образом, значения ЛП идентифициются через НМ, которые в свою очередь определены на некотором базовом наборе значений или базовой числовой шкале, имеющей размерность.
Нечеткое множество определяется через некоторую базовую шкалу В и функцию принадлежности НМ – μ(х), х В, принимающую значения на интервале [0; 1]. Таким образом, нечеткое множество А – это совокупность пар вида (х, μ(х)), где х В. Часто используется такая запись:
,
где хi– i-е значение базовой шкалы;
n – число элементов НМ.
Функция принадлежности определяет субъективную степень уверенности эксперта в том, что данное конкретное значение базовой шкалы соответствует определяемому НМ. Эту функцию нельзя путать с вероятностью, носящей объективный характер и подчиняющейся определенным математическим зависимостям.
Пример 1.1. Пусть необходимо решить задачу интерпретации значений ЛП «возраст человека», таких как «младенческий», «детский», «юный», …, «старческий». Для этой ЛП определим базовую числовую шкалу В [0,100]. На рисунке 1.1.отражено, как одни и те же значения В могут участвовать в определении различных НМ.
Возраст
Младенческий
Детский
1 0,9 0,8 0,7 0,6 0,3 1 0,9 0,8 0,4 0,1
| | | | | | | | | | |
| | | | | | | | | | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |