ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.11.2023
Просмотров: 515
Скачиваний: 23
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
5.2. Прямые методы приобретения знаний
209
Опишем упомянутые стратегии для выявления свойств высказыва- ний. Для выявления свойств Rf, Nrf или Arf используется Стратегия
подстановки.
Стратегия подстановки. Эксперту предъявляется высказывание,
полученное из канонической формы, в которой вместо имен обоих событий подставлено одно из них с призывом к эксперту сообщить свое мнение относительно истинности этого высказывания. В зависимости от ответа эксперта высказыванию приписывается то или иное значение
Rf, Nrf или Arf.
Пусть, например, речь идет о поиске типа семантической связи меж- ду событиями «вегетативные расстройства» (X) и «головная боль» (Y )
и исследуется следующее высказывание: «вегетативные расстройства сопровождаются головной болью».
Тогда из списка канонических форм (табл. 5.12) выбирается форма
«X сопровождается Y », далее стратегия выполняет подстановки: «ве- гетативные расстройства» — вместо X и «вегетативные расстройства»
вместо Y и предъявляет эксперту следующие вопросы:
— считаете ли Вы высказывание «вегетативные расстройства сопро- вождаются вегетативными расстройствами» утверждением, которое
1) является тавтологией;
2) не исключено;
3) невозможно.
Если эксперт указывает ответ 1, то высказыванию «вегетативные расстройства сопровождаются головной болью» приписывается свой- ство Rf, ответ 2 — Nrf; ответ 3 — Arf.
Опишем теперь функции, интерпретирующие ответы эксперта: [L],
P
1
([L]) и P
2
([L]) и строящие в базе знаний отношения, которые для простоты будут иметь те же обозначения, что и функции.
Если L — высказывание «A hпредикатное словоi B» — из некото- рого множества высказываний L, то положим [L] = {(A, B)}.
На первом шаге положим P
0
= ∅;
а) тогда P
0
(A, B) := P
0
(A, B) ∪ [L]; иначе говоря, функция P
0
по- полняет множество P
0
парами (A, B);
б) для пары (A, B) положим P
1
(A, B) = {(A, A)} ∪ {(B, B)}; тогда
P
1
[(A, B)] := P
1
[(A, B)] ∪ P
1
(A, B) ∪ P
0
(A, B) — т. е. для каждого вы- сказывания L множество P
0
пополняется парами (A, A) и (B, B);
в) P
2
[(A, B)] := P
2
[(A, B)] ∪ [L], если и только если A 6= B.
Легко видеть, что имеет место
Лемма 5.1. Отношение P
0
нерефлексивно,
P
1
рефлексивно,
P
2
ан-
тирефлексивно.
Для определения свойства Sm или отсутствия такового использует- ся стратегия перестановки.
210
Гл. 5. Приобретение знаний и машинное обучение
Стратегия перестановки. Вместе с высказыванием «
A hпреди- катное словоi B», эксперту предъявляется высказывание, в котором объект A заменен на B, а B — на A. В рассмотренном выше примере ему будет предложено ответить, справедливо ли утверждение, что «го- ловная боль всегда сопровождается вегетативными расстройствами?»
Ответы эксперта:
ДА
НЕТ
В случае утвердительного ответа, высказыванию приписывается свойство Sm, в случае отрицательного — Ns.
Со стратегией перестановки свяжем функцию P
3
замыкания по симметричности.
Для каждого высказывания L = «A hпредикатное словоi B»: в мно- жество P
3
помещаются пары (A, B) и (B, A).
Иначе говоря, P
3
[(A, B)] := P
3
[(A, B)] ∪ P
3
(A, B) ∪ P
0
(A, B), где
P
3
(A, B) = {(B, A)}.
Лемма 5.2. Отношение P
3
симметрично.
В том случае, если высказывание антирефлексивно и не оказывает- ся симметричным, для идентификации его типа необходимо уточнить характер несимметричности — возможную асимметричность.
Для установления асимметричности используется стратегия обра-
щения.
Стратегия обращения. Для некоторого конкретного высказы- вания «A hпредикатное словоi B»,эксперту предлагается подтвер- дить принадлежность высказывания «B hпредикатное словоi A»
какому-либо высказыванию из последней графы таблиц 1–9. Если эксперт подтвердил, и высказывания «A hпредикатное словоi B»
и «B hпредикатное словоi A» оказались в разных таблицах, то высказыванию «A hпредикатное словоi B» приписывается свойство As.
Для выявления транзитивности используется стратегия транс-
формации.
Стратегия трансформации. Стратегия заключается в предъявле- нии эксперту новой формулировки высказывания, такой, которая, с од- ной стороны, исключает неоднозначное толкование экспертом, с дру- гой — уточняет формулировку высказывания. Так, для каузального типа такой трансформацией (уточнением) является «если A то необхо- димо появится B». В случае подтверждения ее экспертом, высказыва- нию приписывается свойство Tr, иначе — Ntr. Этот критерий основан на том, что в четвертой части табл. 5.12 две похожие канонических формы Cоus и Pot отличаются друг от друга тем, что в Pot участвует модальность возможности, в отличие от Cous, в образовании которой участвует модальность необходимости. Что касается формы Fin, то она отличается от них своей антирефлексивностью.
5.2. Прямые методы приобретения знаний
211
Если рассмотреть функцию, которая для каждого высказывания
«A hпредикатное словоi B» и высказывания «B hпредикатное словоi C»
(или высказывания «D hпредикатное словоi A») пополняет отношение
P
4
парами (A, C) (или (D, B)), т. е. P
4
(A, B, C) = {(A, B) ∪ (B, C) ∪
∪ (A, C)}, то P
4
= P
4
∪ P
4
(A, B, C).
Имеет место
Лемма 5.3. Отношение P
4
транзитивно.
Используем введенные стратегии для описания метода установле- ния типов тех или иных высказываний.
Этот метод будем называть сценарием выявления сходства SAS.
Сценарий SAS. Представим сценарий выявления сходства в виде системы правил. Сценарий выполняется для каждой из пар [L] имен событий, выбранных экспертом. В ходе выполнения сценария строятся бинарные отношения Q
1
, Q
2
, ..., Q
10
, которые, как мы увидим, обладают определеными наборами значений свойств рефлексивности, симметрич- ности и транзитивности, а каждая из пар имен помещается в одно из этих отношений. Напомним, что в сценарии используются страте- гии подстановки (для выявления значения свойства рефлексивность),
перестановки (для выявления значения свойства смметричость), обра- щения (для выявления свойства асимметричность) и трансформации
(для выявления свойства транзитивность). Признаки J и D служат для обозначения синхронности и диахронности.
Дисциплина выполнения правил сценария определяется следующим метаправилом:
во всех тех случаях, когда в приведенных ниже правилах переход
явно не определен, выполняется ближайшее в порядке возрастания
номеров правило, условие которого к этому моменту оказалось
выполненным. После завершения работы сценария всякий раз вы-
полняется переход к правилу 1.
Правило 1. Эксперту предъявляется множество имен событий и пред- лагается указать в этом множестве пару имен таких событий,
которые, на его взгляд, связаны между собой.
Правило 2. Если эксперт отказывается указать такую пару, то сцена- рий заканчивает работу; если указывает, например, A и B, то эта пара имен событий подставляется в канонические формы выска- зываний вначале а) всюду вместо X подставляется A и вместо
Y подставляется B, затем б) всюду вместо X подставляется B
и вместо Y подставляется A.
Правило 3. Полученные в результате этого формы высказываний предъявляются эксперту с предложением выбрать из них наибо- лее соответствующее связи между A и B.
212
Гл. 5. Приобретение знаний и машинное обучение
Правило 4. Если эксперт отказывается указать какую-либо из них,
стратегия заканчивает работу.
Правило 5. Для указанной в п. 4. формы высказывания (пусть это для определенности, случай а) ), эксперту предлагается уточнить,
появляются ли оба события A и B одновременно или в разные моменты времени.
Правило 6. Если ответ — одновременно, то формируется признак J,
иначе формируется признак D.
Правило 7. Запускается работа стратегии подстановки применитель- но к указанной экспертом форме высказывания «A hпредикатное словоi B».
Правило 8. Если сформирован признак J и один из признаков Rf или Arf, то применительно к высказыванию «A hпредикатное словоi B» выполняется стратегия перестановки.
Правило 9. Если сформирован признак J и не сформирован при- знак Sm, то применительно к высказыванию «A hпредикатное словоi B» запускается стратегия обращения.
Правило 10. Если сформирован признак J, не сформирован признак
Sm и сформирован признак Rf или Arf, то применительно к вы- сказыванию «A hпредикатное словоi B» запускается стратегия трансформации.
Правило 11. Если сформирован признак D и признак Nrf, то примени- тельно к высказыванию «A hпредикатное словоi B» запускается стратегия трансформации.
Правило 12. Если сформированы признаки J, Arf и не сформирован признак Sm, то L относится к типу связи Gen(A, B); пополняется отношение
Q
10
:= P
2
(Q
10
∪ [L]).
Правило 13. Если сформированы признаки J, Arf, As, Tr, то тип связи
Sit(A, B);
Q
6
:= P
4
(P
2
(Q
6
∪ [L])).
Правило 14. Если сформированы признаки J, Arf, Sm, то тип связи
Neg(A, B);
Q
4
:= P
3
(P
2
(Q
4
∪ [L])).
Правило 15. Если сформированы признаки J, Nrf и не сформирован признак Sm, то тип связи Ins(A, B);
Q
5
:= Q
5
∪ [L].
Правило 16. Если сформированы признаки J, Rf, Tr и не сформирован признак Sm, то тип связи Com(A, B);
Q
1
:= P
4
(P
1
(Q
1
∪ [L])).
5.2. Прямые методы приобретения знаний
213
Правило 17. Если сформированы признаки J, Rf, Ntr и не сформиро- ван признак Sm, то тип связи Mcom(A, B);
Q
2
:= P
1
(Q
2
∪ [L]).
Правило 18. Если сформированы признаки J, Rf, Sm, то тип связи
Cor(A, B);
Q
3
:= P
3
(P
1
(Q
3
∪ [L]).
Правило 19. Если сформированы признаки J, Tr, Nrf, то тип связи
Fin(A, B);
Q
9
:= P
2
(Q
9
∪ [L]).
Правило 20. Если сформированы признаки D, Tr, Nrf, то тип связи
Cous(A, B);
Q
7
:= P
4
(Q
7
∪ [L]).
Правило 21. Если сформированы признаки D, Ntr, Rf, то тип связи
Pot(A, B);
Q
8
:= Q
8
∪ [L].
Приведем без доказательства следующие утверждения.
Теорема 5.2.1 (о корректности сценария SAS). Если сценарий
SAS паре (A, B) имен событий ставит в соответствие некоторый
тип семантической связи, то он — единственный.
Теорема 5.2.2. Построенные в результате работы сценария SAS
бинарные отношения обладают следующими свойствами:
I. Синхронные
а) Q
10
— нетранзитивное, антирефлексивное, несимметричное;
б) Q
6
— транзитивное, антирефлексивное, несимметричное;
в) Q
4
— нетранзитивное, антирефлексивное, симметричное;
г) Q
5
— нетранзитивное, нерефлексивное, несимметричное;
д) Q
1
— транзитивное, рефлексивное и антисимметричное;
е) Q
2
— нетранзитивное, нерефлексивное, и несимметричное;
ж) Q
3
— нетранзитивное, рефлексивное, симметричное.
II. Диахронные
з) Q
9
— нетранзитивное, антирефлексивное, несимметричное;
и) Q
7
) — транзитивное, нерефлексивное, несимметричное;
к) Q
8
— нетранзитивное, нерефлексивное, несимметричное.
Обозначим множество этих отношений через
Q.
Таким образом, сценарий выявления сходства каждую пару имен превращает в элемент некоторого бинарного отношения, которое отли- чается от остальных отношений набором своих свойств. Причем это отнесение выполняется в полном соответствии с такими неформаль-
214
Гл. 5. Приобретение знаний и машинное обучение
ными свойствами высказываний, как Ntr, Rf, Ns, Sm, Arf и другими,
которые выявляются в процессе работы этого сценария.
Заметим, что в отличие от п. 5.2.4, где описано девять типов отно- шений, сценарий SAS построил их десять. Дополнительно построено модально-комитативное отношение — одно из модальных отношений,
о которых мы упоминали в п. 5.2.4. Добавим также, что отношения
R
1
–R
8
неоднородных семантических сетей из первой главы обладают теми же наборами значений свойств, что и некоторые отношения из Q.
На этом основании можно выдвинуть гипотезу о том, что с помощью стратегии SAS вывляются, в частости, отношения структурного сход- ства, ассоциативные и каузальные отношения из гл. 1.
Это последнее обстоятельство используется при представлении в базах знаний выявленных таким образом отношений.
Перейдем теперь к рассмотрению иного способа приобретения зна- ний — приобретению знаний на основе анализа данных.
5.3. Приобретение знаний из примеров
Введение. Множество примеров является важным источником зна- ний в любой предметной области. В этой связи можно говорить о со- ответствующих методах приобретения знаний — приобретении знаний из примеров. Оcновой методов приобретения знаний из примеров явля- ются методы машинного обучения или обучения по примерам.
Традиционно к задачам обучения по примерам относятся зада- чи прогнозирования, идентификации (синтеза) функций, расшифровки языков, индуктивного вывода и синтеза с дополнительной информа- цией.
В широком смысле к обучению по примерам можно отнести и ме- тоды обучения распознаванию образов [103].
5.3.1. Задачи машинного обучения. Область деятельности под названием «машинное обучение» возникла несколько ранее четырех десятилетий назад как собирательное название ряда методов обучения на основе примеров и данных.
Задачи медицинской и технической диагностики, распознавания визуальных образов, проектирования, материаловедения, шахмат, обна- ружения закономерностей в больших массивах данных входят в сферу приложения методов машинного обучения.
Развитие методов искусственного интеллекта и их приложений поз- волило по-новому увидеть роль методов машинного обучения. Наряду с иными методами, машинное обучение стало играть важную роль в приобретении знаний интеллектуальными системами. В частности,
появилась возможность «расширить» узкое место инженерии знаний —
5.3. Приобретение знаний из примеров
215
передачу знаний из различных источников знаний в программную систему.
Для постановки и решения задач машинного обучения требуются примеры, базовые знания, а результатом является некоторое общее описание.
Далее, говоря о результате обучения, будем употреблять термины
«понятие» или «концепт», обучающие примеры будем называть при- мерами понятия. Понятие имеет, как уже было сказано выше, имя,
содержание и объем. Содержание понятия — выработанный человече- ством набор признаков, выделяющий его из множества других понятий;
объем понятия — множество его примеров или экземпляров.
Множество понятий может быть организовано в иерархию, пред- ставляемую деревом. Каждый уровень иерархии обычно отделяет кон- цепты друг от друга, однако они могут и пересекаться.
Множество примеров может содержать некоторый шум, порожден- ный ошибками описания или классификации. В частности, примеры могут быть не полностью описаны — не содержать некоторых атрибу- тов.
В самом общем случае можно выделить два класса методов ма- шинного обучения: 1-й класс — методы «черного ящика», такие как нейронные сети или методы математической статистики; 2-й класс —
методы, основанные на знаниях.
Методы первого класса используют такое внутреннее описание понятий, которое не предусматривает ясной интерпретации и объяс- нения процесса обучения. Они включают вычислительные процедуры,
такие как, например, вычисление весов или коэффициентов близости в некоторой метрике.
В то же время, методы, основанные на знаниях, направлены на со- здание таких структур символьных данных, преобразования которых,
да и сами структуры, легко интерпретируемы пользователем и удовле- творяют так называемому принципу транспарентности. Существенную роль здесь играет выбор языка представления.
1 ... 20 21 22 23 24 25 26 27 ... 33