Файл: Методыискусственногоинтеллекта.pdf

Скачать файл (3,33Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 434

Скачиваний: 22

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1.2. Системы, основанные на правилах, или продукционные системы
35
для формул же из множества D, которые также в результате этого процесса превратились в факты, значения, находящиеся на местах свободных переменных, удаляются из таблиц, соответствующих этим фактам в смысле отображения I.
В дальнейшем тройку: множество правил + рабочая память +
+ стратегия управления будем называть системой, основанной на
правилах.
Состоянием системы, основанной на правилах, будем называть со- стояние рабочей памяти вместе с множеством применимых правил.
Системы, основанные на правилах, являются важным классом си-
стем, основанных на знаниях.
1.2.4. Разрешение конфликтного множества правил.
Определение 1.2.4. Конфликтным множеством называется мно- жество правил, применимых к некоторому состоянию.
Разрешение конфликтного множества, т. е. выбор одного правила из множества применимых, достигается использованием тех или иных стратегий управления.
Можно выделить два основных типа стратегий управления [8, 10]:
безвозвратный и пробный. В стратегиях безвозвратного типа выбран- ное правило исполняется необратимо, без возможности пересмотра в дальнейшем. В пробном режиме резервируется возможность возврата к исходному состоянию для испытания другого правила.
Среди пробных режимов управления различаются режим с возвра-
щением, где запоминается точка возможного возврата, и управление с поиском на графе, где происходит запоминание результатов приме- нения нескольких цепочек правил с дальнейшим поиском на графовых структурах.
Безвозвратные стратегии управления используются, главным обра- зом, в коммутативных системах правил, поскольку, как мы покажем ниже, в коммутативных системах применение неудачного правила ото- двигает, но не блокирует завершение вычислений.
Определение 1.2.5. Последовательность правил называется при-
менимой, если условие каждого правила последовательности выполня- ется в состоянии, полученном в результате применения предыдущего правила.
Определение 1.2.6. Множество П правил коммутативно, если а) каждое из правил множества правил П, применимое к состоя- нию S рабочей памяти D, применимо к состоянию S
1
рабочей памяти D, полученному при выполнении любого применимого правила из П к S;
2*

36
Гл. 1. Методы представления знаний
б) целевое состояние, удовлетворяющееся некоторым состоянием S
рабочей памяти D, удовлетворяется состоянием, полученным из
S выполнением любого применимого правила из П;
в) в любой применимой последовательности перемена мест правил не приводит к изменению результирующего состояния.
Теорема 1.2.1. Если существует последовательность π правил
из множества П, переводящая начальное состояние
S
0
рабочей
памяти в целевое состояние
S
1
, и множество П коммутативно, то
любая иная применимая последовательность
π
∼
правил из П может
быть продолжена таким образом, что будет переводить состояние
S
0
в состояние, удовлетворяющее целевому состоянию
S
1
Д о к а з а т е л ь с т в о. Построим последовательность hπ, π
∼
i. В си- лу п. а) определения 1.2.6 эта последовательность будет применимой,
а в силу п. б) того же определения целевое состояние будет удовлетво- ряться результирующим состоянием этой последовательности.
Переместим правило П
∼
1
из последовательности π
∼
на место перво- го правила П
1
последовательнсти π так, чтобы правило П
1
оказалось вторым в этой последовательности.
Правило П
∼
1
окажется применимым к S
0
в силу условия теоремы,
а правило П
1
— применимым к S
1
в силу п. а) определения 1.2.6.
В силу п. в) того же определения такая перестановка не изменит результирующего состояния последовательности.
Продолжая выполнение перестановок до исчерпания правил по- следовательности π
∼
, получим последовательность hπ
∼
, πi, которая окажется применимой и удовлетворяющей целевое состояние S
1
. Тем самым, теорема доказана.
П
РИМЕЧАНИЕ
. Фраза «состояние X удовлетворяет состояние Y »
означает, вообще говоря, что формулы состояния Y выполняются в со- стоянии X; в нашем же случае, когда для простоты под состоянием понимается множество фактов, приведенная выше фраза означает, что
Y ⊆ X.
Из доказанной теоремы вытекает важное следствие о полноте
безвозвратных стратегий в коммутативных системах правил. Это означает, что в коммутативных системах правил можно использовать безвозвратные стратегии без риска потерпеть неудачу.
Таким образом, коммутативные системы правил представляют со- бой важный класс правил, обладающий полезными свойствами.
Стратегии с возвращениями. Стратегия с возвращениями основа- на на том, что запоминается всякое состояние, в котором сформировано конфликтное множество правил. Из этого конфликтного множества

1.2. Системы, основанные на правилах, или продукционные системы
37
выбирается некоторое правило П и применяется. К полученному со- стоянию применяется следующее применимое правило и т. д. Если этот путь не ведет к решению, то все сделанные шаги «забываются»
и вместо правила П выбирается другое правило.
Стратегии с возвращениями можно использовать независимо от того, насколько полной информацией для выбора подходящего правила мы располагаем. Если такая информация вообще отсутствует, можно выбирать правила в соответствии с произвольной схемой. В конечном счете, механизм возвращений позволит выбрать подходящее правило.
Однако если имеется информация о том, как выбрать подходящее правило, возвращения будут реже и вычисления окажутся более эф- фективными.
Если, например, на множестве состояний системы определить неко- торую функцию, значения которой будут говорить о «качестве» при- мененного правила, то выбор правила будет осуществляться на основе вычисления значений этой функции.
Второй путь состоит во введении на множестве состояний метрики таким образом, чтобы в этой метрике можно было бы оценивать сте- пень близости полученного состояния к целевому. Во многих случаях этот подход позволяет уменьшить число возвращений, а на монотонных участках траектории системы полностью их исключает.
Третий путь состоит в использовании знаний о возможных состо- яниях и переходах между ними: о тех, в которые следует переходить,
и о тех, которые являются «запрещенными». Например, в шахматных программах к первому типу относятся знания о гамбитах, эндшпилях,
миттельшпилях и т. д., ко второму типу — знания об угрозах коро- лю, другим фигурам и т. д. В системах, например, автоматического планирования сборочного процесса автомобильного двигателя к числу запрещенных состояний относится, в частности, состояние, в котором на двигатель установлена крышка газораспределительного механизма,
однако не установлен распределительный вал. Существует и ряд иных процедур «оптимизации» процесса поиска.
Стратегии поиска на графе. В стратегиях с возвращением управ- ляющая система забывает все пробные пути, не приведшие к успеху.
Однако если бы стратегия запоминала пробные пути для того, чтобы любой из них мог быть кандидатом на дальнейшее продолжение, такая стратегия была бы более гибкой.
Стратегию управления с поиском на графе можно рассматривать как средство нахождения пути на графе от вершины, являющейся исходным состоянием рабочей памяти, к вершине, являющейся целе- вым состоянием рабочей памяти. Часто оказывается полезным каждой дуге графа (i, j) приписать некоторое положительное число c(i, j) —

38
Гл. 1. Методы представления знаний
ее стоимость. Стоимость пути между двумя вершинами равна сумме стоимостей всех дуг на этом пути.
Задачи простейшего типа сводятся к поиску пути (возможно, с ми- нимальной стоимостью) между вершиной s, соответствующей началь- ному состоянию рабочей памяти, и известной вершиной t, соответству- ющей состоянию рабочей памяти, удовлетворяющему целевое условие.
Нередко встречается ситуация, в которой требуется найти путь между вершиной s и любой вершиной из множества {t}, представляющего состояния рабочей памяти, удовлетворяющие целевое условие.
В большинстве практически интересных случаев стратегия управле- ния используется для порождения фрагментов имплицитно заданных графов. Для имплицитного задания графа необходимо задать началь- ную вершину, представляющую исходное состояние рабочей памяти и правила изменения состояния. Таким образом, стратегию управления с поиском на графе можно рассматривать как процесс выявления под- графа имплицитного графа, содержащего целевую вершину.
Опишем в качестве примера порождения такого графа процедуру
SEARCH
Procedure SEARCH.
1. Создать списки INITIAL и FINISH; FINISH:=∅;
2. Создать граф поиска, состоящий из начальной вершины g1.
INITIAL := INITIAL
∪ g1;
3. M1: если INITIAL = ∅, то неудача, останов.
4. Упорядочить вершины в INITIAL в соответствии с некото- рым отношением;
5. Выбрать первую (в смысле порядка) вершину в INITIAL,
обозначить ее через f , INITIAL := INITIAL \{f };
FINISH := FINISH
∪ {f };
6. Если f - целевая вершина, то успешное завершение работы;
7. Породить из вершины f множество M = {m
1
, m
2
, ..., m k
} дочер- них вершин;
H := {(f , m
1
), (f , m
2
), ..., (f , m k
)};
8. INITIAL := INITIAL
∪H;
9. Перейти к п. 3.
Эта процедура порождает граф H, называемый графом поиска. На шаге 4 она должна упорядочивать вершины графа, так чтобы «лучшая»
из них была выбрана первой для порождения дочерних вершин. Это упорядочивание может основываться на различных эвристических иде- ях или иных критериях.
Рассмотрим некоторые из возможных эвристик. Один из подходов основан на введении оценочной функции v. При этом под v(n) ча- сто понимается оценка стоимости пути (минимальной стоимости) от исходной вершины к целевой, при условии, что этот путь проходит через вершину n. Упорядочение вершин графа в списке INITIAL будем производить таким образом, чтобы вершины располагались в порядке

1.2. Системы, основанные на правилах, или продукционные системы
39
возрастания соответствующих им функций v. При совпадении значений упорядочение осуществляется произвольным образом.
Если рассмотреть, например, игру в «8», то для нее можно взять простую оценочную функцию v(n) = d(n) + W (n), где d(n) — глуби- на вершины n на дереве поиска и W (n) — число находящихся на нужном месте фишек в состоянии рабочей памяти, соответствующем вершине n. Легко продемонстрировать, что применение процедуры
SEARCH
приводит к решению с испытанием меньшего числа вершин,
чем, например, при использовании оценочной функции v(n) = d(n).
Достаточно распространены эвристики с монотонными ограничени- ями: говорят, что эвристическая функция удовлетворяет монотонному ограничению, если для всех вершин n и m, таких что m — дочерняя вершина n, имеет место c(n, m) > v(n) — v(m), причем v(t) = 0, где t —
целевая вершина, а v(n) и v(m) — оценки стоимостей оптимального пути к целевой вершине t от вершин n и m, соответственно.
Можно показать, что если алгоритм SEARCH использует такую оценочную функцию, что ее значение v(n) для любой вершины n оце- нивает сумму стоимости пути (минимальной стоимости) от исходной вершины s к вершине n и стоимости аналогичного пути от вершины n к целевой и эта функция удовлетворяет монотонному ограничению, то алгоритм SEARCH обнаруживает оптимальный путь к любой вершине.

1 2 3 4 5 6 7 8 9 ... 33

1.2.5. Пример. Рассмотрим иллюстративный пример, который на- зовем «Мир кубиков».
Пусть перед нами стоит задача написать программу, которая бы обеспечила разумное поведение робота — строителя башни из кубиков.
Введем вначале следующие предикатные символы:
On — двуместный предикатный символ «находиться на»;
Em — одноместный предикатный символ «не находиться под кубиком»;
Er — «находиться на земле».
Тогда атомарная формула языка исчисления предикатов 1-го поряд- ка On(x, y) означает, что «Кубик x находится на кубике y»; атомарная формула Em(x) означает, что «Кубик x не находится под другим кубиком»; а атомарная формула Er(x) означает, что «Кубик x стоит на земле».
Мы полагаем, что эти формулы будут использованы в качестве эле- ментов условий, множеств добавляемых и удаляемых фактов в прави- лах. Но прежде чем говорить о правилах, опишем устройство рабочей памяти. Если действовать таким же образом, как было описано выше,
следует задать интерпретирующее отображение I, которое каждому предикатному символу поставит в соответствие некоторое отношение на множестве кубиков. Основное множество M будет состоять из элементов, соответствующих кубикам.

40
Гл. 1. Методы представления знаний
Итак, отображение I ставит в соответствие предикатному символу
On бинарное отношение на M , предикатным символам Em и Er —
одноместные отношения на M . Обозначим эти отношения так же, как соответствующие предикатные символы, только иным шрифтом. Иначе говоря, I(On) = On,
I(Em) = Em,
I(Er) = Er.
Поскольку все отношения конечны, то их можно представить в виде таблиц (рис. 1.2, а) и б)). Элементы множества M обозначим через m
1
, m
2
, ..., m n
Рис. 1.2. а) начальное состояние; б) целевое состояние
В начальном состоянии первая из таблиц не заполнена, а две другие заполнены полностью. Таким образом, на рис. 1.2, а) изображе- но начальное состояние «Мира кубиков». Целевое состояние должно иметь вид, приведенный на рис. 1.2, б; заметим здесь, что мы считаем все кубики идентичными и, поэтому, нумерации элементов из M не будем придавать значения.
Если мы принимаем решение использовать описания состояний,
приведенные на рисунках 1.2, а) и б) в качестве рабочей памяти си- стемы, основанной на правилах, то сами правила должны применяться к описаниям этих состояний для порождения новых состояний и такая система называется прямой системой правил. Однако в рабочей памяти можно хранить описания целей, подцелей и т. д. Такая система правил будет называться обратной. Впрочем, различие между этими двумя системами правил можно провести лишь на интуитивном уровне.

Смотрите также файлы

Отчет по производственной практике направление подготовки.docx

Задание С. Л. Франк в известной работе Смысл жизни.docx

1 билет. 1 вопрос. Центральное зрение, методы определения остроты зрения у детей до года, 3, 5 лет и взрослых.docx

Tag questions 1 Ann is.docx

Презентация Корпоративный стиль в одежде в банке.docx

Файл: Методыискусственногоинтеллекта.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно