Файл: Интеллектуальные информационные системы и технологии.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 398

Скачиваний: 11

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

СОДЕРЖАНИЕ

УДК 004.89(075.8)

С применением

Без применения

Формирование

Приобретение

Извлечение

А1 <проверки нормальности распределения значений остатков>

Рис. 4.1. Обобщенная структура статической ЭС

Рис. 4.2. Обобщенная структура динамической ЭС

Глава 8. Хранилища данных и управление знаниями8.1. Хранилища данныхДля устранения разрозненности, разнотипности, противоречивости данных используется концепция «хранилище данных» (ХД). Под ХД понимают предметно-ориентированную, интегрированную, некорректи-руемую, зависимую от времени коллекцию данных, предназначенную для поддержки принятия управленческих решений. Хранилище данных должно предложить такую среду накопления данных, которая оптимизирована для выполнения сложных аналитических запросов управленческого персонала. Данные в хранилище не предназначены для модификации. Предметная ориентация означает, что данные объединены и хранятся в соответствии с теми областями, которые они описывают. Интегрированность подразумевает, что данные должны удовлетворять требованиям всего предприятия. Некорректируемость заключается в том, что данные не создаются в ХД, а поступают из внешних источников, не подвергаются изменениям и не удаляются. Данные в ХД должны быть согласованы во времени.При реализации ХД особое значение приобретают процессы извлечения, преобразования, анализа и представления. При извлечении данные приводятся к единому формату. Источники данных могут быть классифицированы по территориальному, административному признаку, степени достоверности, частоте обновляемости, количеству пользователей, секретности и используемым СУБД. Вся эта информация составляет основу словаря метаданных ХД, который призван обеспечить корректную периодическую актуализацию ХД.Инструментальные средства (ИС) реализующие аналитические методы обработки данных, классифицируются по способу представления данных. Выделяют ИС, хранящие данные:в реляционном виде, но имитирующие многоразмерность для пользователя;в многоразмерных базах;как в реляционном виде, так и в многоразмерных базах.Помимо извлечения данных из БД для принятия решений, актуален процесс извлечения знаний для удовлетворения информационных потребностей пользователя. Если в ЭС основное внимание уделяется проблеме извлечения знаний от экспертов, то в данном случае знания извлекаются из БД.С точки зрения пользователя в процессе извлечения знаний из БД должны решаться задачи преобразования данных (неструктурированных наборов чисел, символов) в информацию (описание обнаруженных закономерностей), информации в знания (значимые для пользователя закономерности), знаний в решения (последовательность действий, на-правленных на удовлетворение информационных потребностей поль-зователя).Интеллектуальные средства извлечения знаний из БД позволяют выявить закономерности и вывести правила из них. Эти закономерности и правила можно использовать для принятия решений и прогнозирования их последствий. Существует несколько интеллектуальных методов выявления и анализа знаний: ассоциация, последовательность, классификация, кластеризация и прогнозирование. Ассоциация имеет место в том случае, когда несколько событий связаны друг с другом. Если существует цепочка связанных во времени событий, то говорят о последовательности. С по-мощью классификации выявляются признаки, характеризующие группу, к которой принадлежит тот или иной объект. Кластеризация аналогична классификации, но отличается от нее тем, что сами группы еще не сформированы. С помощью прогнозирования на основе особен-ностей поведения данных оцениваются будущие значения непрерывно изменяющихся переменных (см. п. 2.5).8.2. Управление знаниямиПонятие «управление знаниями» появилось в середине 90-х годов прошлого века в крупных корпорациях, где проблемы обработки информации приобрели особую остроту. Системы управления знаниями (Knowledge Management) получили название КМ-систем. Для их при-менения используются следующие технологии:электронная почта;базы и хранилища данных;системы групповой поддержки;браузеры и системы поиска;корпоративные сети и Интернет;ИИ-системы.Хранилища данных, которые работают по принципу центрального склада, стали одним из первых инструментариев КМ. Управление знаниями – это совокупность процессов, которые управляют созданием, распространением, обработкой и использованием знаний внутри пред-приятия. Необходимость в разработке КМ-систем возникла в силу нескольких причин:работники предприятия тратят слишком много времени на поиск необходимой информации;опыт ведущих специалистов используется только ими самими;ценная информация «захоронена» в огромном количестве докумен-тов, доступ к которым затруднен;из-за недостаточной информированности и игнорирования преды-дущего опыта повторяются «дорогостоящие» ошибки.Одним из новых решений по управлению знаниями является понятие корпоративной памяти, которая фиксирует информацию из различных источников предприятия и делает ее доступной специалистам для решения производственных задач. Корпоративная память не позволяет исчезнуть знаниям выбывающих специалистов. Различают два уровня корпоративной памяти: Уровень материальной или явной информации – данные и знания, которые содержатся в документах организации в виде сообщений, статей, справочников, патентов, ПО. Уровень персональной или скрытой информации – персо-нальные знания, неотрывно связанные с индивидуальным опытом, которые могут быть переданы через процедуры извлечения знаний. Скрытое зна-ние – основа СППР. При разработке КМ-систем можно выделить следующие этапы: Стихийное и бессистемное накопление информации в орга-низации. Извлечение знаний – наиболее сложный и трудоемкий этап. Структурирование – выделение основных понятий, выработка структуры представления информации. Формализация – представление структурированной информа-ции на языках описания данных и знаний. Обслуживание – корректировка данных и знаний. Автоматизированные системы КМ OMIS (Organizational Memory Information Systems) предназначены для накопления и управления знаниями предприятия (рис. 8.1). Рис. 8.1. Архитектура OMISОсновные функции OMIS:сбор и систематическая организация информации из различных источников в централизованное или структурное ХД;интеграция с существующими автоматизированными системами;обеспечение нужной информации по запросу.В отличие от ЭС первичной целью систем OMIS является не поддержка одной задачи, а лучшая эксплуатация необходимого общего ресурса знаний.Первые информационные системы на основе гипертекстовых (ГТ) моделей появились в середине 60-х годов ХХ века, но первые ком-мерческие ГТ-системы относятся к 1980-х годам. Под гипертекстом понимают технологию формирования информационных массивов в виде ассоциативных сетей, элементами или узлами которых выступают фраг-менты текста, рисунки, диаграммы. Навигация по таким сетям осу-ществляется по связям между узлами. Основные функции связей:переход к новой теме;присоединение комментария к документу;соединение ссылки на документ с документом, показ на экране графической информации;запуск другой программы.Мультимедиа (ММ) понимается как интегрированная компьютерная среда, позволяющая наряду с традиционными средствами взаимодействия человека и компьютера (дисплей, принтер, клавиатура) использовать новые возможности – звук, мультипликацию, видеоролики. Когда элементы ММ объединены на основе сети гипертекста, можно говорить о гипермедиа (ГМ). Основной сферой применения ГМ являются автома-тизированные обучающие системы или электронные учебники. Глобаль-ный успех в этом направлении получила сеть Интернет.8.3. Технология создания систем управления знаниямиПроектирование систем управления знаниями (СУЗ) или КМ-систем декомпозируется на этапы, которые свойственны любой другой ИИ-системе. Вместе с тем имеется ряд особенностей:коллективное использование знаний предполагает объединение и распределение источников знаний по различным субъектам, а следо-вательно, решение организационных вопросов администрирования и оп-тимизации деловых процессов, связывающих пользователей СУЗ;задача проектирования СУЗ носит непрерывный характер, поскольку постоянно добавляются внешние источники данных;поскольку СУЗ имеет многоцелевое значение, возникает потребность в интеграции разнообразных источников знаний на основе единого се-мантического описания пространства знаний.Этапы проектирования СУЗ:идентификация проблемной области:определение типов решаемых задач;отбор источников знаний;определение категорий пользователей;концептуализация:выявление понятий (категорий);выявление свойств (отношений);построение правил (ограничений);формализация:выбор метода представления знаний;представление знаний;реализация:создание онтологий;аннотирование и подключение источников знаний;настройка (создание) приложений;внедрение:тестирование;развитие.Онтология (от греч. «онтос» – сущее, «логос» – учение) – это точное (явное) описание концептуализации знаний, учение о сущем.Идентификация проблемной областиВ первую очередь определяется состав решаемых задач. Возможно создание узкоспециализированных систем по конкретным функциям управления: маркетинга, менеджмента, финансов. Разработка СУЗ может начинаться с отдельных областей, например с маркетинга, не требуя одновременной разработки всех необходимых онтологий и источников знаний. Для создания БЗ прецедентов требуется определить набор типовых бизнес-процессов, для которых будут отбираться прецеденты (например, разработка проектов, заключение договоров, проведение PR-акций). Центральное место в проектировании СУЗ занимает онтология, которая определяет и интегрирует все источники знаний. Требования разработки онтологий оформляются в виде спецификации требований (таблица). Предметная область Подбор и повышение квалификации персонала компании Назначение Онтология служит для обмена знаниями между депар-таментом управления и менеджерами проектов при отборе персонала. Используется для семантического поиска квали-фикационных характеристик для выполнения определенных видов работ Область значений Онтология содержит концепты (категории) управления пер-соналом. Концепты используемых квалификаций в техно-логиях рассматриваются детально Продолжение табл. Предметная область Подбор и повышение квалификации персонала компании Поддерживающие приложения Система управления квалификацией персонала в ИНТРАНЕТ-среде Источники знания Web-страницы департамента управления персоналомРуководство о развитии персоналаСпецификация продукции и технологийИнтервью с работниками департамента управления персо-налом и менеджерами проектов Концептуализация знаний с помощью онтологийНазначение онтологий – обеспечение возможностей:повышения интеллектуальности СУЗ на основе того, что остается неявным;стандартизации на основе описания целевого мира в виде словаря, разделения знаний между различными пользователями и компьютерными системами;систематизации знаний, позволяющей интегрировать разнородные источники знаний на базе единой многоаспектной таксономии, пред-ставляемой в общем словаре;снабжения необходимыми понятиями, отношениями и ограниче-ниями, которые используются как строительные блоки для создания конкретной модели решения задач;постепенного обобщения понятий конкретной проблемной об-ласти.Требования к проектированию онтологий знаний:ясность – четкая передача смысла введенных терминов (кон-цептов);согласованность – логическая непротиворечивость определений;расширяемость – возможность монотонного расширения и специали-зации без необходимости пересмотра уже существующих понятий;инвариантность к методам представления знаний;отражение только наиболее существенных предположений о модели-руемом мире.Онтологическое знание организуется на трех уровнях, в связи с чем выделяют онтологии:верхнего уровня (метаонтология);предметной области;задач.Метаонтология отражает такие общие понятия, как «сущность», «класс», «свойство», «значение», «типы данных», «типы отношений», «процесс», «событие». Определение общих категорий позволяет системе контролировать синтаксические конструкции понятий предметных и проблемных областей, которые идентифицирутся как наследники общих категорий.Онтология предметной области определяет набор понятий, ис-пользуемых при решении различных интеллектуальных задач и независимых от применяемого метода. При построении онтологии предметной области выявляются свойства и отношения понятий, строятся логические правила, расширяющие семантику модели предметной области.Онтология задач имеет дело с понятиями, описывающими методы преобразования объектов предметной области в процессе решения задач. Например, для задач обучения в качестве методов могут использоваться дедуктивный (от общего к частному), индуктивный (от частного к общему) и абдуктивный (от частного к частному). С помощью понятий, свойств и отношений описывается сущность используемых методов, устанавливается последовательность их выполнения. Введение онтологии задач позволяет расширить класс интеллектуальных задач, решаемых с помощью СУЗ, в частности перейти от простых поисковых задач к задаче конфигурации, когда система автоматически разбивает задачу на под-задачи, для каждой подзадачи выбирает метод решения, а для каждого метода – необходимые единицы предметных знаний. Такая СУЗ является не просто интеллектуальной информационно-поисковой системой, но и системой, которая планирует и генерирует решение задачи. В этом аспекте СУЗ должна обладать развитым механизмом вывода и по своей реализации сближается с классом ЭС, но на более развитой семанти-ческой основе. Формализация онтологического знанияВ основу формализации онтологий, с одной стороны, положены общепризнанные методы представления знаний (исчисление предикатов, семантические сети и фреймы), с другой  методы описания онто-логических знаний с помощью специальных семантических конструк-ций. В качестве языков представления онтологического знания исполь-зуются:языки, основанные на исчислении предикатов;HTML-подобные языки;XML-подобные языки.Языки, основанные на исчислении предикатов, построены на декларативной семантике и обеспечивают выражение произвольных логических предложений. С помощью этих языков хорошо представляется метазнание, что позволяет пользователю представлять знания в явном виде и разрешает пользователю применять новые конструкции представления знаний без изменения самого языка. Одним из таких языков является KIF, разработанный для обмена знаниями между различными программными агентами (ЛИСП-подобный язык).HTML-подобные языки (Hypertext Markup Language) – инструмент разметки гипертекста. С использованием HTML создано более 60 % ресурсов современного Интернета. Браузер – специальная клиентская программа, предназначенная для просмотра содержимого Web-узлов и отображения документов HTML. В качестве основы для описания онтологий и онтологического аннотирования текстов может выступать язык разметки данных HTML, дополненный специальными тегами (указателями). С помощью тегов происходит выделение семан-тических фрагментов текста, которые унифицированно интерпрети-руются семантическими анализаторами различных ПС. Языки данной группы позволяют описать объекты онтологии (концепты), отношения между ними и определить правила вывода. Основное назначение таких языков состоит в возможности описания онтологии, аннотирования необходимых Web-страниц концептами онтологии и дальнейшем осу-ществлении поиска данных Web-страниц с помощью специальной по-исковой машины.В качестве основы для XML-подобных языков выступает расширяемый язык разметки. В настоящее время существует около 20 различных языков, основанных на XML. Основным достоинством языка является то, что для работы с документами, подготовленными с помощью него, достаточно обычного интернет-браузера, т.е. не требуется никаких дополнительных средств. XML-документ представляет собой размеченное дерево. Структура XML описания обычного учебного курса приведена на рис. 8.2.Язык XML не обладает практически никакими возможностями в области представления онтологий. В нем отсутствуют специальные конструкции, позволяющие описать взаимоотношения между концептами онтологии, правила вывода. Он предназначен исключительно для представления данных. Язык RDF, представляющий расширение XML, позволяет описать концепты, отношения между ними, поддерживает иерархию концептов и их наследование, задает некоторые правила вывода. Базовыми строительными блоками в RDF является триплет «объект –атрибут – значение», часто записываемый в виде A (O, V), которыйчитается как «объект О имеет атрибут А со значением V». В семантической сети эту связь можно представить как ребро с меткой А, соединяющее два узла – О и V.Р ис. 8.2. Размеченное деревоВыбор ИС реализации СУЗ во многом определяется требуемой функциональностью использования СУЗ: информационным поиском в источниках знаний, коллективным решением задач, обучением и др. Для узкоспециализированных целей, ориентированных на поиск в интернет-ресурсах, применяются специализированные системы, например SHOE, которая обеспечивает аннотацию документов, сбор знаний в централи-зованную БЗ, выполнение поисковых запросов.Инструментальные средства должны обеспечивать выполнение двух основных групп функций: Создание и поддержание источников знаний: создание и поддержание онтологий;аннотирование источников знаний;подключение источников знаний;автоматическую рубрикацию и индексирование источников зна-ний; Доступ к источникам знаний: реализация запросов;навигация и просмотр;коммуникация пользователей;распространение знаний.Глава 9. Интеллектуальные информационные системыв условиях неопределенности и риска9.1. Понятие риска в системах поддержки принятий решений слабоструктурированных проблемЭкономические решения в зависимости от определенности воз-можных исходов или последствий рассматриваются в рамках трех моделей [16] выбора решения:в условиях определенности, если относительно каждого действия известно, что оно неизменно приводит к некоторому исходу;в ситуации риска, если каждое действие приводит к одному из множества возможных частных исходов, причем появление каждого исхода имеет вычисляемую или экспертно оцениваемую вероятность;при неопределенности, когда то или иное действие имеет своим следствием множество частных исходов, но их вероятности неиз-вестны.Вероятностные методы обеспечивают подходящие условия для принятия решения и содержательные гарантии качества выбора. При этом исходят из предположения, что суждения относительно значений, предпочтений и намерений представляют собой ценные абстракции человеческого опыта и их можно обрабатывать для принятия решений. В то время как суждения относительно правдоподобия событий квалифицируются вероятностями, суждения относительно желательности действий представляются понятиями. Байесовская методология рас-сматривает ожидаемую полезность U(d) как оценку качества решения d. В соответствии с этим, если мы можем выбрать либо действие d1, либо d2, вычисляем U(d1), U(d2) и выбираем действие, которое соответствует наибольшему значению. Семантика полезности состоит в том, чтобы описать риск.Под риском принято понимать вероятность (угрозу) утраты лицом или организацией части своих ресурсов, недополучения доходов или появления дополнительных расходов в результате осуществления определенной финансовой политики.Уровень риска – это объективная или субъективная вероятность возникновения потерь. Под объективной вероятностью понимается ко-личественная мера возможности наступления случайного события, по-лученная с помощью расчетов или опыта, позволяющая оценить веро-ятность выявления данного события. Субъективная вероятность пред-ставляет собой меру уверенности в истинности высказанного суждения и устанавливается экспертным путем.Уровни риска наиболее легко устанавливаются при помощи атрибутивных оценок типа «высокий», «средний», «небольшой». Разно-видностью атрибутивной оценки рисков является буквенная кодировка. При этом в порядке нарастания риска и падения надежности используются латинские буквы от А до D. AAA – самая высокая надежность;AA – очень высокая надежность;A – высокая надежность;…D – максимальный риск.Оценивать уровень риска можно, используя показатели бухгалтер-ской и статистической отчетности, в первую очередь КТЛ – коэффициент текущей ликвидности, который представляет собой соотношение ликвид-ных средств партнера и его долгов.В результате анализа ситуации строятся причинно-следственные диаграммы («дерево причин») и диаграммы зависимостей. Причинно-следственная диаграмма является формальным отображением структуры проблемной ситуации в виде иерархически незамкнутого графа, вер-шины которого соответствуют элементам проблемы, отражающим при-чины ее возникновения, а дуги – связям между ними. Связь элементов-подпроблем отображается в виде отношения «причина – следствие» (рис. 9.1). Рис. 9.1. Модель системы поддержки принятия решений: OLTR – средства складирования данных и оперативной обработки транзакций; OLAR – средства оперативной обработки информацииКорпоративная БД, организованная в виде ХД, заполняется ин-формацией с использованием технологий OLTR и OLAR. Для создания и реализации СППР слабоструктурированных проблем должны быть разработаны и адаптированы к ее условиям следующие методы и средства:система признаков для регистрации проблемных ситуаций;методы оценки степени критичности проблемных ситуаций;причинно-следственные диаграммы для диагностирования причин возникновения проблемных ситуаций;таблица принятия решений для формирования и выбора вариантов решений;методы прогнозирования результатов решений;модели функционирования предприятия и внешней среды.Наиболее распространенной формой выявления проблем с исполь-зованием технико-экономических показателей является сравнение их фактических величин с нормативными и средними значениями.Логический анализ проблем-причин, находящихся на нижних уровнях иерархии, показывает, что во многих случаях они позволяют сформировать варианты решения проблем более высокого уровня. Например, возможны следующие варианты решения проблемы снижения объемов производства и сбыта продукции:варьирование ценами;варьирование формами оплаты;снижение численности работающих;сокращение доли условно-постоянных расходов в себестоимости продукции;сокращение сроков выполнения заказов;усиление службы маркетинга.Когда отсутствуют статистические данные, необходимые для расчета объективной вероятности риска, прибегают к субъективным оценкам, основанным на интуиции и опыте экспертов. Дж. Кейнс ввел понятие субъективной вероятности. В соответствии с принципом безразличия одинаково правдоподобные события или суждения долж-ны иметь одинаковую вероятность, что математически записывается так:А В ≡ Р(А) = Р(В),где

Рис. 10.1. Связь между видами знаний и формами их репрезентации



Тематическая структура диалога обычно представляется в виде сценария, в рамках которого определяются структура задачи (разбиение на подзадачи); распределение подзадач между участниками общения; языковые средства. Используются два основных класса для задания сценария диалога: сценарий либо встроен в систему, либо генерируется системой. Готовый сценарий может быть задан в виде частично упорядоченного множества правил с параметрами, значения которых устанавливаются в процессе решения конкретной задачи. Использование готовых сценариев целесообразно в тех случаях, когда к системе предъявляются жесткие требования по быстродействию.

Если сценарий генерируется системой, то в диалоговый компонент включается специальный механизм вывода. Генерация сценариев диалога целесообразна в тех случаях, когда структура задачи зависит от контекста ситуации, в которой происходит ее решение, а полный перечень ситуаций не может быть определен заранее.

При задании локальной структуры шага диалог состоит из действия, реакции и характеризуется такими параметрами, как тип инициирования, способ влияния действия на реакцию и способ спецификации подзадачи, решаемой на данном шаге.

Понимание высказываний включает анализ и интерпретацию. В ме-тодах анализа обычно выделяют анализ слов, предложений и текстов. Анализ слов сводится к морфологическому анализу, обнаружению и исправлению орфографических ошибок. Цель морфологического анализа состоит в получении основ (словоформ с отсеченным окончанием) со значениями грамматических категорий для каждой из словоформ вы-сказывания на ЕЯ.

Методы обнаружения и исправления орфографических ошибок подразделяются на методы, не использующие словари и использующие их. К методам, не использующим словари, относятся частотные и поли-граммные. Частотные основаны на сортировке слов по частоте их встречаемости в текстах. Предполагается, что частота встречаемости слов, содержащих ошибки, низкая. В полиграммных методах для поиска ошибок применяют списки возможных сочетаний букв в словах. Методы, в ко-торых используются словари, зависят от типа применяемой стратегии.
К абсолютным относится «исторический» метод, основанный на словаре встречаемых ранее ошибок. Эффективность его зависит от размера проанализированных текстов. Относительный метод состоит в нахождении в словаре таких слов, которые наиболее похожи на искаженное слово, и выборе среди них правильного.


Анализ предложений обычно сводится к синтаксическому и се-мантическому анализу, выполняемому функциональным блоком-анализатором.

Существует несколько типов анализаторов:

традиционные (не допускают отклонений от грамматических норм);

концептуальные (позволяют анализировать ЕЯ предложения в условиях пропуска и повтора слов);

использующие сопоставление по образцам (позволяют анализи-ровать предложения, отклоняющиеся от традиционной грамматики в произвольной степени).

Методы анализа связного текста (дискурса). Связность текста достигается как лингвистическими средствами, имеющими языковое выражение, так и экстралингвистическими (ситуационными) средствами-«умолчаниями», не имеющими языкового выражения и основанными на общности знаний участников общения о цели общения и проблемной области. На этапе анализа связного текста решается задача выявления связей между предложениями, выражаемых лингвистическими сред-ствами, а на этапе интерпретации  ситуационными.

К основным лингвистическим средствам связи предложений относятся ссылки и эллипсис. В проблеме установления ссылок могут быть выделены две задачи: поиск в предыдущих предложениях (контексте) сущности (референта), обозначаемой данной ссылкой; определение соответствия между референтом и ссылкой.

Под эллипсисом понимается сжатая форма высказывания, смысл которой определяется либо предыдущими высказываниями (текстовый эллипсис), либо ситуацией, имеющей место в проблемной области (ситуативный эллипсис).

На этапе интерпретации решаются две основные задачи: буквальная интерпретация высказываний в контексте диалога и интерпретация целей участников общения. Для решения обеих задач в рамках фрейм-представлений используется единый механизм присвоения имени фреймов, при этом структура целей участников общения определяется структурой фрейма, описывающего данную задачу, а подцели состоят в заполнении слотов.

Процесс генерации высказываний состоит из генерации смысла высказывания и синтеза высказывания на ЕЯ. Первый этап называется внелингвистическим (концептуальным) синтезом, а второй  лингви-стическим синтезом. Результатом выполнения первого этапа является внутреннее представление смысла генерируемого высказывания (опре-деление информации, которая должна быть сообщена пользователю, определение уровня общности информации, включаемой в высказывания, разбиение сообщаемой информации на части и др.). На втором этапе определяется последовательность построения синтаксической структуры отдельных предложений, морфологического синтеза словоформ. Наиболее простым методом генерации высказываний является метод, который основан на использовании заранее заготовленных шаблонов, содержащих текст на ЕЯ и переменные, вместо которых подставляются конкретные данные (описание сущностей). При методе шаблонов генерация высказываний осуществляется совместно с диалоговым компонентом, который идентифицирует стандартную ситуацию и определяет, какая информация должна быть включена в высказывание. Генерация вы-сказываний, которые не могут быть описаны с помощью шаблонов, представляет собой более сложную задачу. К таким высказываниям, в частности, относятся объяснения,

генерируемые в качестве ответов на вопросы, областью интерпретации которых являются абстрактные знания и метазнания системы. Для генерации объяснений требуется достаточно тонкая классификация целей создания ЕЯ-текстов. Организация текста определяется дискурсными целями (например, дать определение, описать, сравнить, уточнить и т.п.). Каждой дискурсной цели может быть со-поставлен определенный способ организации текста, называемый дискурс-ной стратегией. Предполагается, что, выявив дискурсные стратегии и выразив их подходящим формальным представлением, можно получить достаточно надежный и эффективный механизм генерации смысло-порождающих текстов.
10.2. Машинное обучение
Машинное обучение – это синоним процедуры приобретения знаний, которая может быть использована, когда эксперт по знаниям отсутствует, либо недостаточно надежен, либо ограничен во времени, либо его услуги чрезмерно дороги.

Процесс обучения машины в общем случае поясняется на рис. 10.3 [16].

Система генерирует знания, полученные в результате изучения среды. В процессе сравнения выходов ИИС и объекта информатизации в соответствии с критерием выявляется расхождение между результатами реального мира и выходом системы. Цель заключается в том, чтобы трансформировать реакцию среды и оценку в соответствии с критерием
в форму знания.


Рис. 10.3. Модель обучения
Существует три варианта приобретения знаний, которые позволяют реализовать процедуру машинного обучения, используя [1, 2]:

интерактивные программы, которые извлекали бы знания непосред-ственно у эксперта в процессе его общения с компьютером (без участия когнитолога). При этом диалоговая система должна обладать некоторым запасом базовых знаний о некоторой предметной области;

программы, способные обучаться, читая тексты. Этот метод «упирается» в проблему машинного распознавания смысла естественного текста;

программы, способные под руководством человека-учителя из-влекать из предъявляемых им примеров реализации некоторого концепта набор атрибутов и значений, определяющих этот концепт.

Любая программа обучения должна обеспечивать возможность сохранять и анализировать полученный опыт, а также обладать способностью применять его при решении новых проблем.

Индуктивное обучение заключается в том, чтобы вывести применимые правила из изучения прошлых специфических примеров. Таким образом, индуктивное обучение также является обучением с использованием примеров. В основу индуктивного обучения положены принципы индуктивных умозаключений. Индуктивным называется умозаключение, в котором на основании принадлежности признака отдельным предметам или частям некоторого класса делается вывод о его принадлежности к классу в целом. Одна из форм индуктивного обучения предусматривают демонстрацию примеров двух типов – тех, которые соответствуют концепту (это так называемые позитивные экземпляры), и тех, которые ему не соответствуют (негативные экземпляры). Задача программы обучения – выявить или сконструировать подходящий кон-цепт, т.е. такой, который включал бы все позитивные экземпляры и ни одного негативного. Такой тип обучения получил название «обучение концептам». Другая задача обучения – обобщение дескрипторов – формулируется так: программе обучения предъявляется набор экземпляров объектов некоторого класса, т.е. представляется некоторый концепт, а
программа должна сформировать описание, которое позволит иденти-фицировать (распознать) любые объекты этого класса. Отличие между задачами состоит в следующем:

задача обучения концептам предполагает включение в обучающую выборку как позитивных, так и негативных экземпляров заранее заданного набора концептов, а в процессе ее решения будет сформировано правило, позволяющее затем программе распознать ранее неизвестные экземпляры концепта;

задача обобщения дескрипторов предполагает включение в обобща-ющую выборку только экземпляров определенного класса, а в процессе выполнения создается наиболее компактный вариант описания из всех подходящих к каждому из предъявленных экземпляров.

Обе задачи относятся к классу методик супервизорного обучения, поскольку в распоряжении программы имеется и специально под-готовленная обучающая выборка, и пространство атрибутов.

Извлечение из текста знаний предполагает выявление в нем не только лингвистических, но и логических отношений, для чего при-меняются различные методы семантического анализа текста. Под семан-тической связью подразумевается отношение понятий в предметной области. Представителями семантических связей в лексике являются предикативные слова (например, больше; меньше; иметь значение; иметь свойство; если…, то…). Однако выделения только предикативных слов в языковой конструкции недостаточно для классификации представляемых ими семантических связей. Необходимо также выявить нелексические свойства семантических связей. Для того чтобы более полно охаракте-ризовать связь между двумя объектами (процессами, событиями), следует указать не только вид связи, направленный от первого ко второму, но и вид связи, направленный от второго к первому [12].

Модель обучения на прецедентах – это модель, в основе которой лежит принцип синтеза закономерности на примерах и ее проверки на новых примерах. Обучение на основе прецедентов задействует пред-шествующий опыт для решения новых задач путем идентификации текущей проблемы, поиска подходящего прецедента и использования найденного прецедента для решения текущей проблемы. Недостатком этого подхода является то, что в процессе обучения не создается каких-либо моделей, обобщающих предыдущий опыт, а надежность вы-водимых результатов зависит от полноты описания прецедентов (си-туаций).


Глава 11. Современные методы исследования,

моделирования и проектирования сложных систем
11.1. Интеллектуальные методы проектирования
сложных систем

Традиционное проектирование содержит задачи анализа систем, связанные с накоплением и исследованием необходимой информации, и задачи синтеза конкретных вариантов систем, удовлетворяющих задан-ным требованиям. Исследования проблем проектирования получили наибольшее развитие в области техники. Проектирование технического объекта может проводиться на основе прототипа или без него. В первом случае цель проектирования заключается в совершенствовании прото-типа, которое ориентировано либо на улучшение качества выполнения уже существующих функций, либо на обеспечение новых функций. Кроме того, задача может ставиться как изобретательская, когда одной из важнейших целей является патентоспособность создаваемого устрой-ства [1].

Задача совершенствования прототипа может включать дополни-тельные условия, связанные с технологическими возможностями кон-кретного предприятия, для перехода от производства прототипа к выпуску нового образца.

При проектировании экономических систем обычно не преследуются цели новизны. Проектированию без прототипа здесь соответствует задача создания новой экономической системы (корпорации), т.е. системы, которая не существовала прежде. При этом цели, функции, структура и многие свойства создаваемой системы могут быть известны.

Задачи проектирования на основе прототипа имеют различные постановки:

проектирование не существовавшей прежде системы по образцу уже известной;

кардинальное перепроектирование имеющейся системы, которая при этом уничтожается, а вместо нее предусматривается создание новой с использованием ряда элементов прежней системы. Данная постановка возникает тогда, когда существующая система исчерпала свои ресурсы совершенствования, стала неустойчивой и неэффективной, т.е. достигла точки бифуркации;

кардинальное перепроектирование существующей системы, ориен-тированное на ее совершенствование и не допускающее ее уничтожение (реинжиниринг);

постоянное и постепенное совершенствование существующей си-стемы на основе мониторинга ее окружения и тенденций развития организационных систем (концепция постоянно развивающегося пред-приятия).