Файл: Методыискусственногоинтеллекта.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 494

Скачиваний: 23

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

6.2. Реляционно-ситуационный анализ текста
275 2. Абстинатив — при глаголах с модальным компонентом в зна- чении: нежелательная ситуация для субъекта (воздержаться
от голосования; избегать встречи).
3. Агенс — субъект в пассивной конструкции (закон подписан
президентом).
4. Адресат — лицо или реже предмет, к которому обращено ин- формативное, донативное или эмотивное действие (обратиться
к президенту).
5. Генератив — при установлении родовидовых отношений, при классификации: класс, более крупная общность, в которую вклю- чается объект (отнести к категории социально необеспеченных
граждан).
6. Делибератив — содержание речемыслительного, социального действия или восприятия (обсуждать законопроект).
7. Дестинатив — назначение действия или предмета (выступать
в защиту животных; поехать на лечение).
8. Деструктив — объект каузативного деструктивного воздействия
(взорвать дом).
9. Дименсив — размер, исчисляемая мера величины (измерять ин-
формацию в байтах).
10. Директив — направление движения, ориентированного действия или положения предмета (отправиться в Германию).
11. Дистрибутив — компонент, называющий дистрибутивные отно- шения (принимать по 20 человек в день).
12. Донор — (при глаголах определенной лексической группы) субъ- ект-владелец отчуждаемого объекта (лишить субъект РФ права
на что-либо).
13. Инструментив — орудие действия (что написано пером, то не
вырубишь топором).
14. Каузат

объект каузирующего воздействия
(заразить
животных).
15. Каузатив — причина действия или появления признака, свойства
(наградить за подвиг).
16. Квалитатив — качество, свойство, характеризующее субъект
(тетрадь в клетку; держаться с достоинством).
17. Квантитатив — количественный показатель изменения или со- отношения признаков (расходная часть бюджета возросла
в 2 раза по сравнению с прошлым годом).

276
Гл. 6. Приобретение знаний и анализ текстов
18. Комитатив — сопровождающее действие, признак, сопутствую- щий предмет, соучаствующее лицо (дискутировать с коллегами
по фракции).
19. Коррелятив — компонент, выражающий или оценивающий со- ответствие / несоответствие предмета другому предмету, назначе- нию, норме (отвечать требованиям закона).
20. Ликвидатив — объект каузирующего воздействия; результатом каузирующего воздействия является прекращение существования объекта (упразднить ограничения).
21. Лимитатив — сфера, область, пределы реализации признака
(ограничить власть президента законом).
22. Локатив — местонахождение (войска сосредоточены в районе
Багдада).
23. Медиатив — способ, средство действия (обрабатывать на
компьютере).
24. Объект — компонент с предметно-вещественным значением, под- вергающийся действию или каузативному воздействию (ввозить
дешевые импортные товары).
25. Объектив

компонент со значением цели
(воевать
за независимость; отправиться за новым кредитом).
26. Партитив — часть (части) целого (английский парламент со-
стоит из двух палат).
27. Посессив — объект в посессивной конструкции (обладать
правом вето).
28. Результатив — в компликативных моделях предицирующий ком- понент со значением логически выводимого следствия (привести
к кризису).
29. Репродуктив — исходная точка, образец для подражания, воспро- изведения (напоминать своего предшественника).
30. Рубрикатив — компонент, характеризующий лицо, предмет по признаку из однородного ряда (классифицировать по авторам).
31. Ситуатив — компонент со значением внешней ситуации, природ- ной или социальной, определяющей состояние субъекта (прово-
дить реформы в условиях экономической нестабильности).
32. Субъект — компонент, которому приписывается предикативный признак (кандидат отказался от участия в выборах).
33. Сурсив — источник информации или сенсорного восприятия
(узнать из газет).


6.2. Реляционно-ситуационный анализ текста
277 34. Темпоратив — компонент, выражающий временные характеристи- ки (в прошлом году).
35. Транзитив — компонент со значением пути движения (Корейский
лидер проехал почти по всей России на поезде).
36. Трансгрессив — результат каузации превращения (назначить
заместителем министра).
37. Фабрикатив — компонент, характеризующий предмет по матери- алу, веществу, из которого предмет сделан, изготовлен (мозаика
из кусочков стекла).
Поиск предикатных слов. Принципы выделения предикатных слов заключаются в следующем:
• Поиск глаголов, девербативов и предикативных наречий выпол- няется по результатам морфологического анализа и словаря пре- дикатных слов.
• Сочетания (неполнознаменательный глагол в личной форме / пре- дикативное наречие + инфинитив) рассматриваются в комплексе как одно предикатное слово.
• Если в одном фрагменте встретились несколько предикатных слов (например, глагол + инфинитив, глагол + девербатив), то синтаксемы для них ищутся в ограниченных контекстах.
Определение значений синтаксем. После того, как выделены пре- дикатное слово и синтаксемы предложения, определяются значения синтаксем с помощью таблиц типа 6.1. В пределах фрагментов для по- строенных синтаксическим анализатором именных групп проверяются соответствия предложно-падежных форм существительных, а также,
там где возможно, их приемлемость с точки зреиия категориальной семантики.
Причастные и деепричастные обороты анализируются после соот- ветствующих главных предложений. Субъектом деепричастного оборо- та становится субъект главного предложения. В качестве кандидатов на субъект/объект причастного оборота выбираются ближайшие именные группы, вершины которых согласуются с причастием в роде, числе и падеже.
Если глагол многозначный (на одно слово имеется несколько сло- варных статей), то рассматриваются все варианты по очереди. Окон- чательно выбираются (на следующих этапах анализа) вариант (или варианты) с максимальным заполнением ролевого фрейма или, иначе говоря, варианты, в которых найдены значения синтаксем для большего количества именных групп фрагмента и чаще сработали признаки ка- тегориальной семантики. Если равнозначных вариантов опять несколь- ко, то выбираются варианты с максимальным отношением количества


278
Гл. 6. Приобретение знаний и анализ текстов
Т а б л и ц а 6.1
Значение
Предлог
Падеж
Транзитив по дательный сквозь винительный через винительный творительный над творительный
Инструментив творительный с помощью родительный при помощи родительный на предложный
Дестинатив для родительный к
дательный на винительный под винительный найденных в предложении синтаксем к общему количеству синтаксем,
описанных в данной словарной статье.
1   ...   25   26   27   28   29   30   31   32   33

Значения устанавливаются также и для вопросительных слов
«кто», «что», «куда», «где», «откуда», «почему», «отчего», «зачем»,
«почем», «когда», «сколько», «во сколько», «за сколько», «на сколько»,
«как».
В статье словаря для каждого предикатного слова ищутся вхож- дения морфологических признаков (предлог, падеж, категориально- семантический класс) связанных с ним синтаксем. Если морфологиче- ские признаки синтаксемы найдены в словарной статье, то ей припи- сывается соответствующее значение.
Соответствие, фрагмент которого приведен в таблице 6.1, вообще говоря, неоднозначно и для снятия многозначности применяются кон- текстные правила, несколько примеров которых приведено ниже.
Правило 1. Если падежная форма темпоративного или локативного существительного найдена в соответствующем списке для сво- бодных синтаксем, то для этого существительного удаляются все остальные значения.
Далее устанавливаются субъекты и объекты.
Правило 2. Отрицательная конструкция: родительный падеж при пе- реходных глаголах имеет значение объекта.
Правило 3. Отрицательная конструкция: родительный падеж при эк- зистенциальных глаголах имеет значение субъекта.

6.3. Установление значений синтаксем в безглагольных предложениях 279
Рассматривается случай, когда при переходном глаголе находятся существительные, у которых именительный падеж совпадает с вини- тельным:
Правило 4. Если предикатное слово выражено инфинитивом, значе- ние «субъект» удаляется, остается значение «объект» (у суще- ствительного в форме В = И): «Где купить сканер
Правило 5. Если форма предикатного слова не инфинитивная и су- ществительных В = И два, то значение субъекта приписывается личному существительному (т. е. у него удаляется значение объ- екта, а у второго существительного — субъекта). Если оба лич- ные/неличные, то полагаемся на прямой порядок слов: субъект слева.
6.3. Установление значений синтаксем
в безглагольных предложениях
В безглагольных предложениях значение синтаксемы существенно зависит от контекста — других синтаксем и слов определенных частей речи.
Такая зависимость записывается в виде правила, условие кото- рого содержит характеристики контекста синтаксемы, а заключение указывает значение, которое необходимо установить рассматриваемой синтаксеме.
Правила установления значений синтаксем были получены с по- мощью индуктивного метода машинного обучения, в основе которо- го лежит ДСМ-метод, описанный во второй главе, и его модифика- ция, выполненная в работе [133], где построение правил осуществ- лялось по примерам из электронной версии синтаксического словаря
Г. А. Золотовой [132]. Всего было получено около 1000 контекстных правил.
Опшем кратко основные соображения, лежащие в основе метода получения контекстных правил.
6.3.1. Выбор объектов, признаков и свойств. Для применения
ДСМ-метода к рассматриваемой задаче потребовалось доопределить операцию вычисления сходства из ДСМ-метода для объектов с при- знаками любой природы.
Такая обобщенная операция сходства не должна нарушать коммута- тивности и ассоциативности операции вычисления сходства на простых объектах.
Далее было введено понятие составного признака. Синтаксема с этой точки зрения представляет собой тройку простых составляю- щих — предлога, падежа и категориального класса.


280
Гл. 6. Приобретение знаний и анализ текстов
Для составного признака определяется своя операция вычисления сходства, результатом которой также является составной признак, но не его составляющие по отдельности. Составной признак может вхо- дить в состав другого составного признака.
Следующей задачей являлся учет контекста. На значение синтак- семы оказывают влияние другие элементы предложения — соседние синтаксемы, слова, принадлежащие некоторым частям речи, например,
сравнительные прилагательные или наречия. Таким образом, возникла задача вычисления сходства для двух объектов в контексте. Один из подходов к ее решению предложен в работе [134]. Для рассматривае- мой задачи следовало учесть не только характеристики контекста, но и основного объекта, при этом влияние контекста в отдельности не учитывалось.
Признаки описывают характеристики самой синтаксемы и окружа- ющих ее в предложении элементов. Пусть A — множество характе- ристик, описывающих некоторый объект с какой-либо одной стороны.
Пусть на этом множестве некоторым образом определена операция вычисления сходства ∩
A
: A × A → A, которая обладает свойствами коммутативности и ассоциативности. Пару hA, ∩
A
i назовем типом
признака. Таким образом, тип признака — это множество его всевоз- можных значений с заданной операцией вычисления сходства на нем.
В общем случае операция вычисления сходства признаков может опре- деляться произвольно, однако она должна удовлетворять свойствам коммутативности и ассоциативности. Признаком, соответственно, на- зывается элемент множества A. Обычно имеется несколько множеств,
характеризующих объект с разных сторон, каждое со своей операцией сходства, поэтому объект описывается признаками нескольких разных типов.
В задаче порождения правил установления значений синтаксем можно выделить две разновидности признаков — элементарные и со- ставные.
Элементарные, неделимые, признаки — это строки, числа, а также значения из специальных списков, или перечисления. Для элемен- тарных признаков операция вычисления сходства обычно заключается в проверке совпадения их значений, но это может быть и не так.
Например, для признаков типа «позиция» предлагается следующая операция вычисления сходства:
• если у признаков-операндов значения равны «до», результатом является значение позиции «до»;
• если у обоих признаков значения «после», результатом является значение «после»;
• иначе результатом является значение «не важно». Если признак в одном объекте встретился «до», а в другом объекте «после»