Файл: Методыискусственногоинтеллекта.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 497

Скачиваний: 23

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

6.1. Коммуникативная грамматика русского языка
269
темпоративные, имена со значением количества, имена со значением параметра измерения, имена со значением единиц измерения.
Определение категориальной семантики некоторых существи-
тельных:
одушевленные–неодушевленные,
предметные признаковые,
темпоративы, локативы–директивы,
прочие.
При этом:
1. Одушевленные (личные) существительные и часть локативов
(географические названия) определяются по результатам морфо- логического анализа.
2. Темпоративы и локативы определяются по результатам поиска в специальном словаре (который должен храниться в базе дан- ных).
3. Признаковые существительные определяются по результатам ана- лиза финальных частей слов.
4. Все остальные сществительные считаются предметными.
Таким образом, различаются следующие значения признака «кате- гориальная семантика существительного»:
— личное,
— предметное,
— признаковое,
— темпоратив,
— локатив.
Можно выделить в отдельную группу собирательные существитель- ные (со значением группы лиц).
Для автоматического определения категориальной семантики клас- са имени существительного используется несколько приемов. В их числе:
1) опора на морфологию: в первую очередь это позволяет выделить личные имена;
2) опора на морфемный состав: для признаковых имен созданы спис- ки аффиксов;
3) список — для тех классов, которые представляют собой относи- тельно компактные группы.
Для базовых моделей предложения необходимо соответствие кате- гориального значения части речи и семантики предиката.
Категориальная семантика глаголов. Категориальная семантика глаголов и других предикатных слов отражается в словаре предикат- ных слов — ядре реляционно-ситуационного анализатора.

270
Гл. 6. Приобретение знаний и анализ текстов
Теоретической основой построения такого словаря служит семан- тико-грамматическая классификация глаголов по Г. А. Золотовой [132].
Классификация учитывает категориальную семантику глагола (гла- гольного класса); его грамматические характеристики (состав парадиг- мы глагола; характер субъекта при глаголе: личный / предметный /
пропозитивный); а также функциональный аспект (конструктивные возможности в построении предложения). В общем виде эта класси- фикация может быть представлена следующим образом: знаменатель- ные — неполнознаменательные глаголы.
Знаменательные глаголы делятся, прежде всего, на акциональные и неакциональные.
Акциональные глаголы обозначают активное действие лица.
Среди них глаголы физического действия (мыть, чистить, ко-
пать, бить, варить и пр.), глаголы перемещения, движения (ходить,
бегать, летать, шагать и т. д.), речевого действия (говорить, рас-
сказывать, сообщать, спращивать и др.), глаголы донативного дей- ствия, изменяющие поссесивные отношения (давать, брать, вручать,
получать, дарить, обмениваться и т. д.), глаголы социальных интер- субъектных действий (играть с кем, ссориться, мириться, воевать,
разводиться, здороваться и др.)
Они обозначают действия, характеризуемые потенциальной наблю- даемостью, целенаправленностью, а также способностью к конкретно- временной локализации; располагают наиболее богатыми конструктив- ными возможностями по сравнению с другими глагольными классами.
Позицию субъекта при этих глаголах, как правило, занимают су- ществительные, называющие лицо или живое существо.
Второй подкласс акциональных глаголов составляют глаголы мен- тальных действий (думать, размышлять, анализироваь, решать,
сображать, воображать, считать), глаголы восприятия (восприни-
мать, осознавать, ощущать, чувствовать, слушать, слышать, ося-
зать). Для первой группы не характерна наблюдаемость, для второй —
наблюдаемость и целенаправленность.
Другие подклассы акциональных глаголов включают глаголы эмо- цинального и физиологического действия, глаголы деятельности и способа поведения. За более подробным описанием этих классов мы отсылаем читателя к работе [132].
1   ...   25   26   27   28   29   30   31   32   33

Неакциональные глаголы утрачивают часть морфологических и синтаксических глагольных свойств, присущих акциональным глаго- лам. В частности, многие из них имеют только форму третьего лица,
не образуют форм императива, употребляются только в текстах опреде- ленного типа (коммуникативного регистра речи) — ср.: «Я вниматель-
но смотрю, как ты уступаешь своему брату в начитанности». —

6.1. Коммуникативная грамматика русского языка
271
«Я прекрасно знаю, что ты уступаешь своему брату в начитан-
ности».
Среди неакциональных глаголов выделяются:
• Глаголы состояния или статуальные глаголы. Они не облада- ют признаками активности и целенаправленности (страдать,
тосковать, мерзнуть, спать, бодрствовать и др.). Позицию субъекта при этих глаголах могут занимать существительные, на- зывающие лица, живые существа (она грустит); предметы (дом
разрушается); среду, пространство, локус (на улице вечереет,
темнеет).
• Функтивные глаголы. Они обозначают не действие, а функциони- рование предмета или возможность функционировать как способ существования или осуществления предмета (телевизор рабо-
тает; волны плещут, ветер воет).
• Реляционные глаголы выражают разного рода отношения (лока- тивные, партитивные, поссесивные, компаративные).
• Компликаторы усложняют элементарную структуру предложения,
входят в состав полипредикативных конструкций (определять,
обуславливать, вести к, обеспечивать, зависеть от). Цена
товара зависит от его качества.
К ним относятся каузативные глаголы, обозначающие воздействие на лицо или предмет, в результате которого лицо совершает действие,
изменяет состояния, предмет изменяет свое состояние, качество, ме- стоположение (требовать ответа; просить помочь), и авторизующие глаголы, включающиеся в предложения, в которых взаимодействуют элементы модели сообщаемого содержания с элементами модели ре- чемыслительного действия субъекта (оценки или восприятия): «Люби-
мые всегда кажутся нам бессмертными» (Паустовский).
Глаголы — логические связки, выражают причинно-следственные отношения, отношения обусловленности: «Точность мысли обусловли-
вает точность выражений» (Флобер).
Неполнознаменательные глаголы. Основное отличие их от знаме- нательных глаголов состоит в том, что они не способны самостоятельно выполнять функцию предиката.
Модификаторы: они выполняют связочную функцию между субъ- ектом и предикатом — связки (быть, являться), обозначают признак предиката, фазы его процессуального развития — фазисные глаголы
(начать, стать, становиться, продолжать, прекращать, кончать), выра- жают модальное отношение между субъектом и предикативным при- знаком — модальные глаголы.
Компенсаторы образуют предикат вместе с отвлеченными именами действия, состояния, качества. На имени лежит основная категори- ально-семантическая нагрузка, глагол дополнительно вербализует зна-


272
Гл. 6. Приобретение знаний и анализ текстов
чение процесса или признака и выражает формально-грамматические значения предиката. (Самолет совершает посадку, Профессор прово-
дит консультацию, Мальчик отличается впечатлительностью).
Использование словаря глаголов, построенного с учетом указанных параметров, позволяет, в частности:
— корректно определить модель предложения (которую организует тот или иной глагол), а также значение в модели, и, таким образом, осуществлять анализ по моделям предложений с опре- деленным значением;
— в ряде случаев разрешить проблему омонимии и, таким образом,
сократить количество вариантов разбора. Пример. «Итоги голо- сования показывают слабость правых». Обратим внимание, что
показывают — это компликативный глагол, соединяющий две ситуации, названные признаковыми именами существительными.
6.2. Реляционно-ситуационный анализ текста
6.2.1. Морфологический и синтаксический анализ.
Морфологический анализ. На этапе морфологического анализа в тексте распознаются слова и разделители. Для каждого слова на основании его морфологии определяется список всех возможных грам- матических форм. Словоформы, соответствующие одной нормальной
(словарной) форме слова и одной части речи, а также стоящие в од- ном числе (для изменяющихся по числам частей речи), объединяются в группы, которые далее будем условно называть «лексемами» (хотя это и не лексемы в строгом лингвистическом смысле). Синтаксиче- ские зависимости между лексемами выявляются на следующем этапе анализа. Очевидно, одному и тому же слову может соответствовать несколько таких лексем. Например, для слова «и» будут определены варианты: союз, частица и междометие. Для того чтобы уменьшить результирующее число вариантов предложения, в настройки морфоло- гического анализатора включен фильтр: для каждой части речи можно определить, будет ли она учитываться при дальнейшем анализе. На- стройки по умолчанию позволяют полностью игнорировать междометия и игнорировать частицы, если есть варианты того же слова, относящи- еся к другим частям речи. Следовательно, в примере с «и» останется единственный вариант — союз.
Помимо грамматической информации для каждого слова запоми- нается также его смещение от начала текста и следующий за словом разделитель. Анализ разделителей позволяет обрабатывать переносы,
разбивать текст на предложения, а предложения — на секции в соот- ветствии со знаками препинания. При этом учитывается возможность появления разделителей внутри слов, например: дефисов, символов десятичной точки, разделителей дат и т. п.


6.2. Реляционно-ситуационный анализ текста
273
Таким образом, вход морфологического анализа представляет собой текст. На выходе получаем список предложений, каждое из которых представляет собой список слов. Каждое слово, в свою очередь, —
список лексем.
Синтаксический анализ. Прежде чем переходить к краткому опи- санию синтаксического анализа, напомним определение синтаксемы,
следуя [129].
Синтаксемой называется минимальная синтактико-семантиче-
ская единица языка, несущая свой обобщенный категориальный
смысл в конструкциях разной степени сложности и характеризую-
щаяся всегда взаимодействием морфологических, семантических и
функциональных признаков.
Основной задачей синтаксического анализа является установление различных зависимостей между лексемами, выявленными на предыду- щем этапе. В частности, это выделение синтаксем и именных групп,
а также разрешение анафорических ссылок.
Первые две задачи решаются в пределах одного предложения. Для всех предложений, полученных на выходе морфологического анализа,
строится список вариантов таким образом, чтобы в каждом варианте предложения у каждого слова была только одна лексема. Так как при этом число вариантов предложения равно произведению числа лексем для каждого слова, то встает задача ограничения количества вариантов. Для этого используются эвристики, позволяющие отбросить заведомо некорректные варианты. Кроме того, в настройках синтак- сического анализатора можно явно задать максимально допустимое количество вариантов.
Затем к каждому варианту предложения применяется алгоритм выявления подчинительных синтаксических связей, в результате чего лексемы объединяются в деревья зависимостей: лексема родительского узла управляет всеми лексемами дочерних узлов. Именная группа —
это любое поддерево синтаксемы, в которое входит корневое суще- ствительное. Семантические связи между синтаксемами выявляются на следующем этапе анализа. Помимо управления, синтаксический анализ обнаруживает однородные члены. Таким образом, на этом этапе между лексемами могут быть обнаружены два вида связей: управление и од- нородность. Каждый раз при обнаружении какой-либо синтаксической связи следует увеличивать вес варианта предложения. По окончании разбора предложения будут оставлены только варианты с максималь- ным весом. По умолчанию предложения с нулевым весом удаляются
(это можно задать настройками синтаксического анализатора).
Таким образом, вход синтаксического анализа представляет собой предложение на выходе морфологического анализа. Выход — предложе-


274
Гл. 6. Приобретение знаний и анализ текстов
ние в виде списка вариантов, каждый из которых представляет собой список деревьев зависимостей. Более подробно описание морфологиче- ского анализатора и методов синтаксического анализа можно найти на сайте [137].
Основная задача реляционно-ситуационного анализа состоит в пе- реходе от синтаксем к их значениям и, в рамках предложения, от значений синтаксем к значению предложения. Для реализации этой задачи нам потребуются неоднородная семантическая сеть (из первой главы настоящей монографии) с расширенным семейством отношений,
отображение из множества синтаксем в вершины семантической сети и множество правил для снятия многозначности этого отображения
(т. е. для уточнения значений синтаксем). В результате предложению будет сопоставлено множество значений синтаксем и фрагмент семан- тической сети на множестве таких значений. Эту конструкцию мы назовем семантическим образом предложения (высказывания). С по- следним — семантическим образом предложения — можно выполнять различные формальные операции, например, исследовать свойства от- ношений семантической сети, выполнять операции обобщения, конкре- тизации, сравнивать с аналогичными образами других предложений,
искать релевантные структуры и т. д. Поэтому семантический образ предложения мы и будем считать значением предложения.
Вершины семантической сети будем отождествлять со значениями синтаксем, ребра — с семействами отношений на множествах значений
[14]. Один из типов вершин будет соответствовать предикатной лекси- ке языка — глаголам, девербативам (отглагольным существительным),
причастиям и деепричастиям. С каждым предикатным словом свяжем некторое подмножество множества значений, являющихся функциями значения предикатного слова. Это подмножество множества значений будем называть ролевой структурой или ролевым фреймом предикат- ного слова.
Например, с глаголом бежать в значении быстро перемещаться
пешком связан ролевой фрейм со слотами: субъект (кто бежит), цель
(куда бежит), причина (вследствие чего), квантитатив (как быстро)
и некоторые другие. Если же взять омонимичное ему слово в значении
бежит время, то, разумеется, ролевой фрейм его будет иным. Слоты ролевого фрейма будем иногда называть ролями.
6.2.2. Установление значений синтаксем. Установление значе- ний синтаксем в случае присутствия в предложении глагола/деверба- тива выполняется в два этапа: 1) выполняется поиск предикатных слов с их ролевыми фреймами и 2) определяются значения синтаксем.
Приведем список некоторых значений синтаксем:
1. Аблатив — исходная точка движения (выйти из комнаты).