Файл: Методыискусственногоинтеллекта.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.11.2023

Просмотров: 433

Скачиваний: 22

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
2. В свое время было замечено, что разнообразие синтаксиче- ских систем разных языков создается за счет разнообразия сложных синтаксических структур, возникающих в результате преобразования простейших ядерных структур. Число же ядерных структур невели- ко, а сами ядерные структуры более или менее универсальны, т. е.
встречаются в значительном числе языков мира или во всех языках.
По-видимому, элементарные значения отличаются тем же свойством:
чем элементарнее значение, тем больше круг языков, в которых оно может иметь однословное выражение, и тем больше вероятность того,
что оно действительно выражается таким образом, а элементарные значения однословно представлены, видимо, в большинстве языков мира. Разнообразие семантических систем разных языков возникают на уровне комбинаций элементарных значений.
3. Объектом толкования является в общем случае не отдельно взя- тое слово, а целая ситуационная, или сентенционная форма, содержа- щая, помимо толкуемого предиката, переменные, которые обозначают участников описываемой данным предикатом ситуации. Объясняется это тем, что значение многих слов нельзя истолковать иначе, как в составе такой формы.
4. Понятие лексической функции играет ключевую роль в модели семантического синтеза. Под лексической функцией (ЛФ) понимается функция, ставящая в соответствие данному слову или словосочета- нию X другое слово или словосочетание Y , определенным образом связанное с X по смыслу. Выделяются два типа ЛФ: лексические замены и лексические параметры. Лексические замены — это функции,
ставящие в соответствие данному слову X такое слово Y , лексическое значение которого (в переводе на семантический язык) совпадает, цели- ком или частично, с лексическим значением X (семантическая связь на парадигматической оси языка). При этом синтаксические свойства Y
могут существенно отличаться от синтаксических свойств X.
Как следует из приведенного выше определения, лексические за- мены суть средства равнозначного перефразирования, т. е. средства лексической синонимии в широком смысле слова. К их числу относятся собственно синонимы (Syn), конверсивы (Conv) и чисто синтаксиче- ские дериваты (So, Ао, Adv0, Vo), т. е. производные другой части речи,

полностью сохраняющие лексическое значение исходного слова, ср.
двигаться — движение, рожать — роды, (быть) белый — белизна (So);

264
Гл. 6. Приобретение знаний и анализ текстов
строить — строительный, республика — республиканский, карты —
карточный (Ао); быстрый — быстро, смысл — по смыслу, большой —
очень (Adv0); строительный — строить, любовь — любить (Vo).
Если лексические замены ставят в соответствие слову X другое слово Y , семантически связанное с X на парадигматической оси языка,
то лексические параметры ставят в соответствие данному слову X
такое слово Y , которое семантически связано с X на синтагматической оси языка. Например, было замечено, что пары слов типа собака ла-
ять, ножницы стричь, рука хватать, пища есть, одежда
надевать и др. находятся в синтагматических смысловых отношениях.
Примером лексического параметра может служить Magn («очень»,
«высокая степень»). Magn синтагматически сочетается со словами раз- говорной речи, например, Magn (дурак) = круглый, Magn (oшибка) =
грубая, Magn (тишина) = гробовая, Magn (тьма) = кромешная.
Вводятся функции-параметры Oper, Func, Labor и прочие. Чтобы понять сущность некоторых из этих параметров, рассмотрим ситуацию,
обозначаемую словом влияние. В этой ситуации принимают участие два действующих лица: A — первый участник, тот, кто влияет, и
B — второй участник, тот, на кого влияют. Тогда Орег1 (влияние) =
оказывать (
A оказывает влияние на B), Орег2 (влияние) = быть
под, находиться под, испытывать, подвергаться (
B находится под
влиянием
A, B испытывает влияние).
Теория «смысл-текст» нашла свое практическое приложение в ком- пьютерной системе ЭТАП [Апресян и др., 1989]. Эта система может выполнять перифразирование предложений на русском языке и решать задачи автоматического перевода
1
).
Неотъемлемой частью системы ЭТАП является комбинаторный сло- варь русского языка, который содержит всю лингвистическую инфор- мацию о лексемах, включая лексические функции и их значения.
Приведем в качестве примера фрагменты статей русского комби- наторного словаря, содержащие описание лексических функций и их значений для слов контроль, надежда и просьба.
КОНТРОЛЬ
ANTI: бесконтрольность
V0: контролировать
MAGN: строгий / надежный / неослабный / особый / жесткий
ANTIMAGN: слабый
OPER1: осуществлять
INCEPOPER1: устанавливать hнадi / устанавливать hза2i / налажи- вать hза2i
1
) См. демонстрационную версию переводчика http://proling.iitp.ru/etap/
index.html


Введение
265
FINOPER1: утрачивать / терять
LIQUOPER1: лишать
OPER2: быть hпод2i / находиться hпод2i / подвергаться
INCEPOPER2: попадать hпод1i / оказываться hпод2i
FINOPER2: выходить hиз-подi
LIQUOPER2: освобождать hотi / выводить3 hиз-подi
LABOR1-2: держать hпод2i
INCEP LABOR1-2: брать hпод2i / ставить hпод2i
FINLABOR1-2: выпускать hиз-подi
LIQUFUNC2: отменять hнадi
НАДЕЖДА
SYN1: упование, чаяние
ANTI: отчаяние / безнадежность
FIGUR: луч / проблеск / искра [ср. луч надежды]
V0: надеяться
S2: надежда 2 [ср. Он — моя единственная надежда]
MAGN: твердый [ср. Он подал мне твердую надежду, что ...]
ANTIMAGN: небольшая / слабая / шаткая / робкая
BON: радужная
VER: обоснованная
ANTIVER: напрасная / тщетная / несбыточная
OPER1: питать / лелеять / тешиться
OPER1-NS: возлагать
INCEPOPER1: обретать
FINOPER1: терять / оставлять
FINFUNC0: испаряться / улетучиваться / угасать / развеиваться
LIQUFUNC0: развеивать
INCEPFUNC1: появляться hуi / рождаться hуi / возникать hуi
FINFUNC1: покидать / испаряться hуi / улетучиваться hуi / угасать hуi
CAUSFUNC1: вселять hв1i / внушать
FACT0-M: сбываться / оправдываться
ANTIFACT0-M: разбиваться / лопаться / развеиваться
LIQUFACT0-M: развеивать
ПРOCЬБА
ANTI: требование
V0: просить
SYN1: прошение / ходатайство / мольба
MAGN: большая / огромная
MAGN-NS1: убедительная
MAGN-NS2: настойчивая
ANTIMAGN: небольшая / маленькая / скромная

266
Гл. 6. Приобретение знаний и анализ текстов
VER: разумная
ANTIVER: неразумная
LABOR1-3: обращаться hс3i
CAUSOPER3: обременять
FUNC2: заключаться hв2i / состоять hв2i
REAL3-M: выполнять
ANTIREAL3-M: отклонять / отказывать hв2i
6.1. Коммуникативная грамматика русского языка
6.1.1. Минимальные синтаксические единицы — синтаксемы.
Лингвистические идеи описываемого ниже подхода лежат в коммуни- кативной грамматике русского языка [121, 132], способом представле- ния знаний являтся неоднородные семантические сети, введенные нами в первой главе.
Коммуникативная грамматика русского языка основана на связи синтаксиса и семантики. Синтаксис как наука изучает средства и спо- собы построениия связной речи и прежде всего ее коммуникативных единиц — предложений.
Слова-лексемы, единицы словарного состава языка в совокупности его конкретных грамматических форм еще не являются синтаксиче- скими единицами и не передают смысл высказывания. Так, например,
в локативных формах в лесу, за лесом, над лесом, из леса, из-за
леса, возле леса актуализируется значение места, в творительном пути движения лесом — значение протяженности пространства, в объектных формах губить лес, рубить лес, сажать лес, любоваться лесом
актуализируется предметное значение. В каждом из этих значений различные синтаксические единицы от слова лес могут объединяться с синтаксическими единицами от других слов (в саду, в комнате),
создавая обобщенный тип.
Синтаксемой называется минимальная семантико-синтаксиче-
ская единица русского языка, выступающая одновременно как но-
ситель элементарного смысла и как конструктивная компонента
более сложных синтаксических построений [132].
В рассмотренных примерах синтаксемами (с локативным значени- ем) являются «в + предл. падеж» и «за + твор. падеж», со значением пути движения «твор. падеж» и др.
С другой стороны, в предложении «Старик (мальчик, рыбак) ловил неводом рыбу», имя старик невозможно заменить на имя, например,
свисток — это разрушит предложение. Это значит, что для объедине- ния синтаксем в типы и приписывания им обобщенных значений необ- ходимо учитывать их категориальное значение. Слова старик, мальчик,
рыбак имеют такое общее категориальное значение — значение лица,


6.1. Коммуникативная грамматика русского языка
267
свисток же имеет категориальное значение предмета и не может вы- полнять функцию субъекта. Таким образом, кроме морфологической формы слова решающую роль играет обобщенное значение, т. е. катего- риально-семантический класс слова. Обобщенное значение определяет синтаксические возможности слова и способы его функционирования.
Таким образом, синтаксис имеет дело с осмысленными единицами,
несущими свой не индивидуально-лексический, а обобщенный, кате- гориальный смысл в конструкциях разной степени сложности. Эти единицы — синтаксемы — характеризуются взаимодействием морфоло- гических, семантических и функциональных признаков.
В конкретном предложении слово выступает в качестве единицы смысла именно как синтаксема.
Значение слова, передаваемый им элементарный смысл, складыва- ется в результате соединения категориального значения и морфологи- ческой формы и реализуется в определенной синтаксической позиции.
Изолированное рассмотрение слова, в отрыве от текста, не позволяет установить его синтаксическое значение.
В предложении синтаксемы объединяются в сложные конструкции по правилам коммуникативной грамматики для передачи смысла всего высказывания. Выделив в тексте синтаксемы, установив значения, ко- торые они могут принимать, отношения на множестве значений, можно выявить смысл всего текста.
Ограничившись здесь лишь именными синтаксемами, уточним, что именная синтаксема представляется в тексте именной или предлож- ной группой — словосочетанием с существительным или предлогом в качестве управляющего слова. Именная синтаксема характеризуется морфологической формой — предлогом, падежом, и категориально- семантическим классом существительного, от которого она образована.
Значение синтаксемы и есть тот элементарный смысл, который переда- ется синтаксемой.
Таким образом, основополагающая идея коммуникативной грамма- тики состоит в том, что синтаксис должен изучать осмысленную речь,
а синтаксические правила должны учитывать категориальные значения слов, чтобы иметь возможность определять обобщенный смысл любой синтаксической конструкции — от слова до словосочетания и простого предложения.
В конкретном тексте слово выступает уже как синтаксема, т. е.
выступает в определенной синтаксической функции, в определенной грамматической форме, реализует только одно из возможных значений,
которые может принимать данное слово в предложении.
6.1.2. Категориальная семантика лексических единиц.
Для повышения точности определения значения синтаксемы, как уже было


268
Гл. 6. Приобретение знаний и анализ текстов
сказано, существенное значение имеет категориальная семантика как существительных, так и глаголов.
Категориальная семантика существительных. Рассмотрим при- мер: выступление президента в Думе. Одно из слов в предложении —
президент. Одно из лексических значений этого слова: «1. В странах с республиканской формой правления: глава государства». В процессе анализа важно установить именно это значение.
Но этого недостаточно. В приведенном примере слово президент
реализует значение агенса (производителя действия). Слово прези-
дент способно передавать это значение потому, что обладает катего- риальным значением лица, способного целенаправленно действовать,
мыслить (ср. невозможность реализации этого значения существитель- ными других семантико-грамматических классов выступление стака-
на, года, звездопада в Думе).
Существительное президент как личное существительное в раз- ных синтаксических конструкциях может выражать значения:
• субъекта в разного рода моделях: субъекта действия (президент
подписал указ), субъекта состояния (у президента болит голо-
ва), субъекта-посессора (у президента есть сын) и т. д.;
• объекта (доверять президенту);
• адресата (обращение к президенту);
• делиберата (говорить о президенте);
• комитатива (Патриарх с президентом зашли в храм);
• предиката (в квалификативных моделях: Иванов президент
страны)
и другие.
Таким образом, значение синтаксемы складывается в результате соединения категориального значения и морфологической формы, реа- лизуется в определенной синтаксической позиции.
Как отмечено выше, одним из ключевых этапов лингвистического анализа является получение информации о значении синтаксемы. Для этого необходимы сведения о категориальной семантике имени суще- ствительного, морфологической форме и синтаксической позиции.
Что понимается под категориальной семантикой? И каким образом в процессе лингвистического анализа извлекается информация об этой характеристике синтаксемы?
Категориальная семантика — это обобщенное значение, которое ха- рактеризует слова, принадлежащие к одному категориальному классу
(например, классу лиц, предметов, разного рода признаков для имен существительных).
Выделены следующие категориально-семантические классы суще- ствительных: личные, предметные, пространственные, признаковые,