ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 13.10.2020
Просмотров: 7966
Скачиваний: 170
К числу поисковых моделей относится так называемая "когортная модель" (по аналогии с римской когортной организацией армии), согласно которой при встрече с началом некоторого слова в памяти человека всплывает обширный ряд слов с таким началом, но под влиянием контекста и последующих элементов слова число активизируемых слов сужается [Marslen-Wilson & Tyler 1980; 1981] (см. также разбор и наглядную репрезентацию этой модели в [Aitchison 1987]). Рассмотрим примеры реализации подобного поиска из экспериментального исследования Т.Ю. Сазоновой [1993; 1994]. Т.Ю. Сазонова отмечает, что когортная модель хорошо объясняет установленные в ее эксперименте факты, однако при сужении когорты особую роль играет взаимодействие ряда факторов, в том числе принадлежность слов к некоторому классу, опознание определенной словообразовательной модели. На рис. 6.1 приводится пример из работы [Сазонова 1994: 66], основывающийся на записях ии. в ходе идентификации слова НЕЗАШОРЕННЫЙ (из справочника "Новое в русской лексике").
незашоренный
Рис. 6.1
Соглашаясь с мнением, которое высказывается в работе [Emmorey & Fromkin 1988] относительно того, что для быстрого доступа к слову важны не только начальные элементы (имеются также исследования, свидетельствующие, что конечные элементы могут быть даже более важными для распознавания слова), Т.Ю. Сазонова обращает внимание на использование ии. всего арсенала имеющихся у них средств при одновременном поиске по всем возможным направлениям. При этом к числу причин неверного опознания слова может относиться неточное распознание (как продукт процесса распознавания) графического (или звукового) образа слова. Примеры "вставки", добавления элемента в новое слово или "подмены" одной буквы другой, чтобы сделать его
178
незашоренный ^ ненужный незашторенный — необязательный^^· незасоренный незатронутый -^"""^ незаконченный |
"^ незашоренный •^ незашторенный ^ -**" незасоренный незатронутый |
^^ незашоренный ** ^^ незашторенный |
привычным, знакомым, прослеживаются на рис. 6.2, где слева приведено предъявлявшееся испытуемым слово, справа упорядочены полученные ассоциативные реакции, а между ними помещены слова-медиаторы, идентифицированные вместо действительно фигурировавшего в эксперименте Т.Ю. Сазоновой слова и обусловившие те или иные ответы. В работе [Сазонова 1999] обсуждаются различные примеры идентификации русских прилагательных разной структуры и семантики с акцентированием внимания на стратегической природе процессов идентификации слова.
НЕЗАШОРЕННЫЙ
незашторенный
незасоренныи
штора, шторы портьера окно открытый
чистый засорить
Рис. 6.2
Следует обратить особое внимание на то, что модели прямого доступа к слову (в классификации, которая дается в [Garnham 1985]) принципиально отличаются от моделей поиска слова в том, что первые из них предполагают параллельную переработку слов, а вторые — их последовательный перебор (соответствующие термины: parallel processing, serial processing;). Таким образом проблема классификации моделей усложняется переносом акцента на дискуссию между сторонниками двух конкурирующих подходов — последовательной (в условиях поиска) и параллельной переработки. Фактически модель логогенов Дж. Мортона была первой моделью активационного типа, подразумевающей, что процесс активации затрагивает все возможные логогены одновременно.
Идее параллельной переработки наилучшим образом отвечает модель распространяющейся активации (spreading activation model), которая преодолевает неспособность когортной модели объяснить, как человек справляется со случаями нечеткости исходной акустической информации при восприятии начала слова и благодаря чему он может неоднократно пересматривать свои первоначальные гипотезы. Согласно модели распространяющейся активации в ходе узнавания слов [McClelland & Elman 1986], при восприятии слушающим начальных сегментов слова любой идентифицируемый звук немедленно активизирует связи со всеми словами, которые содержат этот звук в примерно такой же позиции в слове. Затем любой из таких кандидатов на опознание увязывается с его возможным значением, т.е. семантика воздействует на сужение перебираемого ряда. По мере добавления информации некоторые слова получают дополнительную активацию, а активность других затухает, чему также способствует интегрирование
179
слова в контекст. Таким образом, эта модель имеет много общего с моделью поиска слов при производстве речи: слова получают все больше и больше активации до тех пор, пока одно из них не окажется ведущим, в то время как неподходящие слова подавляются по возрастающей.
Еще одной моделью, в принципе сходной с моделью поиска слов при производстве речи, является каскадная модель [McClelland 1979], согласно которой вся информация, активизированная на первой ступени, остается доступной для переработки и на дальнейших ступенях (т.е. дело обстоит таким же образом, как при прохождении воды по водопаду). При этом имеется в виду не следование одному и тому же слову с начала и до конца, а сужение возможного ряда слов до единственно нужного.
Предлагаются и другие классификации моделей опознавания слов. Так, в книге [Sternberg 1996] противопоставляются "пассивные" и "активные" модели (или теории) восприятия речи и/или узнавания слов. В отличие от этого некоторые авторы (см., например, [Balota 1994: 325; Lively et al. 1994: 281-293]) предпочитают подразделять имеющиеся ныне модели на три больших класса в зависимости от того, что положено в основу модели: последовательный перебор единиц (поисковые модели), параллельная активизация ряда единиц (активацион-ные модели) или сочетание обеих характеристик (гибридные модели). Последняя из названных групп моделей определилась только в последние годы. Следует к тому же заметить, что не всегда классификации даже по одним и тем же принципам совпадают хотя бы потому, что авторы рассматриваемых моделей продолжают их совершенствовать, содержание публикаций разных лет может значительно различаться, поэтому ссылки на одних и тех же исследователей иногда приводят авторов обзоров к противоречивым выводам.
Как отмечается в [Lively et al. 1994: 281], основные различия между названными классами моделей заключаются в следующем. Один класс моделей исходит из того, что слова извлекаются из памяти посредством процесса поиска. В этом случае лексикон наделяется специфическими особенностями организации, обеспечивающими быстрый и эффективный поиск в большом числе хранящихся альтернатив. Второй класс моделей постулирует узнавание слов через процесс активации. Такие модели признают, что кандидаты на лексическое опознание активизируются пропорционально их соответствию входному сигналу. Критерии выбора ответа варьируются для разных моделей, но обычно выбор некоторой единицы происходит на основе относительного уровня ее активности. Третий класс моделей сочетает допущения моделей первых двух классов. Такие гибридные модели исходят из того, что сначала активизируется несколько кандидатов на опознание, а затем процесс поиска применяется для установления нужной единицы.
Еще один подход к моделям узнавания слов предложен в работе [Massaro 1994: 241-255], где выделен ряд важных параметров, по которым сопоставляются рассматриваемые модели. К числу таких параметров отнесены следующие: 1) является ли узнавание слова прямым или опосредованным (например, достигается через посредство опознания фонем); 2) трактуется ли принадлежность к категории как факт (по принципу "да/ нет") или как градуированная (варьирующаяся) степень принадлежности; 3) имеет ли место отсрочка начала переработки
180
или информация от варьирующегося сигнала используется как текущая (on line); 4) является ли доступ к лексическим репрезентациям в памяти последовательным или параллельным', 5) функционирует ли процесс узнавания слов автономно или он зависит от контекста (в частности, испытывает ли информация, получаемая из одного источника, влияние со стороны других источников). На с.242 названной работы приводится "дерево", иллюстрирующее перечисленные бинарные оппозиции, согласно которым можно обнаружить факты сходства и различий между имеющимися теориями узнавания слов, что и делает Д. Массаро при рассмотрении шести моделей разных авторов (в это число вошли работы [Morton 1969; Marslen-Wilson 1984; McClelland & Elman 1986; Forster 1979; 1985; Klatt 1979; Stevens 1986]) и своей (седьмой) модели узнавания слов [Massaro 1987]. Все эти характеристики действительно важны для сопоставительного анализа имеющихся моделей узнавания слов, но не менее важно проследить динамику отношения авторов (в том числе одних и тех же) к решению возникающих в этой связи вопросов. Так, можно наблюдать сдвиг к признанию наличия параллельного поиска наряду с последовательным доступом у К. Форстера, а также — к градуальности и сочетанию текущей переработки с отсроченной в [Marslen-Wilson 1990] по сравнению с [Marslen-Wilson 1984]2.
Необходимо особо акцентировать следующие положения. Во-первых, все рассматриваемые модели, кроме более ранней модели Дж. Мортона, признают опосредованность узнавания слова рядом процессов. Во-вторых, замеченная в свое время Дж. Мортоном градуальность степени соответствия некоторого признака хранящемуся в памяти индивида эталону (что выражалось в его модели через понятие "порога") некоторое время оставалась вне поля зрения многих исследователей. В последние годы положение изменилось. Можно полагать, что это связано с происшедшим пересмотром ряда основополагающих понятий, каких как "признак", "значимость признака", "прототип" и т.д. (см., например, [Залевская 19966; Barsalou 1992а; 1992Ь; Ungerer & Schmid 1996]), что нашло отражение в моделях [Klatt 1979; Massaro 1994]. В то же время сам Д. Массаро не заметил того, что в его модели фактически постулируются оба ответа (и "да", и "нет") по параметру градуальности, поскольку установленный индивидом факт принадлежности слова к некоторой категории не менее значим, чем степень соответствия прототипу. В-третьих, ответ "нет" по параметру отсроченности означает, что варьирующаяся информация о речевом сигнале используется как текущая, т.е. сразу, а не с отсрочкой, что признается всеми авторами, кроме [Stevens 1986], тем не менее имеется тенденция до-
2 Для удобства сопоставительного анализа обсуждаемых моделей в [Залевская и др. 1998] приводится таблица, в которой сведены данные по названным выше пяти параметрам относительно того, как решаются названные вопросы в шести рассматриваемых Д. Массаро моделях и в его собственной публикации.
181
пускать возможность сочетания обоих способов. В-четвертых, уже начиная с модели Дж. Мортона постулируется параллельность доступа к лексическим репрезентациям в памяти индивида. Обратим также внимание на то, что модель Д. Массаро сочетает оба способа доступа: и параллельный, и последовательный, что представляется наиболее удачным решением этого вопроса. В-пятых, по вопросу зависимости от контекста авторы разбиваются на две большие группы с противоположными мнениями, каждая из которых находит поддержку в модели Д. Массаро. Заметим, что во всех названных моделях речь идет о контексте в его традиционной трактовке, т.е. о внешнем, "текстовом контексте"; ни одна из них не учитывает наличия у читающего специфического внутреннего контекста (перцептивного, когнитивного, эмоционально-оценочного), в который неизбежно включается идентифицируемое слово (такая трактовка контекста вытекает из концепции лексикона, предложенной в [Залевская 1977]; см. выше главу 5).
Некоторые из упоминающихся моделей (и другие, не затрагиваемые здесь модели) обсуждаются и иллюстрируются рисунками, например, в работах [Залевская 1993; Сазонова 1997; Aitchison 1987; Garman 1990].
Для тех, кто заинтересовался этим вопросом, особенно полезно ознакомиться с моделью Д. Массаро [Massaro 1994], отображающей современные представления о ведущих особенностях узнавания слов. Основной тезис концепции автора состоит в том, что восприятие речи основывается на множестве источников информации; воспринимающий оценивает и интегрирует все эти источники для достижения перцептивного узнавания. Уже в самом акустическом сигнале содержится много ключей, используемых слушающим для раскодирования сообщения. Слушающий привлекает ситуативный и языковой контекст для понимания неоднозначных сигналов, а также пользуется информацией других модальностей (движениями губ, жестами). Хорошо освоенные паттерны узнаются в соответствии с общим алгоритмом независимо от модальности или специфической природы паттернов. Переработка речи трактуется как последовательность стадий (этапов), что признается и другими авторами. Модель включает три операции первичного перцептивного узнавания: оценку признаков, интеграцию признаков и принятие решения. Признаки с градуальными значениями оцениваются, интегрируются и сопоставляются с прототипными описаниями в памяти; решение принимается на основании относительного (градуированного) соответствия стимульной информации описанию прототипа, что заслуживает более подробного рассмотрения.
Центральным понятием для обсуждаемой модели является суммарное описание перцептивных языковых единиц, называемое прототипом и содержащее конъюнкцию (т.е. связь по принципу "и...и...и") разнообразных характеристик или признаков (features). Прототип трактуется как категория, а его признаки должны иметь показатели степени соответствия (values) идеальным представителям катего-
182
рии, имеющим право называться ее членами. Д. Массаро отмечает, что точная форма репрезентации таких признаков неизвестна и, возможно, никогда не будет установлена, однако ментальные репрезентации должны согласоваться с сенсорными репрезентациями, которые являются продуктами преобразования речи, воспринимаемой со слуха и при чтении, что необходимо, поскольку репрезентации слышимой и видимой речи, очевидно, связаны друг с другом.
Прототипы извлекаются из памяти для решения текущих задач. Например, при восприятии речи могут активизироваться все прототипы, соответствующие перцептивным единицам воспринимаемой речи. Сенсорная* система преобразует физический сигнал и делает доступными разнообразные источники информации — признаки. В ходе первой операции рассматриваемой модели все признаки оцениваются с точки зрения их соответствия хранящимся в памяти прототипам. Для каждого признака и каждого прототипа такая оценка дает информацию о том, в какой мере каждый признак речевого сигнала соответствует его значимости для прототипа. Поскольку признаков много, необходима обобщающая их метрика, которая показывала бы степень соответствия каждого признака его прототипу. Для этой цели Д. Масаро использует концепцию расплывчатых множеств [Zadeh 1965], позволяющую представить значения истинности пропозиций на шкале от нуля до единицы (т.е. от полностью ложного до полностью истинного). Именно отсюда происходит название модели Д. Массаро (FLMP — Fuzzy Logical Model of Perception), в которой этот принцип применен в целях репрезентации степеней соответствия признаков прототипам. Например, показатель значимости (value) ".5" соответствует полностью неоднозначной ситуации, в то время как ".7" говорит больше об истинности, чем о ложности. Отсюда расплывчатые показатели истинности способны репрезентировать степень принадлежности к категории, а не только сам факт отнесенности к ней, а также и отображать разные виды информации. К тому же это позволяет оперировать количественными данными.
Оценка признаков устанавливает степень соответствия каждого признака в составе слога каждому прототипу, хранящемуся в памяти. Однако целью сопоставления является заключение относительно общего результата, т.е. того, насколько все признаки вносят вклад в процесс узнавания. Отсюда вторая операция в модели Д. Массаро, названная интеграцией признаков, заключается в сведении по принципу конъюнкции всех показателей соответствия признаков прототипам, при этом все признаки вносят вклад в суммарный показатель, однако вклад наиболее четких признаков оказывается самым существенным. Третья операция в ходе узнавания — это принятие решения. На данной стадии показатель по каждому признаку оценивается относительно суммы показателей всех релевантных прототипов. Д. Массаро подчеркивает, что эти три стадии процесса узнавания протекают последовательно, но пересекаются (накладываются одна на другую); учитывается многообразие источников информации, которые могут действовать по принципам "снизу — вверх" и "сверху — вниз"; из каждого источника поступает градуированная информация, при этом оценка по одному источнику не испытывает влияния со стороны других источников. Общий результат процесса интеграции признаков также является градуированным.