Файл: Учебнометодическое пособие Издво Омск Омгу 2005 2 удк 800 ббк 81. 1я73 м 748.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.12.2023
Просмотров: 164
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
55
начает существительные и слова, которые могут стоять в позиции существительных. Для уточнения, т. е. указания лексико-грамма- тических разрядов существительных, можно пользоваться под- строчными индексами: N
pers
– имя лица, N
mass
– вещественное су- ществительное, N
abstr
– абстрактное существительное, V
tr
– пере- ходный глагол, V
intr
– непереходный глагол, А – прилагательное, D
– наречие и его эквиваленты. Не кодируются, а даются в обычной транскрипции исследуемые слова и некоторые служебные.
Кодируя все слова, кроме изучаемого, получают его дистри- бутивную формулу.
Дистрибутивные формулы очень удобны для классификации собираемых примеров, т. к. позволяют показать условия вариатив- ности значения того или иного слова:
make + N
make a coat/ a decision
make + (the) + N + V
make the machine go
make + A
make sure
make + A + N + for + N
make a good wife for him
Американские дескриптивисты различали два основных ви- да дистрибуции: дополнительную и контрастную.
Дополнительная дистрибуция характеризует тот или иной элемент связной речи в его специфических, свойственных только ему окружениях (в которых другие сравниваемые элементы встре- чаться не могут). Ср., например, различие в указанном отношении русских гласных ы и и: первый из них встречается только в поло- жении после твердых согласных, второй же, напротив – только в положении после мягких согласных (а также в начале слова).
Контрастная дистрибуция характеризует некоторые элемен- ты, выступающие в тождественных окружениях, но обеспечиваю- щие при этом дифференциацию смыслов. Ср., например, по поло- жению и фонологической значимости русские гласные а и о в сло- вах: мал – мол, м'ал – м'ол и т. п. или грамматические морфемы -ы и -ой в словоформах: стены – стеной и т. д.
Техника дистрибутивного анализа требует систематического и точного учета наблюдаемых фактов. Легче всего такому анализу поддаются фонетические (или фонологические) элементы, по- скольку число их в языке невелико и строго ограничено.
56
Применение дистрибутивного анализа по отношению к мор- фологическим элементам несколько осложняется с количественной стороны, поскольку число этих элементов в любом языке значи- тельно превышает число фонем. Подобные классификации, в част- ности в сфере формообразования, проводились (хотя недостаточно строго) уже традиционной лингвистикой. Так, известные нам из школьной грамматики три типа склонения русских имен сущест- вительных представляют собой не что иное, как их дистрибутив- ные классы, выделяемые с учетом распределения именных (суб- стантивных) основ относительно флексий (флективных морфов).
Для того чтобы лучше понять суть процедуры, допустим, что мы не знаем языка, который исследуем, но при этом считаем, что письменный английский текст, с которым мы имеем дело, пра- вильно членится на линейно упорядоченные отрезки, или после- довательности элементов. Чисто формально выделяются цепочки элементов, отделенные друг от друга точками, которые, в свою очередь, членятся на более мелкие элементы, заключенные между пробелами. Лингвист допускает такое членение текста граммати- чески релевантным, т. е. полагает, что текст делится на указанные сегменты не произвольно, а в соответствии с некоторыми грамма- тическими законами. Цепочку элементов между точками – пред- ложение – будем считать максимальным сегментом, а элемент ме- жду пробелами – слово – минимальным сегментом анализа.
Поскольку цепочки линейно упорядочены, то элементы рас- пределяются так, что каждому предшествует один элемент и за ним следует другой. При этом каждый элемент, например х, отли- чается от других тем, что он соседствует, соположен или совмест- но встречается с определенными элементами, не с теми, что стоят до и после элемента у. Каждый раз, когда в тексте встречается элемент х, будем регистрировать его соседей, т. е. окружение, и приписывать это ему как характеристику. Понятие окружения как позиции элемента относительно других элементов в линейном ря- ду является основным в дистрибутивном анализе.
Совершенно очевидно, что в тексте достаточно большой длины элемент х имеет не один вариант окружения. Так, в пред- ложении The girl in the dock put her handkerchief to her eyes элемент
girl находится в окружении элементов the и in (the – in). Для удоб-
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
57
ства обозначим это окружение через Д
1
. Легко представить себе, что в достаточно большом тексте элемент girl может встретиться, например, в окружении the – is (The girl is beautiful) или в окруже- нии the – ? (Do you see the girl?). Обозначим их соответственно Д
2
и Д
3
. Продолжая анализ таким образом, можно установить все воз- можные окружения для элемента girl. Набор всех полученных ок- ружений будет дистрибуцией элемента girl. Обозначим ее через Д.
Таким образом: Д (girl) = (Д
1
+ Д
2
+ Д
3
+...+Д
n
) = (the – in) +
(the – is) + (the – ?)...
Дистрибуция элемента обычно определяется как совокуп- ность всех окружений, в которых он встречается, т. е. сумма всех
(различных) позиций (или употреблений) элемента по отношению к употреблениям других элементов.
Установив дистрибуцию одного элемента, возьмем другой элемент, например, tree.
В тексте мы, естественно, можем встретить элемент tree в окружении the – in = Д
1
(the tree in the garden) и в окружении the –
is = Д
2
(the tree is high), и the – ? = Д
3
(...in the tree?) и т. д. Очевид- но, что выбор подобных окружений – значительное упрощение процедуры, но он вполне оправдан неопределенностью числа ок- ружений и границ дистрибуции элемента – особенность, которая является одним из основных и принципиальных недостатков ди- стрибутивного метода. Таким образом, для элемента tree сумма окружений будет такая же, как у элемента girl Д = (Д
1
+ Д
2
+ Д
3
+...+Д
n
).
На основе тождества дистрибуций объединим элементы girl
и tree в один класс и получим так называемый дистрибуционный класс элементов. Обозначим его буквой N. Единственной характе- ристикой этого класса является его дистрибуция: Д.
Проделав процедуру анализа со всеми элементами текста, мы получим и другие дистрибуционные классы, которые будут отличаться от класса N своей дистрибуцией. Никаких других грамматических признаков этих классов мы также не знаем.
Поскольку в полном объеме дистрибутивная процедура ни- кем не применялась из-за ее чисто технической громоздкости, то нет необходимости подробно говорить о ее недостатках. Очевид- но, что такая формальная характеристика элемента или класса
58
элементов, как дистрибуция, недостаточна для описания единиц естественного языка. Дистрибуция в таком понимании может ис- пользоваться как дополнительный (однако важный) признак эле- ментов.
В советской и зарубежной лингвистике в 60-е годы понятие дистрибуции приобретает более широкий смысл. О дистрибуции элемента говорят не только тогда, когда имеют в виду его сополо- жение с другими элементами в линейной цепочке, но и когда ис- следуют его место среди других элементов в системе (парадигма- тические отношения) и когда описывают его синтаксические от- ношения с другими элементами. Понятие дистрибуции сохраняет лишь идею совместной встречаемости элементов безотносительно того, какими факторами она определяется: порядком линейного следования элементов или их синтаксическими или смысловыми связями.
На морфологическом уровне понятие дистрибуции равно понятию сочетаемости классов слов. Так, говорят, что дистрибу- ция существительного включает прилагательное, артикль, глагол или что существительное сочетается с прилагательным, артиклем, глаголом. Дистрибуция класса – это сумма сочетающихся с ним классов слов.
Особого внимания заслуживает использование дистрибу- тивного анализа в синтаксисе. Поскольку синтаксис интересуется составом и строением высказываний в отвлечении от их конкрет- ного содержания, то с помощью дистрибутивного анализа здесь в первую очередь устанавливается распределение относительно друг друга не отдельных составляющих конкретные высказывания словоформ, а определенных классов словоформ, каковыми, в ча- стности, являются грамматические формы слов различных частей речи. По указанной причине для осуществления дистрибутивного анализа в синтаксисе требуется некоторая предварительная «обра- ботка» исследуемого материала.
На синтаксическом уровне дистрибуция также определяется как сочетаемость элементов. Чаще всего говорят о дистрибуции глагола-сказуемого, т. е. его сочетаемости с дополнением, обстоя- тельством. И важным здесь оказывается уже не набор окружения, а факторы, определяющие наличие того или иного окружения. Ос-
1 2 3 4 5 6 7 8 9 10 11
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
59
новным фактором является валентность элемента, т. е. его потен- циальная способность сочетаться с другими элементами. При этом разграничивается обязательная и факультативная валентность эле- мента, обязательная и факультативная сочетаемость, обязательное и факультативное окружение. Так, для глагола to buy элементом обязательного окружения будет прямое дополнение, что можно сказать и о любом переходном глаголе и обо всем классе переход- ных глаголов. Обстоятельство же не входит в обязательное окру- жение глагола to buy, но входит в обязательное окружение таких глаголов, как глаголы направленного движения (Не went home).
В настоящее время понятие дистрибуции, пожалуй, наибо- лее последовательно используется при контекстологическом опи- сании лексики – слов и словосочетаний. Нас здесь интересует лишь определенный аспект такого анализа, а именно процедура уста- новления сходства или различия не чисто лексических, а лексико- грамматических значений слов и словосочетаний и выделение не- которых лексико-грамматических классов слов. Важным понятием методики анализа выступает понятие дистрибуционной формулы.
(Понятие дистрибуционной формулы совпадает с понятием мини- мального синтаксического контекста, введенного в практику кон- текстологического анализа Н.Н. Амосовой.)
При использовании дистрибуционных формул приходится учитывать целый ряд разных семантических признаков элементов.
Возьмем сочетание глагола to be с инфинитивом. Известно, что оно имеет два значения – употребляется как модальное сказуемое и как составное именное. Для реализации первого значения необ- ходимо, чтобы существительное-подлежащее, как правило, обо- значало лицо; для реализации второго значения необходимо, что- бы существительное-подлежащее имело отвлеченное, абстрактное значение (wish, intention, idea): My wish was to leave.
Дистрибуционные формулы для таких предложений можно записать следующим образом: N
p
+ V
be
+ V
to
; N
abs
+ V
be
+ V
to
Если взять подкласс прилагательных, выражающих эквива- лентность, тождество некоторых объектов, то мы увидим, что они регулярно реализуют свое значение в двух дистрибуционных формулах: N
1
+V
be
+A+N
2
и N
1,2
+ V
be
+ A. При этом, вероятно, обя- зательным условием является тождество реальных предметов,
60
лиц, понятий, обозначенных N
1
и N
2
(если не иметь в виду поэти- ческие сравнения):
1) Gold is similar to brass (in colour);
2) Gold and brass are similar (in colour).
Данный подкласс включает такие прилагательные, как equal,
different, analogous, synonymous, similar и др.
Таким образом, и на семантическом уровне понятие дистри- буции свидетельствует лишь о факте совместной встречаемости элементов без учета их обязательного линейного соположения.
Еще раз отметим, что если первоначально дистрибутивный анализ оценивался как метод, предназначенный исключить значе- ние из лингвистического описания, то в настоящее время он ис- пользуется в основном для выявления и изучения значения.
Дистрибутивное моделирование широко применяется также в лексикографии для показа функционирования слова и его сочетае- мости. Первыми, кто применил такое моделирование, были пред- ставители прикладной лингвистики: известный методист Г. Паль- мер, использовавший моделирование в своих подстановочных таб- лицах для обучения английскому языку японцев, а затем в 40-х го- дах не менее известный лексикограф А.С. Хорнби в учебном сло- варе. Оба они применяли, однако, не формулы буквенного типа, а модели, выраженные словами. В лексикографии этот метод, или точнее прием, очень себя оправдал. Модели с формулами приво- дятся, например, во введении к «Англо-русскому словарю глаголь- ных сочетаний» под редакцией Э.М. Медниковой и использованы в словарных статьях этого словаря. Применяются они и в спра- вочнике наиболее употребительных английских словосочетаний, составителями которого являются В.И. Перебейнос, С.С. Хидекель и другие авторы.
Моделью в этом последнем справочнике называется «конст- рукция, отражающая грамматическую сочетаемость слов и высту- пающая как общее правило соединения классов слов и построения словосочетаний». Модели записываются символами грамматиче- ских классов и подклассов слов и располагаются в статье в соот- ветствии с заданным порядком моделей каждой части речи. Упот- ребление каждого слова определяется набором моделей. Так, для глагола make дается 6 различных моделей. Среди них, например, модель VNV – Let's make it go.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
61
В целом дистрибутивный анализ является, несомненно, пер- спективным методом научного исследования.
К его положительным качествам относятся:
1) согласованность выводов с процедурами анализа (напри- мер, о тождестве и различии функций каких-то элементов судят только по их окружению);
2) простота выполнения соответствующих процедур (кото- рые при необходимости могут быть полностью автоматизирова- ны);
3) достаточно широкий диапазон применения (дистрибутив- ный анализ с одинаковым успехом применяется не только к еди- ницам разных уровней языковой системы, но и к различным язы- кам, что создает хорошую общую основу для типологических со- поставлений).
Однако дистрибутивный анализ имеет и более или менее оче- видные недочеты:
1) результаты дистрибутивного анализа могут считаться на- дежными лишь при охвате огромного (в некоторых случаях без- гранично большого) количества наблюдаемых фактов, что делает осуществление дистрибутивного анализа необычайно трудоемким;
2) классификации, разрабатываемые посредством дистрибу- тивного анализа (даже при условии исчерпывающего охвата всех наблюдаемых фактов), неполно раскрывают сущность изучаемых явлений. Так, например, тождество или различие семантико-син- таксических функций отдельных словесных форм далеко не всегда обнаруживаются в соответствующих контекстных окружениях
(ср. высказывания типа: Посещение больного нас успокоило, до- пускающие различную интерпретацию в зависимости от того, как они будут осмыслены, здесь «посещение больного» = либо: «боль-
ной посетил (кого-то)», либо: «(кто-то) посетил больного»). В подобных случаях, составляющих для дистрибутивного анализа, так сказать, камень преткновения, на помощь ему приходят уже другие методы исследования.
Дистрибутивный анализ эффективно применяется для задач дешифровки, которые понимаются достаточно широко. Речь идет не только о дешифровке неизвестной письменности, например майя, карийского письма. Любой фрагмент структуры языка мо-
62
жет быть дешифрован дистрибутивными методами. Иначе говоря, структурные закономерности языка нуждаются в реконструкции, они не могут быть полностью обнаружены описательными прие- мами. Свойства сочетаемости элементов друг с другом являются основными характеристиками в их синтагматической развертке.
Систематический анализ дистрибутивных признаков в связи с этим позволяет проникнуть во внутреннюю организацию структу- ры языка на всех его уровнях, от фонологического вплоть до син- таксического. Более того, дистрибутивные методы успешно при- меняются и для исследования структур плана содержания. Семан- тические оппозиции и семантические множители также манифе- стируются в дистрибутивных свойствах речевых единиц. В целом дистрибутивный анализ приводит к построению различных клас- сификационных (таксономических) описаний языка.
3.5. Дистрибутивно-статистический анализ
Только что описанная нами в предыдущем параграфе мето- дика хорошо коррелирует с применением статистики, а следова- тельно, и с другими отраслями прикладной лингвистики, а не только с лексикографией.
Лингвистическая статистика – отрасль языкознания, зани- мающаяся изучением методов раскрытия закономерностей, свой- ственных большим совокупностям однородных объектов на осно- вании их выборочного обследования. Свои важнейшие понятия лингвистическая статистика заимствует у математической стати- стики. Существенно обратить внимание на то, что просто количе- ственный подсчет того или иного явления в нескольких или даже в большом числе текстов статистическим не является. Корректное применение статистики требует серьезного с ней ознакомления.
Основным методом применения статистики в сочетании с дистрибутивным анализом следует признать дистрибутивно-ста- тистический анализ, как он представлен в трудах А.Л. Шайкевича и Ю.Д. Апресяна. Их методика имеет много общего с валентност- ным анализом, как он разработан Г. Хельбигом, а в Ленинграде –
Б.М. Лейкиной.
Дистрибутивно-статистический анализ в том виде, как его разработал и применяет А.Я. Шайкевич, «есть сумма формальных
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»
63
алгоритмических процедур, направленных на описание языка и опирающихся только на распределение (дистрибуцию) заданных элементов в тексте. Под заданными элементами могут пониматься буквы (и другие графические символы), цепочки букв между про- белами (слова), цепочки слов между более крупными пробелами
(высказывания), короче – любые объекты в тексте, непосредствен- но доступные нашему восприятию. Сам анализ при этом носит не жестко-детерминистский, а статистический характер, постоянно использует количественную информацию о встречаемости эле- ментов в тексте».
Важно подчеркнуть, что в своем анализе А.Л. Шайкевич убедительно показывает следующее: скрытое или явное предпо- ложение о том, что текст или какие-то явления в тексте можно представить как случайный процесс, для лингвостатистики непло- дотворно. Шайкевич доказывает, что основные перспективы лин- гвостатистики, если она хочет исследовать особенности структуры текста или структуры языка, связаны с поисками расхождений между теоретическими данными (чаще всего они сравниваются с нормальным распределением, или распределением Пуассона) и эмпирическими данными.
Объяснять здесь сущность этих понятий мы не сможем за недостатком места. Это слишком отвлекло бы нас от основного изложения. Но тому, кто будет пользоваться методикой дистрибу- тивно-статистического анализа, необходимо проработать не толь- ко работы самого Шайкевича, но и какой-либо из современных учебников по статистике.
Здесь мы ограничимся конкретным примером, иллюстри- рующим предложенную методику. Шайкевич исследовал распре- деление относительной частоты неопределенного артикля в речи персонажей У. Шекспира и показал неоднородность этого распре- деления для двух, выделившихся именно благодаря этому анали- зу, групп персонажей. У слуг, горожан и носителей комического начала (шутов, остряков, глупцов) отмечено повышение частоты неопределенного артикля. И напротив, у героев «серьезных» и вы- соко стоящих на социальной лестнице частота неопределенного артикля понижается.
64
Таким образом, метод может быть использован в стилисти- ке, но, разумеется, пригоден и для других целей. В информатике, например, его применяют для выделения ключевых слов.
Контрольные вопросы и задания
1. На чем основан дистрибутивный метод?
2. Назовите цель дистрибутивного метода.
3. Объясните различие дополнительной и контрастной ди- стрибуции. Приведите примеры.
4. Опишите процедуру дистрибутивного анализа в морфоло- гии и синтаксисе.
5. Дайте определение дистрибутивно-статистического ана- лиза.
6. Что показало исследование текстов У. Шекспира, прове- денное А.Я. Шайкевичем с применением дистрибутивно-статисти- ческого анализа?
7. Проведите дистрибутивно-статистический анализ текста, предложенного преподавателем.
8. Назовите преимущества и недостатки метода дистрибу- тивного анализа.
9. Назовите сферы эффективного применения дистрибутив- ных методов.
3.6. Субституционная методика
Как показывает само название, в основе описываемой про- цедуры анализа лежит прием субституции, или подстановки. Суб- ституционная методика разрабатывалась и в наиболее полном ви- де применялась американскими дескриптивистами. Она представ- ляла собой определенную стадию в дескриптивном описании еди- ниц языка, продолжение дистрибутивного анализа, этап, следую- щий за вычленением и идентификацией морфем, и использовалась для группировки элементов, объединения их в определенные клас- сы. Как исследовательский прием формального описания единиц языка субституция применялась на всех уровнях: фонетическом, морфологическом и синтаксическом, причем дескриптивисты при- давали большое значение этому методу.
Copyright ОАО «ЦКБ «БИБКОМ» & ООО «Aгентство Kнига-Cервис»