ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.12.2020
Просмотров: 2346
Скачиваний: 19
В зависимости от языка описания заглавных слов, словари делятся на одноязычные и переводные. Переводные могут быть по числу языков многоязычными и двуязычными, где один из языков, как правило, является родным для пользующегося словарем.
В зависимости от принципа отбора лексики словари подразделяются на тезаурусы, охватывающие всю (или почти всю) лексику языка и частные словари, отражающие лишь некоторые тематические и стилевые пласты ( терминологические словари, региональные словари диалектные словари, словари сленга, словари языка писателей или отдельных произведений), либо особые разновидности слов (словари неологизмов, архаизмов, редких слов, сокращений, иностранных слов, собственных имен).
В зависимости от способа описания выделяются толковые словари и специальные словари. В толковых словарях приводятся различные сведения о слове (орфография, орфоэпия, грамматические характеристики, семантика, стилистическая отмеченность, этимология). К специальным словарям относятся этимологические словари, словообразовательные словари, словари словосочетаний, грамматические, орфографические, орфоэпические, синонимические, антонимические, частотные, рифм.
В качестве единиц лексикографического описания могут отбираться единицы меньше слова (корни, морфемы), слова, единицы больше слова (словосочетания, фразеологические единицы, пословицы и поговорки, цитаты).
В зависимости от расположения материала выделяют алфавитные словари, в которых слова располагаются по алфавиту, обратные словари, в которых слова располагаются по алфавиту конечных букв слова, идеографические и аналогические словари, где слова располагаются не по алфавиту, а по смысловым ассоциациям, т.е. по принципу от понятия к слову. Наиболее известным словарем последнего типа является «Тезаурус английских слов и выражений» Питера Марка Роже, созданный в 1852 г. Создание идеографических словарей – одно из новых направлений в развитии отечественной лексикографии. Основная задача таких словарей: представить лексику языка со всей возможной полнотой как иерархическую систему, отражающую языковую картину мира. Например, в трехтомном Русском семантическом словаре (2003) в одном из томов представлены только имена существительные, называющие все живое и естественные природные реалии. В другом томе содержатся имена, называющие материальные продукты деятельности человека. В третьем томе содержатся абстрактные имена существительные, которые также группируются в иерархически организованные лексико-семантические множества, подмножества и ряды.
Все словари делятся на энциклопедические и лингвистические. Энциклопедические словари описывают мир, объясняют явления, понятия, дают библиографические сноски о знаменитых (иногда и одиозных) людях, а также интересные факты про страны и города, рассказывают о выдающихся событиях и т.д. Наиболее авторитетными энциклопедиями для говорящих на англ. являются «The Encyclopedia Britannica» (32 тома), «The Encyclopedia Americana» (в 30 томах), на рус. – «Большая Советская энциклопедия» (30 томов).
А лингвистические словари – это словари слов. В отличие от энциклопедических, описываются сами слова, а не предметы и понятия, т.е. приводятся значения слов, их граммат., орфограф., орфоэпич. характеристики, принадлежность тому или иному стилю и т.п., т.е. в них слова рассматриваются как единицы языка.
Типология лингвистических словарей
Толковые словари – словари, в которых раскрывается (толкуется) значение слов. В слове обозначается также ударение, указываются его грамм-ие и стилис-ие св-ва. К каждому значению прилагается иллюстративный материал (примеры употребления с художественной или к-л другой литературы).
Словари неологизмов – это словари толкового типа, в которых собраны слова, которые совсем недавно появились в языке.
Словари иностранных слов – это словари, охватывающие заимствованные слова, показывают иностранную форму в оригинале и толкование слов родным языком.
Словари диалектов – словари, в которых собрана и растолкована лексика одного диалекта или нескольких диалектов. Как правило, такие словари охватывают только те слова, которых нет в литерат-ом языке или которые не имеют семант-их отличий по сравнению с такими же словами литер-ого языка.
Словари языка писателя (словарь конкордансов). В этих словарях зарегистрированы все слова, которые использовал писатель в своих произвед-ях, приводятся значения, в которых эти слова употреблялись, фиксируются все формы каждого слова, сколько раз какая форма была употреблена и где. Уже созданы словари языка Эврипида, Платона, Цицерона, Шекспира, Шелли, Пушкина, Мицкевича.
Исторические словари – представлена лексика опред-ого историч-ого периода. Самым известным в мире является словарь-гигант – Большой Оксфордский словарь (A New English Dictionary on Historical Principles) в 20 томах, где объяснены 500 тысяч слов и прилагается 1,5 млн. иллюстраций. Этот словарь писался в течение 75 лет большим количеством филологов.
Этимологические словари – словари, которые раскрывают происхождение слова, кроме этого в них указывается собств-ое или заимств-ое слово; если заимств-ое, то когда и из какого языка. Для коренных (собств-ых) слов выясняется корень, с которым связаны эти слова, прилагаются параллели из других языков, прослеживаются изменения в значении и форме слова.
Синонимические словари – словари, в которых перечислены синоним-ие ряды, которые состоят из слов или словосоч-ий тождественных или близких по значению. В пределах каждого синоним-ого ряда указывается семантическая (сноски на отличительные оттенки значения) и стилистическая характеристика слов, подчеркивается их схожесть, а также имеются примеры их употребления в контексте.
Словари антонимов – наведены и растолкованы слова с противопол-ми значениями, характеризуется их совмещаемость, указываются примеры их употребления в сплошном тексте.
Словари омонимов – слова, которые сходятся в своем звучании. В словарной статье указывают тип образования омонимов, а также грамм-ие, стилист-ие и др. признаки этих омонимов, которые подчеркивают их противопоставления.
Фразеологические словари (или словарями идиом). Это именно кладези устойчивых выражений, к которым прилагается толкование и стилист-ая характеристика.
Орфографические словари – словари, в которых слова расписаны в алфавитном порядке и в их нормативном написании.
Орфоэпические словари – словари, в которых предоставлен список слов литературного языка с обозначением нормативного ударения и со сноской на произношение. Матов в этих словарях нет!!!
Словари правильности речи – эти словари вмещают самые сложные в употреблении слова; объясняется и произношение слов, и словообразование, также прилагаются грамм-ие и стилист-ие характ-и слов, указываются примеры возможного сочетания слов и управляемости ими в повсед-ой речи.
Частотные словарики – слова расположены не по алфавиту, а по совпадению частот, т.е. в порядке от наиболее частотного в употреблении до наименее употребляемого. Для создания такого словаря необходимо обработать огромное кол-во текстов (сделать подсчеты в десятках, а то и в сотнях словоупотребления), т.к. от объема обработанного материала зависит степень объективности определения места (ранга) слова в словаре. Полезны в лингводидакт-ом аспекте д/быстрого и эффективного изучения иностр. яз-а.
Обратные словари (словари-инверсии) – слова расположены по алфавиту с его конца: а, ба, баба, жаба, раба и т.д. Такие слова групп-ются по морфемам – окончаниям, суффиксам, корнями, приставками, что полезно д/исследователей языка: из такого словаря легко выделить однокорневые (родственные слова) определить продуктивность того или иного суффикса и т.д.
Словообразовательные и морфемные словари – словари, в которых слова расчленяются на морфемы, определяется образовательная основа слова.
Идеографические словари (тезаурусы) – словари, в которых слова располагаются по группам, которые выделяются на основе общих значений, тем.
Словари ассоциативных норм – к каждому зарегистрир-ому слову прилагаются ассоциации, которые это слово вызывало у людей, которые принимали участие в психолингвистических экспериментах.
А ещё существует множество словарей сленга, жаргона, арготизмов, неологизмов. Словари диалектов и т.д.
-
Компьютерная обработка текста: описание моделей и направлений разработок.
Задача обработки литературных текстов возникла достаточно давно, однако современные информац-ые технологии открывают д/этого направления новые пути развития. Обработка литерат-ых текстов приобретает особую значимость в связи с появлением возможности обрабатывать большие объемы текстовой инф-ии за приемлемое время. Под обработкой в данном случае понимаются такие действия как разбиение исходного текста на структурные единицы (абзац, предложение, слово), выделение морфоло-их и синтакс-их признаков единиц текста, колич-ая обработка рез-ов.
На современном этапе задачи автоматизир-ой или автоматич-ой обработки текстов встают в таких прикладных задачах как автоматич-ое индексирование и реферир-ие текстов, статистич-ая обработка специальных текстов, машинный перевод и многоязыковая генерация текстов, системы извлечения текстовой инф-ии, извлечение знаний из больших массивов инф-ии, задачи интеллектуального поиска, задачи установления авторства и др.
Как и ранее, важную роль в методиках автоматич-ой и автоматизир-ой обработки текстов играют сегодня параметры, которые выделяются д/текстов. Однако, сама проблема разбора литерат-ых текстов по различным параметрам (морфол-им, синтакс-им, лекс-им) является достаточно трудоемкой. Как правило, д/решения различных прикладных задач, связанных с разбором текстов по определенным параметрам, до недавнего времени исследователи редко когда подвергали ручной обработке литературное произведение полностью, ограничиваясь лишь выборками, которые в совокупности покрывали не более 10% текста. Естественно, что рез-ты таких исследований могли содержать невольно допущенные искажения и ошибки и могли подвергаться критике. Еще одним немаловажным фактором является то, что материал, накопленный в рез-те обработки одной группой исследователей, зачастую не м.б. использован другими, тогда как подобная возможность могла бы привести к пересмотру некоторых ранее полученных рез-ов и, вероятно, появлению новых интересных д/научного сообщества фактов. Эти и ряд других сложностей в ручной обработке текстов привели к возникновению идеи о необх-ти создания единой информац-ой системы автоматизир-ого сбора, обработки и хранения инф-ии о литературных текстах.
Были сформулированы основные требования к инф-ой системе:
-
ИС должна включать в себя базу данных, содержащую литературные тексты вместе с их морфол-ми и синтакс-ми параметрами, с тем, чтобы материал, накопленный многими исследователями, был унифицирован по единому стандарту и централизованно хранился и обрабатывался.
-
ИС должна содержать модули автоматич-ого морфол-ого и синтакс-ого анализа с возможностью последующей корректировки произведенной разметки специалистами филологами.
-
ИС должна предоставить возможность специалистам, желающим проводить текстологические исследования определенных произведений, получать доступ, в т.ч. и ч/сеть Интернет, к необходимым им данным, а также разработать эффективный инструментарий для работы с этими данными.
-
Статистика речи и автоматический анализ текста.
Назв-ие «квантитативная л-ка» достаточно условно, хотя и довольно широко исп-ется в совр-ой научной лит-ре. Оно харак-ет междисцип-ое напр-ие в прикл-ых исслед-ях, в котором в кач-ве основного инструмента изучения яз-а и речи исп-ются колич-ые или статист-ие методы анализа. Иногда квантитативная (или колич-ая) л-ка противопост-ется комбинаторной л-ке. В последней доминир-ую роль занимает «неколич-ый» матем-ий аппарат – теория множеств, матем-ая логика, теория алгоритмов и т.д.
Применение колич-ых методов при описании f-ионирования яз-а мало чем отличается от исп-ия аналогичного инструментария в ест-ых и гум-ых науках. Привлечение методов измерения и подсчета яз-ых реализаций позволяет, однако, существенно модифицировать представление о яз-ой сис-е и возможностях ее f-ионирования. В этом отношении квантит-ая л-ка оказывается важнейшим фактором, влияющим на л-ую теорию. , в сфере грамм-и теор-ая л-а, как правило, ограничивается констатацией сущ-ия в рус. яз-е системы падежей. Со структурной т.з. этого, быть может, и достаточно. Между тем за рамками обсуждения остается весьма существенная инф-ия о том, как часто исп-ются различные падежи, какова динамка исп-ия различных падежей с течением времени. Исследование такого рода позволило бы выявить тенденции развития падежной системы и на основе этого даже сформулировать гипотезы о будущем состоянии грамм-ой системы рус. яз-а.
С теор-ой т.з. исп-ие статист-их методов в языкознании позволяет дополнить структурную модель яз-а вероятностным компонентом, т.е. создать структурно-вероятностную модель, обладающую значительным объяснительным потенциалом. Эту сторону исп-ия колич-ых методов следует считать приложением статистики в языкознании. К моделям такого рода относится, , «модель жизн-ого цикла слова», предложенная А.А. Поликарповым. Проведенный им квантитат-ый анализ показал, что в достаточно значительной временной перспективе имеется явная тенденция к увеличению степени абстр-ти знач-ий у многозн-ого слова – чем позже возникает знач-ие, тем оно более абстрактно. Разраб-ая колич-ая модель позволяет делать интересные предположения об относительном «возрасте» различных ч.р., тенденций развития лексич-ой системы яз-а и т.д.
Лингв-ий мониторинг f-ионирования яз-а. Задача лингв-ого мониторинга закл-ся в выявл-ии общих особ-ей f-ионирования яз-ой системы в конкр-ом типе дискурса (научн., полит. д-е, текстах средств масс. инф-ии и т.д.). В качестве предмета лингв-ого мониторинга могут выступать такие феномены ест-ого яз-а, как типы яз-ых ошибок, сфера ин-ых заимств-ий, новые слова и знач-ия, новые (креативные, творческие – не конвенциональные) метафоры, тематическое распред-ие лексики (, лексика временных и простр-ых отнош-ий, лексика выраж-ия чувств и эмоций, спорт-ая лексика и т.д.), особ-ти исп-ия в текстах тех или иных грамм-их форм, синтакс-их констр-ий. Технология лингв-ого мониторинга основ-тся на двух важнейших предпосылках: во-первых, на регулярности и периодичности анализируемых данных, и, во-вторых – на достаточно большом объеме привлекаемого материала, на репрезент-ти выборки данных. В силу этого лингв-ий мониторинг невозможен без соотв-его комп-ого обесп-ия. Исп-ие комп-ой технологии позволяет давать оценку исследуемому феномену, выявляя его распред-ие по времени, по источ-ам, авторам и т.д.