Файл: Корпусная лингвистика вчера, сегодня, завтра. Какие перспективы есть у корпусной лингвистики.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.01.2024

Просмотров: 14

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Корпусная лингвистика: вчера, сегодня, завтра.

Какие перспективы есть у корпусной лингвистики?»

Как работал лингвист раньше? В докорпусную, докомпьютерную эпоху? Это почти синонимы. Появление корпуса, появление Интернета, появление персональных компьютеров – это почти одновременное событие.

Поскольку основной наш объект – это тексты, никаким другим образом изучать язык мы не можем. Так вот, если я намерена изучить, например, прошедшее время, я должна найти как можно больше текстов, где есть как можно больше примеров прошедшего времени, и их проанализировать. Как это делали лингвисты в докорпусную эпоху? Открывали книгу, находили, прочитывали, находили форму, выписывали ее, одну, другую, третью, сотую, на это уходило много дней, недель, месяцев. Иногда даже лет, иногда можно было услышать рассказ о таких подвижниках от науки, о человеке, который всю жизнь что-то откуда-то выписывал – и ему был почет, уважение коллег. Даже если он ничего потом с этим не сделал, он уже оставил человечеству много сотен карточек, на которых было его рукой что-то написано.

В корпусе такая задача решается за секунды, если он у нас, конечно, правильно размечен. Например, формы прошедшего времени, если придерживаться этого примера, в действительно существующих корпусах. За секунды можно найти десятки, сотни, тысячи, десятки тысяч примеров, настолько много, что даже не очень понятно исследователям становится, что же делать с таким богатством. То есть для традиционных задач лингвисты получили в свое распоряжение очень мощный современный инструмент, типа передвижения на самолете по сравнению с передвижением пешком.