Файл: вопросы Гак 2013 (с ответами).doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.12.2020

Просмотров: 2243

Скачиваний: 18

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Виды перевода:

По характеру переводческой деят-ти традиционно выделяют­ся устный и письменный перевод. Д/устного перевода важ­нейшим параметром является фактор линейного развертывания текста во времени (со столь релевантными последствиями, как невозможность «заглянуть вперед» или «вернуться и исправить»), что неминуемо влечет за собой снижение требований к точности и элегантности. В рамках устного перевода выделяется синхронный и последовательный перевод. При синх-ом переводе звучащий текст переводится практически одновременно с его произнесением max допустимое запаздывание порядка 10 сек.). При послед-ом переводе переводчик прослушивает довольно значительный фрагмент текста – до 15 мин., – фиксирует его в той или иной форме и переводит на соответствующий язык.

По другому основанию перевод разделяется на односторонний (унивелатеральный) и двусторонний (билатеральный). Одностор-ий перевод осуществляется только с яз-а-источника (обычно обозначаемого L1) на язык-цель (L2), в отличие от двустор-его, предполагающего перевод с L1 на L2 и наоборот. В обычном случае двустор-ий перевод является послед-ым, т.е. используется в ситуации переговоров и т.п.

Содержательная сторона перевода включает, однако, множество дру­гих параметров, по которым может проводиться классиф-ия. Так, по основанию цели выделяются и другие типы перевода:

а) «по­словный» перевод, в рез-те которого создается подстрочник,

б) бук­вальный перевод, называемый в англояз-ой традиции grammar transla­tion,

в) филологический перевод, называемый также «документальным», и

г) адаптивный (и как частный случай реферативный) перевод [ReiB 1995, S. 21-23].

Машинный перевод, выполняемое на комп-ре действие по преобраз-ию текста на одном ест-ом яз-е в эквивалентный по содержанию текст на др. яз-е, а также рез-т такого действия. Современный машинный, или автомат-ий перевод осуществляется с помощью человека: пред-редактора, который тем или иным образом предварительно обрабатывает подлежащий переводу текст, интер-редактора, который участвует в процессе перевода, или пост-редактора, который исправляет ошибки и недочеты в переведенном машиной тексте.

Для осуществления машинного перевода в компьютер вводится спец-ая программа, реализующая алгоритм перевода, под которым понимается послед-ть однозначно и строго определенных действий над текстом д/нахождения переводных соотв-ий в данной паре яз-ов L1 – L2 при заданном направлении перевода (с одного конкр-ого яз-а на др.). Система машинного перевода включает в себя двуяз-ые словари, снабженные необходимой грамм-ой инф-ей (морфол-ой, синтакс-ой и семан-ой) д/обеспечения передачи эквивал-ых, вариантных и трансформац-ых переводных соотв-ий, а также алгоритмические ср-ва грамм-ого анализа, реализующие к-л из принятых д/автомат-ой переработки текста формальных грамматик. Имеются также отдельные системы машинного перевода, рассчитанные на перевод в рамках трех и более яз-ов, но они в настоящее время являются экспериментальными.


Наиболее распр-ой является следующая послед-ть формальных операций, обеспечивающих анализ и синтез в системе машинного перевода:

1. На первом этапе осуществляется ввод текста и поиск входных словоформ (слов в конкр-ой грамм-ой форме, , дат. пад. мн. ч.) во входном словаре (словаре яз-а, с которого производится перевод) с сопутствующим морфол-им анализом, в ходе которого устан-ется принадлежность данной словоформы к опред-ой лексеме (слову как ед-це словаря). В процессе анализа из формы слова м.б. получены также сведения, относящиеся к другим уровням организации яз-ой системы.

2. Следующий этап включает в себя перевод идиоматических словосоч-ий, фразеол-их единств или штампов данной предметной области (, при англо-рус. переводе обороты типа in case of, in accordance with получают единый цифровой эквивалент и исключаются из дальнейшего грамм-ого анализа); определение основных грамм-их (морфолог-их, синтакс-их, семант-их и лексич-их) характеристик эл-ов входного текста (, числа сущ-ых, времени глагола, синтаксич-их f-ий словоформ в данном тексте и пр.), производимое в рамках входного яз-а; разрешение омографии (конверсионной омонимии словоформ – скажем, англ. round м.б. сущ-ым, прилаг-ым, нар-ем, глаг-ом или же предл-ом); лексический анализ и перевод лексем.

3. Окончательный грамм-ий анализ, в ходе которого доопределяется необходимая грамм-ая инф-ия с учетом данных выходного яз-а (, при рус. сущ-ых типа сани, ножницы глагол должен стоять в форме мн.ч., при том что в оригинале м.б. и ед.ч.).

4. Синтез выходных словоформ и предложения в целом на выходном языке.

Исследования по машинному переводу за свою 50-юю историю переживали как подъемы, так и спады. В начале 1960-х гг. завершился первоначальный эйфорический этап в развитии МП, чему в сильнейшей степени способствовала публикация т.н. «Черной книги машинного перевода» – доклада Спец-ого комитета по прикл-ой л-ке (ALPAC) Нац-ой академии наук США, в котором была констатирована невозможность создания в обозримом будущем универсальных систем высококач-ого машинного перевода. Следствием этой публикации было сокращение финансир-ия и общее снижение интереса к проблематике МП, однако полного сворачивания исследований, в особенности теор-их, не произошло.

Новый подъем исследований в области МП начался в 1970-х гг. и был связан с серьезными достижениями в области комп-ого моделирования интел-ой деят-ти. Соотв-ая область исслед-ий, возникшая несколько позже МП (датой ее рождения обычно считают 1956), получила название искус-ого интеллекта, а создание систем машинного перевода было осмыслено в 1970-е гг. как одна из частных задач этого нового исслед-ого направления.

Перспективы развития машинного перевода связаны с дальнейшей разработкой и углублением теории и практики перевода, как машинного, так и «чел-ого». Д/развития теории важны результаты сопоставит-ого языкознания, общей теории перевода, теории закономерных соотв-ий, способов представления знаний, оптимизации и совершенствования л-их алгоритмов. Новые и более эффективные словари с необходимой словарной инф-ей, строгие теории терминологизации лексики, теория и практика работы с подъяз-ми помогут повысить кач-во перевода лексич-их ед-ц. Формальные грамматики, ориентированные на перевод, дадут возможность оптимизировать алгоритмы нахождения переводных соотв-ий в данной коммуникативной ситуации, которая м.б. описана в рамках соотв-их прикл-ых теорий представления знаний. Наконец, новые возможности программир-ия и вычислит-ой техники также будут вносить свой вклад в совершенствование и дальнейшее развитие теории и практики машинного перевода.


Классификация систем АП

1. Системы МП: – программы, осущ-щие полностью автоматиз-ный пер-д. Главным критерием программы явл-ся кач-во пер-да. + д/польз-ля важными моментами явл-ся удобство интерфейса, легкость интеграции программы с другими ср-вами обработки док-тов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики с-тем МП включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным прогр-ным обеспечением и Эл-ной почтой => применение мех-мы МП для пер-да Web-страниц, e-писем и онлайновых разговорных сеансов.

2. Системы с функцией Translation Memory (TM): предоставляют ср-ва д/т.н. Machine Assisted Human Translation (MAHT) – пер-да, выполн-го ч-ком с помощью машины. 1начальное предназначение с-тем ТМ – облегчение работы переводчиков при локализации программных продуктов и создании терминол-ких БД, в дальнейшем с-мы стали развиваться как вспомог-ный инструментарий перев-ка.

3. Контролир-мый яз и МП на основе базы знаний: в с-мах на основе контролир-мого яз реализован переход от свободного входного яз-а к контролир-му входному яз-у. Контроль входного яз предусм-ет опред-ые ограничения лексики, грам-ки, сем-ки. Контролир-мый входной яз используется д/упрощения выражений исходного т-та, чтобы повысить кач-во пер-да. – с-ма KANT.

4. On-line перев-ки: службы онлайнового пер-да выполняют перевод прямо в окне браузера, не требуя установки программы на комп-р польз-ля. Достаточно большое кол-во ссылок на бесплатные сервисы МП с указаниями направлений пер-дов.

5. Словари on-line – LOGOS ONLINE DICTIONARY (англ., фр., нем., исп., ит., чеш.), TRADOS MultiTerm…


  1. Корпусная лингвистика: цели, задачи, методы.

Корп-ая л-ка – раздел комп-ой л-ки, занимающийся разработкой общих принципов построения и использования л-их корпусов с применением комп-ых технологий.

Корп-ая л-ка – деятельность, требующаяся д/составления и использования корпуса, направленная на исследование ест-ого использования яз-а.

Под л-им корпусом текста понимается репрезентативный, представленный в машиночитаемом формате, унифицированный, структурированный, размеченный массив текстов, предназначенный д/решения конкретных л-их задач. Он включает инф-ию о ситуации, в которой текст был произведен (информация о говорящем, авторе, адресате/аудитории).

Корпус – репрезентат-ое собрание текстов, обычно в читаемом машиной формате и включающее инф-ию о ситуации, в которой текст был произведен (инф-ия о говорящем, авторе, адресате или аудитории).

В понятие “корпус текста” входит корпус-менеджер – специализир-ая поисковая система, включающая специальные программные средства д/поиска данных в корпусе, получения статистич-ой инф-ии и представления пользователю рез-ов в удобной форме.

Цель – исследование естественного использования языка.

Задачи:

  • сбор текстов с определенной целью;

  • машинная обработка отобранных текстов;

  • предоставление данных д/лексикографии (помощь в создании словарей – лексикографическая поддержка);

  • составление конкордансов (список встреч-ихся в тексте словоформ, располож-ых в алф-ом порядке. В противоп-ть словарю, слово дается с его словесным окружением);

  • составление частотных словарей;

  • исследование естественного использования языка в разных регистрах;

  • предоставление данных д/лингводидактики (помощь в создании лингводидактических пособий);

  • предоставление примеров д/проверки лингвистических гипотез;

  • создание национальных корпусов.


Существует 2 типа корпусов: Нац-ый (ср-ий объем 160 млн. слов) и корпусы, предназ-ые д/опред-ых целей. Нац-ый корпус представляет данный язык на опред-ом этапе (-ах) его существования и во всем многообразии жанров, стилей, территориальных и социальных вариантов, и т.п. (ruscorpora.ru).

Первые корпусы – 1960е гг. – Брауновский, LOB, включающие произведения, изданные в 1961 г. – 500 текстов по 2000 слов.

Токены – словоформы.

Авторы корпуса: Френсис, Кучера – алфавитно-частотный словарь – поставили целью обеспечить системное изучение отдельных жанров письменного англ. яз. и сравнение жанров.

3 типа данных, которые могут дать корпусы:

  1. эмпирическая поддержка

  2. информация по частотности

  3. экстралингвистическая информация (метаинформация)

  1. Многие лингвисты используют корпус как банк примеров, т.е. пытаются найти эмпирическую поддержку д/своих гипотез, принципов и правил над которыми они работают. Свидетельства из корпусов м.б. найдены д/верификации гипотез на каждом яз-ом уровне, от яз-ов речи до целых разговоров и текстов. Внутри этой стр-ры возможно повторять анализ и воспроизводить рез-ты, что невозможно в ходе самонаблюдения.

  2. С помощью корп-ой методики легко определить частотность слов. Самые частотные и самые редкие словоформы м.б. определены как в корпусе в целом, так и в отдельном жанре.

В англ. яз. 3 наиболее частотных слов в корпусе: the, of, and.

Колич-ые исследования (которые основываются на кач-ом анализе) используются во многих сферах теор-ой л-ки и комп-ой л-ки; показывают сходства и различия м/разным группами говорящих или м/разными типами текстов, обеспечивают данные о частотности д/психолингв-их исследований.

  1. В дополнение к лингв-ому контексту корпус представляет экстрали-ую инф-ию, которая позволяет сравнивать разные типы текстов или разные группы говорящих.

Методы: К-ая л-ка сама представляет собой пучок методов из разных областей л-их исследований, поэтому ее можно применять ко многим аспектам яз-ых исследований: различие синонимов big, large, great.

Главная цель КЛ – л-ое описание яз-ой системы (подход от конкр-ого изучения коммуникации людей), особый способ отражения речевого материала в корпусе текстов, который может использоваться в свою очередь др. лингв-ми дисциплинами.

КЛ имеет 2 черты, дающие основание претендовать на положение самостоятельной дисциплины:

- Характер используемого словесного материала

- Специфика инструментария

Отступления КЛ:

- КЛ не отрицает ценности и необходимости реч-ых данных, не представленных в корпусной форме

- КЛ утверждает то, что из корпусов текстов невозможно извлечь все возможные лингв-ие выводы, т.е. корпус текстов не является самодостаточным.

Лингв-ие корпусы:

1) Brown corpus (1млн. слов)

2) LOB (London/Oslo/Bergen corpus) (1 млн. слов брит. англ., аналог Brown corpus)

3) British national corpus

4) International corpus of English (600 тыс. словоупотреблений)


5) Bank of English (585млн. словоупотреблений)

6) Co build corpus

7) Амер-ий нац-ый корпус (в своб-ом доступе 14 млн. словоупотр-ий, 15 % объема устных текстов от общего объема)

КЛ лучше всего представляется в виде пучка методов, процедур и ресурсов, имеющих дело с эмпирич-ми данными в л-ке. В кач-ве методологии, подъем современной КЛ тесно связан с историей л-ки как эмпирической науки.

В основе КЛ лежали:

1) историческая л-ка – изменения в яз-е и реконструкция (сравнительно-историч-ий метод)

2) написание грамматик, лексикография и обучение языку (Герман Пауль)

3) социолингвистика – языковое многообразие.


  1. Судебная лингвистика: цели, задачи, методы.

Суд-ая л-ка – раздел прикл-ой л-ки. Дисциплина, в которой научные знания о яз-е, накопленные в теор-ой л-ке, используются в сфере судопроизв-ва (forensic linguistic, от лат. forum – место д/дебатов в Др. Риме forencis). Термин предложен в 1968 г. брит. л-том Яном Свартвиком, который в этом же году произвел лингв-ий анализ судебных док-ов по делу Тимати Эванса (повешен за убийство жены и ребенка). Свартвик убедил суд, что Эванс невиновен и был посмертно оправдан.

Сейчас суд-ой л-кой называют все аспекты судопроизв-ва, требующие лингв-их знаний, как в сфере защиты, так и в сфере обвинения и в суд-ом разбирательстве в целом.

С 70 гг. ХХ в. стали опубликовывать статьи о суд-ой л-ке в научных журналах. В основном по установлению авторства в документах. Далее возникли др. аспекты и проблемы, связанные с крит-ой л-кой (1979 г.). В этом году опубликована книга «Language and control». Авторы поставили проблему анализа яз-а как контроля над другими. Язык стал изучаться как что-то еще д/понимания чего-то еще: что-то еще – соц-ое и эконом-ое устройство общества, организация соц-ого порядка, структура межличностных отнош-ий. Крит-ая л-ка отвергает понятие объективной действит-ти в обществе. Мысль: все что есть в обществе, могло бы быть каким-либо другим.

Тематика исследований, ведущихся в русле крит-ой л-ки разнообразна и включает в себя анализ того, каким образом язык (дискурс) способствует созданию и поддержанию соц-ых явлений (полит-ая и этическая некорректность). Этноцентризм (Россия для рус.), расизм, сексизм, угнетение, неравенство. Также в крит-ой л-ке исследуется язык, способы осуществления власти, манипуляции, пропаганды доминирования, дискриминации, соц-ого влияние, стереотипы. В рез-те такого анализа вскрывается зависимость м/соц-ой и лингв-ой стр-ми. Крит-ая л-ка доказывает, что выбор яз-ых знаков мотивируется соответствующей идеологией.

Крит-ая л-ка имеет выход и в сферу суд-ой л-ки. Он был впервые осуществлен в связи с постановкой задачи создания текстов законов понятных простым гражданам. В 1982 г. Руд Водак в Австрии организовала лингв-ую команду, которая в течение 3 лет проводила тесты на понятность текстов законов д/простых людей. На примере закона «О примен-ии техники в строительстве» она делает вывод, что понятность текстов законов – общ-политич-ая проблема. Необходимо принимать срочные меры, чтобы приблизить законы к гражданину и убрать барьеры при их чтении и непонимании.