Файл: Курсовая работа дисциплина Системы автоматизированного перевода.docx

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 12.01.2024

Просмотров: 201

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

МИНОБРНАУКИ РОССИИ

Федеральное государственное бюджетное

образовательное учреждение высшего образования

«Тульский государственный университет»

Институт гуманитарных и социальных наук

Кафедра лингвистики и перевода


КУРСОВАЯ РАБОТА

Дисциплина: Системы автоматизированного перевода

Направление: 45.03.02 – Лингвистика
Контроль качества текста перевода при работе в программе переводческой памяти с учетом типологии переводческих ошибок (на примере программных продуктов Wordfast Anywhere и OmegaT)

Студент группы 820301аф-ПБ ______________________ Келлер А.С.

(подпись, дата) (фамилия, инициалы)

Руководитель работы ________________ к.ф.н., доц. Евсина М.В.

(подпись, дата) (фамилия, инициалы)

Заведующий кафедрой _____________ проф., д. пед. н. Иванова В.И.

(подпись, дата) (фамилия, инициалы)


Тула 2023

Содержание

Введение 3

Глава 1. Автоматизированный перевод 5

1.1.Составляющие автоматизированного перевода 5

1.2.Типология переводческих ошибок 12

Глава 2. Возможности контроля качества текста перевода в программах переводческой памяти 19

2.1. Контроль качества текста перевода в программе OmegaT 19

2.2 Контроль качества текста перевода в программе Wordfast Anywhere 25

Вывод 29

Список использованных источников 30


Введение


Жизнь современного человека тяжело представить без технических достижений. Люди уже не видят себя без телефона в руке, навигатора в автомобиле или персонального компьютера под рукой. Говоря о переводчиках, для них вопрос современных технологий стоит еще более актуально. Тяжело представить человека, который профессионально занимается переводами, но при этом ни разу не пользовался электронными словарями, машинным переводом, программами памяти перевода или просто компьютером. Развитые современные технологии помогают переводчику экономить время, повысить качество и скорость работы.

За последние несколько лет в отрасли переводов произошли огромные изменения, связанные с развитием технологий. Внедрение компьютерных технологий стало настоящим переломом в отрасли, поскольку позволило переводчикам стать более эффективными и продуктивными. Это, в свою очередь, помогло отрасли справиться с растущим спросом и острой нехваткой квалифицированных переводчиков. Такие технологии перевода, как машинный перевод и системы перевода на основе нейронных сетей, значительно повысили точность и эффективность переводов. Кроме того, теперь предприятиям как никогда легко локализовать свой контент на несколько языков с помощью услуг, предоставляемых переводческими компаниями. Компьютерные технологии произвели революцию в переводческой отрасли и продолжают оставаться неотъемлемой частью ее успеха.


В связи с появлением крайне важных для переводчика инструменты, в том числе программ памяти перевода, возник вопрос о точности и качестве перевода, выполненного с помощью них, что также говорит об актуальности нашего исследования.

Цель данной работы состоит в определении средств контроля качества перевода в программах переводческой памяти.

Объектом исследования станут программы памяти переводов OmegaT и Wordfast Anywhere.

Предметом исследования станут функции контроля качества текста в программах OmegaT и Wordfast Anywhere.


Глава 1. Автоматизированный перевод

    1. Составляющие автоматизированного перевода


В XXI веке основополагающим фактором развития человечества в информационной области является повсеместная интеграция средств информатики не только на национальном уровне, но и в международном масштабе. Автоматизированный перевод можно рассматривать как один из способов формирования мультиязыкового пространства.

Понятие автоматизированного перевода появилось в середине XX века. Первые теоретические разработки относят к 30-40-м годам, однако практическое применение теория автоматического перевода нашла в начале 50-х годов - после появления ЭВМ.

В период холодной войны исследования в данной области представляли особый интерес в военной сфере и при достаточном финансировании усиленно развивались. Помимо составления алгоритмов, интенсивно проводились прикладные исследования в области структурной лингвистики по изучению и формализации языковых структур. По мере снятия технических трудностей с развитием кибернетики становился очевидным тот факт, что процесс перевода не сводится к формальному переходу от одного языка к другому. Разработчикам необходимо было решить ряд задач, связанных с формализацией контекста, передачей смысла всей фразы и отдельных единиц мысли с учётом факторов адекватности перевода. [Гуслякова, с. 66, 2016]

Автоматизированный перевод - программа перевода, которая включает в себя одну из двух или обе технологии: Machine Translation (машинный перевод) и Translation Memory (переводческая память). [Силонов, с. 12, 2000]

Зверева Н.С. и Терехова Е.В. сходятся во мнении, что преимущества использования автоматизированных систем перевода, по сравнению с традиционной технологией, заключаются в следующем:

1. Присутствует возможность глобального предварительного перевода всего текста (Pretranslate).

2. Присутствует возможность исключения полного повторного перевода документации, в которую внесены изменения и дополнения.



3. Использование комплексного математического механизма нечёткой логики при поиске похожих выражений и терминов позволяет находить огромное количество вариантов, к примеру, без учёта падежных окончаний.

4. Обеспечивается единообразие перевода, благодаря чему переводчик тратит меньше времени на редактирование и процесс редактирования переходит на качественно другой уровень.

5. Благодаря автоматизации монотонных операций (к примеру, автоматическое копирование перевода аналогичных фрагментов исходного текста) происходит сокращение затрат труда переводчиков, что позволяет им уделить большее внимание собственно переводу.

6. Обеспечиваются минимальные трудозатраты на выполнение работ в заданные сроки.

Однако, эти преимущества достаточно спорны: затраты времени на редактирование могут не уменьшаться, а наоборот расти. Это зависит от качества используемой переводческой памяти. Автоматизация не столько сокращает затраты труда переводчика, сколько интенсифицирует труд переводчика, трудозатраты могут и расти, здесь, скорее, оптимизируется распределение трудозатрат между исполнителями переводческих проектов. [Кутузов, с. 41, 2007]

В основе данных ТМ-программ лежит принцип сбора и хранения фрагментов переведенных текстов на двух языках (исходный фрагмент и его перевод). Эти фрагменты хранятся в специальном накопителе переводов (Translation Memory) и служат бесценным подспорьем при последующем выполнении переводов в рамках заданной тематики.

Принципиальное различие между Machine Translation и Translation Memory продуктами заключается в том, что программы машинного перевода рассчитаны, прежде всего, на любительский перевод (по признанию сотрудников ПРОМТ, 80% использования их программ приходится на людей, выполняющих не перевод, а поиск), в то время как ТМ-программы могут быть использованы только профессиональными переводчиками.

В основу перевода, выполняемого при помощи ТМ-программы, ложатся конструкции, выбранные человеком. Поэтому необходимым условием адекватности текста перевода является бесспорная компетентность специалиста-переводчика. Необходимо также учитывать, что МТ-программы опираются на изданные словари и поэтому готовы к работе в момент их приобретения. А для ТМ-программ базой данных служит накопитель, который в момент покупки программы пуст. Для того чтобы начать плодотворно использовать ТМ-программу, накопитель необходимо заполнить соответствующими речевыми моделями, при этом существует возможность обмена накопителями в рамках больших коллективных проектов что, в свою очередь, повышает качество работы специалистов и обеспечивает единство терминологии. [Кутузов, с. 95, 2007]


Компьютерные программы могут по-разному влиять на процесс перевода.

Для начала предлагаем следующие критерии различия:

  1. По степени автоматизации процесса перевода

  2. В зависимости от стадии, на которой применяются компьютерные программы

  3. По степени участия программы в переводе

  4. Сфера применения

  1. По степени автоматизации процесса перевода.

А. Шкала Хатчинсона и Соммерса.

С одной стороны, традиционный перевод (traditionalhumantranslation) - перевод человека без использования каких-либо автоматизированных вспомогательных средств.

С другой- fullyautomatichighqualitytranslation (FAHQT)- перевод, который полностью осуществляется компьютером, не требуя человеческого вмешательства, «высшее качество» является своеобразной целью, которая кажется утопией, никакого контроля и никакие поправки в окончательный перевод не вносятся.

Human-aidedmachinetranslation (HAMT) – перевод осуществляется полностью компьютерной программой, но человек редактирует конечный результат: особенности грамматики исходного и переводящего языка или реалии.

Machine-aidedhumantranslation (MAHT) - включает в себя любой процесс, который выполняется компьютером, любую степень автоматизации процесса перевода. Таким образом, MAHTвключает в себя: орфографию, проверку грамматики и стиля, словари, энциклопедии, тезаурус, и другие источники информации, к которым переводчик может обращаться, как и сам, так и с помощью программы перевода.

B. Классификация Алана Мелби (1983,1996) основана на различии между программами перевода первого и второго уровней. К первому уровню относятся программы, которые могут быть использованы с помощью переводчика при распечатке текста или отправке его по факсу. К ним относятся системы перевода с голоса на текст, электронная почта, факсимильные аппараты, программное обеспечение для подсчета слов и другие подобные технологии. Эти инструменты могут помочь сократить разрыв между переводчиками и их клиентами, предоставляя специалистам по переводу удобный способ завершить свою работу. Кроме того, эти программы могут обеспечить большую точность по сравнению с ручным переводом, поскольку они способны обнаружить и исправить любые ошибки
, которые могут возникнуть в процессе перевода. Таким образом, они являются незаменимыми инструментами для любого профессионального переводчика.Ко второму уровню относятся устройства, которые требуют исходный текст в электронном варианте. К ним относятся: программа поиска терминов, эквивалентов, проверки качества и переводческая память. Большинство из этих программ требуют наличие билингвального корпуса [Гуслякова, с. 60, 2016].

  1. Стадия, на которой применяется компьютерная программа.

Алан Мелби в 1998 году предложил классификацию систем, которые могут оказать помощь переводчику, основываясь на этапе их применения (до, во время или после перевода и необходимые на всех этапах процесса перевода).

  1. Инфраструктура (Infrastructure) - программы, которые не предназначены непосредственно для перевода, однако относятся к одними из решающих. К ним относятся:

  • Системы управления, создания документа

  • Терминологические базы данных

  • Телекоммуникации (интернет, электронная почта, передача файлов)

  1. Терминологический уровень (Term-level before translation) перед переводом — программы, способствующие выявлению необходимых в процессе перевода терминов в базе данных. Они способны обнаруживать не только слова, но и фразы. Такой отбор эффективнее, чем поиск в интернете.

  2. Терминологический уровень во время перевода (Term-level during translation) — программы, которые автоматически ищут подходящие термины и предлагают их эквиваленты на целевом языке, установленном переводчиком. Сам же переводчик не нуждается в ручном поиске терминов в базах данных.

  3. Терминологический уровень после перевода (Term-level after translation) — программы, которые проверяют согласование терминов уже в законченном переводе, а также помечают те термины, которые не рекомендуются переводчику для использования.

  4. Сегментный уровень перед переводом (Segment-level before translation) — программы, которые выравнивают сегменты переводного текста в согласовании с их порядком в исходном.

  5. Сегментный уровень во время перевода (Segment-level during translation) — включает в себя программы, которые проверяют наличие сегментов в памяти переводов.

  6. Сегментный уровень после перевода (Segment-level after translation) — программы, которые отмечают пропущенные сегменты (к примеру, если один из них не был переведен), проверяющие грамматику и напоминающие о формате исходного текста.

  7. Последовательность выполнения действий и подведение итогов (Translation workflow and billing management) — эти программы, которые не используются непосредственно в переводе, но очень важны для отслеживания проделанной работы, особенно если речь идет о больших проектах. В этом случае программы контролируют дедлайны, видоизменения текста, дату проверки и так далее.