Добавлен: 04.12.2023
Просмотров: 287
Скачиваний: 5
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Теоретическая значимость данной работы вносит вклад в развитие теории перевода, в частности теории машинного перевода и может быть использована при подготовке и проведении специальных курсов по ТМП.
Практическая значимость данной работы заключается в том, что она может быть использована в научной работе, при анализе перевода текста разных стилей и практике их переводов с помощью МП, а также может быть использована для лекций по дисциплине «Современные технологии машинного и компьютерного перевода».
МЕТОДЫ НАУЧНОГО ИССЛЕДОВАНИЯ
В ходе исследования были использованы следующие методы: метод изучения теоретической литературы, аналитический метод, метод компонентного анализа при рассмотрении ошибок, сравнительно-сопоставительный метод, метод статистического анализа.
ПЛАН НАУЧНОГО ИССЛЕДОВАНИЯ
Данная работа состоит из введения, двух глав и заключения. Во введении раскрываются цель, задачи, актуальность, практическая и теоретическая значимость работы. В первой главе рассматриваются понятия машинного перевода, последовательность формальных операций, обеспечивающих анализ и синтез в системе машинного перевода. Вторая глава посвящена анализу проблем и трудностей, возникающих при переводе текстов разных типов (научной статьи, газетной статьи, текста инструкции, экономического и художественного текстов), с помощью МП.
В заключении обобщены результаты исследования, проведенного в данной работе, сделаны выводы и подведены итоги.
МАТЕРИАЛЫ НАУЧНОГО ИССЛЕДОВАНИЯ
Системы машинного перевода (МП) давно перестали быть диковинкой. Они постепенно выходят из «младенческого возраста» и вместо бессвязного «детского лепета» начинают изъясняться на вполне понятном, "человеческом" языке. До последнего времени такие программы были не только очень дороги, уступая в цене разве что мощным графическим и издательским системам, но и весьма сложны и капризны в работе. И вот появились первые переводчики, пригодные для использования на домашнем ПК.
В настоящий момент большое количество исследований ведется в области статистического машинного перевода и машинного перевода на базе примеров перевода. Сегодня немногие компании используют статистический машинный перевод в коммерческих целях, например, Microsoft (использует свою собственную патентованную статистическую программу МП для перевода статей базы). Возобновился интерес к гибридизации, исследователи совмещают синтаксические и морфологические (т. е. лингвистические) знания в статистических системах с уже существующими правилами.
Таким образом, в данном параграфе были рассмотрены понятия «перевода» и «машинного перевода», как деятельность, заключающаяся в передаче содержания текста на одном языке средствами другого языка, также было уточнено, что из себя представляет машинный перевод. Мы пришли к выводу, что, машинный перевод - это выполняемое на компьютере действие по преобразованию текста на одном естественном языке в эквивалентный по содержанию текст на другом языке, а также результат такого действия.
В 1990 г. Ларри Чаилдс [19, с 67-69], специалист по машинному переводу, предложил следующую классификацию систем машинного перевода:
1) FAMT (Fully-automated machine translation) - полностью автоматизированный машинный перевод;
2)HAMT (Human-assisted machine translation) - машинный перевод при участии человека;
3) MAHT (Machine-assisted human translation) - перевод, осуществляемый человеком с использованием компьютера.
Работа над программой, которая переводит с одного языка на другой, в свою очередь разбивается на три очевидные подзадачи:
1) создать достаточно полный словарь или набор тематических словарей;
2) научить систему распознавать не только слова, но и устойчивые обороты;
3) формализовать правила перевода с учетом грамматики языков.
Также, с практической точки зрения (имея в виду качество результирующего текста и его соответствие исходному), программы машинного перевода подразделяют на три категории:
1) полностью автоматический перевод;
2) автоматизированный машинный перевод при участии человека;
3) перевод, осуществляемый человеком с использованием компьютера.
Рассмотрим перечисленные категории более подробно.
Полностью автоматизированный машинный перевод подразумевается большинством людей, когда они говорят о машинном переводе. Смысл здесь прост: в компьютер вводится текст на одном языке, этот текст обрабатывается и компьютер выводит этот же текст на другом языке. К сожалению, реализация такого вида автоматического перевода сталкивается с определенными препятствиями, которые еще предстоит преодолеть.
Основной проблемой является сложность языка как такового. Возьмем, к примеру, значения слова "can". Помимо основного значения модального вспомогательного глагола, у слова "can" имеется несколько официальных и жаргонных значений в качестве существительного: "банка", "тюрьма". Кроме этого, существует архаичное значение этого слова – "знать или понимать". Если предположить, что у выходного языка для каждого из этих значений имеется отдельное слово, каким образом может компьютер их различить?
Определенные успехи были достигнуты в сфере разработки программ перевода, различающих смысл и основывающихся на контексте. Более поздние исследования при анализе текстов в большей степени опираются на теории вероятности. Тем не менее, полностью автоматизированный машинный перевод текстов с обширной тематикой все еще является невыполнимой задачей.
Автоматизированный машинный перевод при участии человека теперь вполне осуществим. Говоря о машинном переводе при участии человека, обычно подразумевают редактирование текстов как до, так и после их обработки компьютером. Люди-переводчики изменяют тексты так, чтобы они были понятны машинам. После того, как компьютер сделал перевод, люди снова редактируют грубый машинный перевод, делая текст на выходном языке правильным. Помимо такого порядка работы, существуют системы МП, во время перевода требующие постоянного присутствия человека-переводчика, помогающего компьютеру делать перевод особенно сложных или неоднозначных конструкций.
Экономичность использования машинного перевода с помощью человека – вопрос спорный. Сами программы обычно достаточно дорогостоящи, а для работы некоторых из них требуется специальное оборудование. Предварительному и последующему редактированию необходимо обучаться, да и работа эта не из приятных. Создание и поддержание в рабочем состоянии баз данных слов – процесс трудоемкий и зачастую требует специальных навыков. Однако для организации, переводящей большие объемы текстов в четко-определенной тематической сфере, машинный перевод с помощью человека может оказаться достаточно экономичной альтернативой традиционному человеческому переводу.
Для данного исследования были отобраны фрагменты текстов, принадлежащих к следующим типам: техническая инструкция, научная статья, газетная статья, экономическая статья и отрывок художественноготекста. В процессе перевода используется онлайн-сервис МП – Google Translate. Фрагменты текстов, состоящих из 10 предложений, поочередно загружаются в каждый из сервисов и переводятся с английского языка на русский. Их переводы не подвергаются постредактированию, ни содержание, ни форматирование не изменяется (например, строчная буква в начале предложения в переводе не меняется на заглавную, если сервисом онлайн- перевода была допущена такая ошибка).
Каждый из переводов анализируется на наличие орфографических, лексических, грамматических и логических ошибок, затем каждому из предложений выставляется оценка. Необходимо отметить, что для автоматической оценки качества перевода существуют различные метрики. Для нашего исследования была выбрана метрика автоматической оценки качества текста
METEOR. Она работает следующим образом: в программу загружается перевод текста и при помощи методов математической статистики программа присуждает тексту баллы: 0, если предложение было переведено плохо и не может использоваться без постредактирования, 1, если предложение переведено с некоторыми ошибками, но его смысл при этом остается понятен, и 2, если перевод предложения можно использовать без постредактирования или же в переводе имеются незначительные ошибки, не влияющие на смысл и содержание (например, та же строчная / заглавная буква, отсутствие знака препинания). Затем для каждого текста подсчитывается сумма баллов, максимальное значение которой равняется 20 (2 балла в каждом из 10 предложений). Далее прилагается статистика по обнаруженным орфографическим, лексическим, грамматическим и логическим ошибкам.
На основе этих данных делается общий вывод о применимости онлайн-сервиса Google Translate к текстам.
Рассмотрим перевод научного текста.
Первый текст для перевода является научным. Это фрагмент научной работы Э. Селлека, Р. Бута и К. Кларк (институт Астрономии университета Кембриджа) «The evolution of dust in discs influenced by external photoevaporation» [58].
Во фрагменте из 10 предложений встречаются термины, аббревиатуры, символы и числа, что говорит о большом количестве когнитивной информации. В самой работе также есть большое количество математических и физических формул, графиков и таблиц. В тексте отсутствует какая-либо эмоциональная и эстетическая информация, и главной коммуникативной задачей является передача свежих, актуальных знаний.
Текст на исходном языке | Перевод через МП |
Protoplanetary discs form and evolve in a wide variety of stellar environments and are accordingly exposed to a wide range of ambient far ultraviolet (FUV) field strengths. | Протопланетные диски формируются и эволюционируют в самых разных звездных средах и, соответственно, подвергаются воздействию широкого диапазона напряженности поля в условиях дальнего ультрафиолетового излучения (FUV). |
Переводчик сделал незначительную орфографическую ошибку: протопланетарный вместо протопланетный [45]. Чаще всего в переводе встречаются лексические ошибки. Так, термин ambient far ultraviolet (FUV) field strengths был переведен на русский язык как «напряженность поля в условиях дальнего ультрафиолетового излучения», вместо «внешние поля Дальнего Ультрафиолетового Излучения FUV)» [37].
Текст на исходном языке | Перевод через МП |
Strong FUV fields are known to drive vigorous gaseous flows from the outer disc. | Известно, что сильные поля FUV стимулируют сильные газовые потоки от внешнего диска. |
GoogleTranslate имеет сложность нахождения правильного инварианта в слове drive – стимулируют(вместо, например, приводят в движение).
Текст на исходном языке | Перевод через МП |
In this paper we conduct the first systematic exploration of the evolution of the solid component of discs subject to external photoevaporation. | В этой статье мы проводим первое систематическое исследование эволюции твердого компонента дисков, подверженных внешнему фотоиспарению. |
Данное предложение было переведено весьма внятно. Каких-либо ошибок не наблюдается.
ОФОРМЛЕНИЕ ЦИТАТ НАУЧНОГО ИССЛЕДОВАНИЯ
Слово «перевод» принадлежит к числу общеизвестных и общепонятных, но и оно, как обозначение специального вида человеческой деятельности и ее результата, требует уточнения и терминологического определения.
В своей книге Л. Л. Нелюбин [29, с. 209] писал: «Перевод как один из видов языковой деятельности представляет собой процесс адекватной и полноценной передачи мыслей, высказанных на одном языке, средствами другого языка».
Данное определение дает Л.С. Бархударов [5, с. 240], один из основоположников отечественной теории перевода: «Переводом называется процесс преобразования речевого произведения на одном языке в речевое произведение на другом языке при сохранении неизменного плана содержания, то есть значения».
Действительно, перевод - это деятельность, заключающаяся в передаче содержания текста на одном языке средствами другого языка, а также результат такой деятельности.
Перевод можно определить как передачу мыслей (чувств, эмоций), выраженных на одном языке, другим языком, или как замену текстового материала на одном языке (языке источнике - ИЯ) эквивалентным текстовым материалом на другом языке (языке перевода - ПЯ), или как процесс речевого общения, происходящей в двуязычных ситуациях, т.е. в ситуациях, когда коммуникативная деятельность осуществляется (выполняется)в кодах двух разных знаковых систем.
Следует отметить, что в настоящее время естественный язык рассматривается как какая-то знаковая система, в которой языковой знак представляет собой знак особой природы. Он отличается от других знаков тем, что производится человеком и служит средством общения, людей между собой, являясь такой языковой смысловой или смыслоразличительной единицей, которая производится в целях речеязыковой коммуникации. Совокупность языковых смысловых единиц, находящихся в определенных отношениях друг к другу, составляет систему. Язык - это упорядоченная совокупность или система языковых смысловых или смыслоразличительных единиц - суть языковых знаков.