Файл: Искусственный интеллект в технологиях машинного перевода.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 08.11.2023

Просмотров: 85

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Системы выдают неплохие результаты при условии, что лексический, а главное, понятийный со- став переводимых текстов в незначительной степени отличается от того, по которому они обуча- лись. В случае значительного изменения этих параметров необходимо «доучивать» систему.

Как часто это необходимо выполнять и какова величина требуемых трудозатрат – вопрос от- крытый. Видимо, они «по силам» транснациональным IT-компаниям и крупным агрегаторам. Тем более что информационный перевод не требует точной передачи смыслового содержания текстов достаточно выстроить грамматически правильные предложения. В тех случаях, когда необходимо обеспечить точный и качественный перевод, эту задачу предполагается возложить на профессио- нальных переводчиков. Как видится заказчикам таких переводов, последним нужно только немно- го подправить результаты МП.

То, что это далеко не так, поняли разработчики сервисов постредактирования МП (РМЕТ), целью которых являлось обеспечение переводчиков удобными эргономичными инструментами для коррекции выполненного МП. Для редактирования уже выполненного перевода переводчику необходимо было обратиться к исходному тексту, понять, как был произведен перевод самого тек- ста и его синтаксических конструкций, а по сути – выполнить ручной перевод, – и только после этого произвести коррекцию МП.

Возникает вопрос, а не лучше ли обеспечить переводчику возможность самому контролиро- вать процесс перевода, т.е. наблюдать, как выполняется перевод синтаксических конструкций ис- ходного предложения, и вмешиваться только в тех случаях, когда перевод является неприемле- мым.

Такая технология диалогового МП, ориентированная на перевод научно-технических тек- стов, существует и называется интерактивный фразеологический перевод. Она предоставляет пе- реводчику возможность не только вмешиваться в процесс перевода, но и обеспечивает обучение системы для последующего перевода аналогичных по лексическому составу и понятийной струк-
туре научно-технических текстов.

В частности, на этих принципах была разработана технология перевода русскоязычного сай- та для портала федерального ведомства, с целью обеспечения его англоязычного «зеркала» [Хо- рошилов, Кан, Хорошилов, 2019]. Причем заказчик выставил жесткие требования к скорости и ка- честву перевода. Время доступа к информации, содержащейся на англоязычной странице сайта, должно было не более чем на 30% превышать время доступа к аналогичной информации русскоя- зычного сайта. За этот отрезок времени встроенный переводчик должен был разобрать русскоя- зычную страницу, выделить ее текстовую составляющую, автоматически перевести и вставить в каркас страницы. При всем этом вычислительные ресурсы, выделенные заказчиком для реализа- ции этой задачи, были весьма скромными. Требуемое качество перевода сайта обеспечивалось предварительным автоматизированным созданием словарей понятий тематической области, а так- же обеспечением возможности оперативного контроля и динамического пополнения словарей пе- реводной лексикой вновь поступающей на сайт информации [Хорошилов, Кан, Хорошилов, 2019]. И все же насколько существующие технологии МП приблизились к изначальному пред- ставлению об ИИ [Панов, Ляпунов, Мухин, 1956; Апресян, 1966; Белоногов, Калинин, Хороши- лов, 2004; Мельчук, 1999; Соссюр, 1977]. Здесь необходимо обратиться к опыту профессиональ- ных

переводчиков. Переводчик, прежде всего, должен быть грамотным лингвистом, хорошо знающим все грамматические тонкости построения как исходного, так и целевого языков, а глав- ное, понимать, какие мысленные образы заложены в исходном тексте, и как они представляются на целевом языке. Он также должен хорошо ориентироваться в понятийной системе предметной области переводимых текстов, хотя в случаях необходимости всегда можно обратиться к различ- ной справочной информации или к консультациям специалистов. Качество перевода переводчик должен уметь оценивать как с точки зрения носителя целевого языка, так и специалиста в данной

предметной области.

Всего этого лишены современные системы МП. Если на начальном этапе были попытки с помощью профессиональных лингвистов построить модели ЕЯ и на их основе реализовать МП, то с ориентацией на статистический перевод они отошли на второй план. В основу новых моделей

был заложен принцип перевода последовательностей слов исходного языка «предсказанными» по- следовательностями целевого языка, установленными на основе аналогии с ранее выполненными переводами. Другими словами – переводятся часто встречающиеся и относительно несложные синтаксические конструкции.

В современных системах МП также полностью игнорируется явление пресуппозиции. Хотя это те самые «базовые знания», которые должны «незримо» присутствовать в профессионально выполненном переводе. Нужно сказать, что апологеты NLP это понимают [Ганегедара, 2019]. Од- нако изначально положенная в основу NMT достаточно примитивная коннекционистская теория сознания не предполагает иного решения
проблемы МП.

В большей степени базовые знания учитываются в подходе FMT. Именно в его рамках пред- принимаются попытки формализации и автоматического формирования тематических баз данных, пока только в виде тематических онтологий [Хорошилов, Кан, Хорошилов, 2019]. Однако прева- лирование технологий NMT замедлило развитие других подходов в МП.


Заключение


В интервью одного из высокопоставленных отечественных чиновников было сказано:

«...Цифровизация очень скоро освободит нас от переводов. Благодаря использованию нейронно- сетевых технологий, качество переводов буквально от месяца к месяцу существенно улучшается. Функция запоминания позволяет машине выбрать из большого числа вариантов тот перевод, ко- торый наиболее близок к правильному. Сейчас это становится реальным. Естественно-научные статьи уже можно не переводить. Нажали кнопку – автомат выдает перевод...» [Блеск и нищета …, 2020]. Это высказывание как бы подтверждает факт решения всех проблем МП. Больше нет необ- ходимости что-либо делать в этой области, кроме как использовать технологии NMT, разработан- ные в западных странах.

Однако это абсолютно не соответствует реальному положению дел, особенно в области есте- ственно-научного перевода. В естественно-научных статьях формулируются новые представления о реальном мире, вводятся новые понятия, излагаются новые теории и концепции. Незначительное число таких публикаций не может обеспечить информационную базу для систем SMT и NMT, требующих миллионы (для систем SMT) и миллиарды (для систем NMT) параллельных предло- жений, или обеспечить их полноценное обучение. При этом значительная часть информации в профессиональных сообществах находится в зоне пресуппозий. Несмотря на то что в названии подхода NMT содержится термин Neural, ассоциируемый с нервной системой человека, ничего даже отдаленно связанного с моделированием мыслительной деятельности человека в области МП в этом подходе нет.

Каким будет будущее МП, если технология NMT окажется тупиковым направлением НТП? Не лучше ли именно сейчас, когда имеют место некоторые технологические прорывы в ряде вы- сокотехнологичных отраслей, начать развивать отечественные технологии МП? В России есть по- тенциал и понимание того, как можно построить оригинальные системы ИИ, а не «плестись в хво-