Файл: Современные программы переводчики.docx

МИНОБРНАУКИ РОССИИ

ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО ОБРАЗОВАНИЯ "САРАТОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ ИМЕНИ ГАГАРИНА Ю.А." (СГТУ ИМЕНИ ГАГАРИНА Ю.А.)
ПРОФЕССИОНАЛЬНО-ПЕДАГОГИЧЕСКИЙ КОЛЛЕДЖ
09.02.07 Информационные системы и программирование

Реферат

по информатике

Тема:

"Современные программы переводчики "

Студента 1 курса

Группы ИСП-912

Ильченко Алексей Павлович

Руководитель:

Саблина Елена Анатольевна

Работа защищена с оценкой

“________________________”
____________201__г.

Саратов – 2022

СОДЕРЖАНИЕ

ВВЕДЕНИЕ 3

ГЛАВА 1. ИСТОРИЯ МАШИННОГО ПЕРЕВОДА 4

1.1 Первые шаги 1940-е 4

1.2 Медленный старт 1960-е 4

1.3 Возрождение машинного перевода 1970-80е 5

1.4 Прогресс перевода с 1990-х годов до 21 века 6

ГЛАВА 2. КЛАССИФИКАЦИЯ СИСТЕМ ПЕРЕВОДА 7

2.1 Системы машинного перевода 7

2.2 Системы перевода с функцией Translation Memory (TM) 7

ВВЕДЕНИЕ

В современном мире знание иностранных языков является, чуть ли не обязательным условием, успешной адаптации. Мы живём не в закрытом пространстве, а в мире глобальной коллаборации стран.

Многие бизнес процессы завязаны на взаимодействии представителей из разных стран. Интернет расширяет наши возможности взаимодействия, предоставляя нам шанс взаимодействовать с любыми источниками знаний во всем мире. Принято считать, что мировая история машинного перевода началась с развитием компьютеров, однако идея создания механизма, способного осуществлять перевод текста с одного языка на другой, появилась еще в первой половине XVII века.

В современном мире знание иностранных языков является практически необходимым условием успешной адаптации. Интернет расширяет наши возможности взаимодействия, предоставляя нам возможность использовать любой источник знаний по всему миру.

Перевод имеет долгую историю, восходящую ко времени, когда языки начали расходиться, и людям требовалось посредничество между различными языковыми сообществами.

Коммуникативная эквивалентность - это способность переведенного текста функционировать в качестве полноценной замены исходного текста. машинный перевод компьютерный грамматический

Коммуникативная эквивалентность нового текста по отношению к исходному тексту выглядит следующим образом:

Передача содержания оригинала в полном объеме;

Соответствие текста оригинала нормам языка перевода;

Текст перевода должен соответствовать оригиналу с точки зрения краткости и длины изложения, чтобы достичь аналогичного стилистического эффекта. Кроме того, перевод должен быть примерно сопоставимого объема. Переводы документации, инструкций, текстов книг и многое другое с различных мировых языков было бы невозможным или требовало задействовать огромное количество дорогостоящих ресурсов, если бы не современные IT разработки, а именно программы-переводчики.

ГЛАВА 1. ИСТОРИЯ МАШИННОГО ПЕРЕВОДА

1.1 Первые шаги 1940-е

История машинного перевода (МТ) как научного и прикладного направления началась в конце 1940-х годов. В марте 1947 года Уоррен Уивер впервые сформулировал концепцию машинного перевода в обмене письмами с Эндрю Бутом. У. Уивер писал: «У меня перед глазами текст, написанный по-русски, но я собираюсь сделать вид, что на самом деле он написан по-английски и закодирован при помощи довольно странных знаков. Все что мне нужно -это взломать код, чтобы извлечь информацию, заключенную в тексте».

Идеи Уивера легли в основу подхода МТ. Этап передачи информации делится на два этапа; на первом этапе исходное предложение переводится на язык-посредник, а затем с помощью языка оригинала представляется результат этого перевода.

В 1948 году А. Бут и Ричард Риченс провели несколько предварительных экспериментов. Таким образом, Риченс разработал правила разделения словоформ на основы и окончания.

В те годы они сильно отличались от сегодняшних. Это были очень большие и дорогие машины, которые занимали целые помещения и требовали большого штата инженеров, операторов и программистов для обслуживания. Эти компьютеры использовались в основном для выполнения математических расчетов для нужд военных учреждений и университетских математических и физических факультетов. Поэтому развитие МП активно поддерживалось военными на ранних стадиях, причем США делали упор на российско-английском направлении, а СССР - на англо-русском.

В 1954 году в Нью-Йорке была представлена первая система MF, IBM Mark II, разработанная совместно IBM и Джорджтаунским университетом. Была представлена программа, очень ограниченная по своим возможностям, с переводом с русского на английский язык. Казалось, что создание высококачественных систем автоматического перевода вполне достижимо в течение нескольких лет. Профессиональные переводчики всерьез опасались, что они скоро останутся без работы.

1.2 Медленный старт 1960-е

В 1959 году философ Ж. Бар-Гилель сделал заявление о том, что качественной полностью автоматической МТ в принципе невозможно достичь. Однако Bar-Hillel не отверг идею МТ как такового и увидел многообещающее направление в развитии машинных систем, ориентированных на использование переводчиками-людьми. Это выступление оказало самое неблагоприятное влияние на развитие МП в США.

В 1966 г. АЛПАК Национальной академии наук, основываясь на выводах Бар-Хиллеля, пришел к выводу, что машинный перевод нерентабелен: соотношение цена-качество МП определенно не в пользу последнего, а для перевода технических и научных текстов имелись достаточные людские ресурсы.

За докладом АЛПАК последовало сокращение финансирования правительством США исследований в области МТ, несмотря на то, что в то время в ряде военных и исследовательских организаций регулярно использовались, по крайней мере, три различные системы МТ.

В течение следующего десятилетия разработка систем МП в США осуществлялась Университетом Бригама Янга в Прово, штат Юта, и финансировалась Церковью Мормонов; в Европе - группами GENA и SUSY. Особо следует отметить работу лингвистов-представителей коренных народов в этой области, в результате которой был создан лингвистический процессор ETAP.

В 1960 году в составе НИИ математики и механики в Ленинграде была создана экспериментальная лаборатория машинного перевода, которая затем была преобразована в лабораторию математической лингвистики Ленинградского государственного университета.

1.3 Возрождение машинного перевода 1970-80е

С развитием вычислительной техники в конце 1970-х годов машинный перевод пережил "ренессанс". Это немного меняет фокус: теперь исследователи хотят разработать "реалистичные" системы МТ, которые вовлекают людей в различные этапы процесса перевода. Системы МТ превращаются из "врага" и "конкурента" профессионального переводчика в незаменимого помощника, помогающего экономить время и человеческие ресурсы.

Свидетельствами возрождения МТ в 1970-е и 1980-е годы являются следующие факты: Комиссия Европейских сообществ (КЕС) приобрела англо-французскую версию системы Systran и русско-английскую систему перевода, а также заказала разработку французско-английской и итальянско-английской версий. Проект EUROTRA, основанный на группах SUSY и GETA, был начат в то время благодаря ЦЕК. Ряд проектов, начатых в 70-80-х годах, впоследствии перерос в комплексные коммерческие системы. В 1978-93 годах США потратили 20 миллионов долларов на исследования в области МФ, Европа потратила 70 миллионов долларов, Япония - 200 миллионов долларов. Новой разработкой стала технология ТМ, работающая по принципу накопления: В процессе перевода сохраняется исходный сегмент и его перевод, создается лингвистическая база данных; когда в только что переведенном тексте встречается идентичный или похожий сегмент, он отображается вместе с переводом и указанием процентного совпадения. Затем переводчик принимает решение, результат которого хранится в системе. И в конце: "Не нужно дважды переводить одно и то же предложение!

1.4 Прогресс перевода с 1990-х годов до 21 века

1990-е годы принесли с собой быстрое развитие рынка ПК и информационных технологий, широкое использование Интернета. Все это дало возможность дальнейшего развития МП-систем. Появились новые технологии, основанные на использовании нейронных сетей, концепция связности и статистические методы.

Появилась возможность пользоваться услугами автоматических переводчиков непосредственно в сети.

С начала 1990-х годов отечественные разработчики выходят на рынок ПК-систем. В июле 1990 года на Ярмарке ПК в Москве была представлена первая в России коммерческая система машинного перевода под названием PROMT.

В 1997 году был подписан контракт с французской компанией Softissimo на создание систем перевода с французского языка на немецкий и английский и обратно, а в декабре того же года была выпущена первая в мире система франко-немецкого перевода. В том же году фирма PROMT выпустила систему, реализованную фирмой Technology Giant - для поддержки нескольких языков в одной оболочке, а также специального переводчика для Internet WebTranSite.

Онлайн перевод, поддерживаемый системой PROMT, используется на ряде отечественных и зарубежных веб-страниц: Онлайн переводчик PROMT, InfiniT.com и др.

Новые участники форума иностранных языков CompuServe часто спрашивают, может ли кто-нибудь порекомендовать хорошую программу машинного перевода по разумной цене. Ответ всегда "нет". В зависимости от ответа есть два основных аргумента: либо эти машины не могут переводить, либо этот машинный перевод слишком дорог. Оба аргумента в какой-то степени верны.

ГЛАВА 2. КЛАССИФИКАЦИЯ СИСТЕМ ПЕРЕВОДА

2.1 Системы машинного перевода

Системы машинного перевода (МП) Системы машинного перевода - программы, осуществляющие полностью автоматизированный перевод. Главным критерием программы является качество перевода. Кроме этого, для пользователя важными моментами является удобство интерфейса, лёгкость интеграции программы с другими средствами обработки документов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики систем машинного перевода включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным программным обеспечением и электронной почтой, что позволило применять механизмы МП для перевода Web-страниц, электронной корреспонденции и онлайновых разговорных сеансов.6.0.101.11 Business + Cловари 6.0.100.10 - это многоязычная программа для перевода текстовых документов с одного языка на другой. Программа поддерживает семь языков: английский, русский, украинский, немецкий, латышский, польский и французский. Pragma выполняет перевод непосредственно в окне активного приложения или в отдельном окне быстрого перевода. QDictionаry v1.6 Full Portable (134 словаря) (2010/Rus)

Главным критерием программы является качество перевода. Кроме этого, для пользователя важными моментами является удобство интерфейса, лёгкость интеграции программы с другими средствами обработки документов, выбор тематики, утилита пополнения словаря. С появлением Internet основные поставщики систем машинного перевода включили в свои продукты Web-интерфейсы, обеспечив при этом их интеграцию с остальным программным обеспечением и электронной почтой, что позволило применять механизмы МП для перевода Web-страниц, электронной корреспонденции и онлайновых разговорных сеансов.

2.2 Системы перевода с функцией Translation Memory (TM)

Память переводов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы Translation Memory также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

В каждой конкретной системе Translation Memory данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать память переводов, созданную в ТРАДОСе (Trados) и наоборот.

Большинство систем Translation Memory как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.