Файл: Технологии распознавания текстов (Основные понятия и определения теории распознавания текста.).pdf

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 06.07.2023

Просмотров: 146

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Единственное обстоятельство, которое может разочаровать пользователей, состоит в том, что программа платная. Бесплатно распространяется только пробная версия на пятнадцать дней. За этот период разрешено сканирование пятидесяти страниц.

Достоинства: точное распознавание; огромное количество языков чтения; толерантность к качеству изображения-источника.

Недостаток: пробная версия на пятнадцать дней.

    1. OCR CuneiForm.

CuneiForm (англ. cuneiform, кьюниформ - клинопись), Cognitive OpenOCR - свободно распространяемая открытая система оптического распознавания текстов российской компании Cognitive Technologies.

OCR CuneiForm была разработана компанией Cognitive Technologies как коммерческий продукт в 1993 году. Система поставлялась с наиболее популярными моделями сканеров, МФУ и ПО в России и мире: Corel Draw, Hewlet-Pachard, Epson, Xerox, Samsung, Brother, Mustek, OKI, Canon, Olivetti и др.

Особенности.

CuneiForm позиционируется как система преобразования электронных копий бумажных документов и графических файлов в редактируемый вид с возможностью сохранения структуры и гарнитуры шрифтов оригинального документа в автоматическом или полуавтоматическом режиме. Система включает в себя две программы для одиночной и пакетной обработки электронных документов. Поддерживается смесь русского и английского языка. Бесплатная программа для считывания текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей рассматриваемой программы. Но как для бесплатной утилиты, функционал все-таки на высоте.

Программа может прочитать и сохранять шрифт распознаваемого текста. В базе шрифтов содержится большинство используемых печатных шрифтов. Поддерживается даже распознавание текста вышедшего из печатной машинки. Для обеспечения точности к процессу распознавания подключаются специальные словари, которые пополняют словарный запас из сканируемых документов.

Достоинства: бесплатное распространение; использование словарей для проверки правильности текста; сканирование текста с ксерокопий плохого качества.

Недостатки: относительно небольшая точность; небольшое количество поддерживаемых языков.

    1. WinScan2PDF.

Это даже не полноценная программа, а утилита. Установка не потребуется, а исполнительный файл весит всего в несколько килобайт. Процесс распознавания происходит предельно быстро, правда, полученные в его результате документы сохраняются исключительно в формате PDF.


Фактически весь процесс выполняется при нажатии трех кнопок: выбор источника, места назначения и запуска программы. Утилита предназначена для быстрой пакетной обработки множества файлов. Для удобства пользователей предусмотрен большой языковой пакет интерфейса.

Достоинства: портативность; быстрая работа; простота в использовании.

Недостатки: единственный формат файлов на выходе.

    1. SimpleOCR.

Отличная небольшая программа для распознавания текстов с изображений. Поддерживает даже чтение рукописей. Проблема в том, что русский не входит ни в языковой пакет интерфейса, ни в список поддерживаемых для распознавания языков.

Однако если необходимо отсканировать английский, датский или французский, то лучшего бесплатного варианта не найти.

В своей области программа обеспечивает точную расшифровку шрифтов, удаление шума и извлечение графических изображений. К тому же в интерфейс программы встроен текстовый редактор, практически идентичный WordPad, что значительно повышает удобство использования программы.

Достоинства: точное распознавание текста; удобный текстовый редактор; удаление шума с изображения.

Недостатки: полное отсутствие русского языка.

5. Freemore OCR.

Программа позволяет оперативно извлекать текст и графику с изображений. Софт поддерживает работу с несколькими сканерами без потери производительности. Извлеченный текст может быть сохранен в формате текстового документа или документа MS Office.

Кроме того предусмотрена функция многостраничного распознавания.

Распространяется Freemore OCR бесплатно, однако, интерфейс только на английском. Но это обстоятельство никак не влияет на удобство пользования, потому как организованы элементы управления интуитивно понятным образом.

Достоинства: бесплатное распространение; возможность работы с несколькими сканерами; достойная точность распознавания.

Недостатки: отсутствие русского языка в интерфейсе; необходимость загрузки русского языкового пакета для распознавания.

История развития программ ABBYY FineReader и OCR CuneiForm.

Наиболее распространенными программами являются: ABBYY FineReader и OCR CuneiForm.

Когда речь заходит о программах для распознавания символов, практически все русскоязычные пользователи уверенно заявляют: в этом секторе бесплатных альтернатив ABBYY FineReader нет.


Чтобы лучше понять нынешнее положение дел на рынке OCR-систем, необходимо вспомнить историю рассматриваемых программ.

Оптическое распознавание текста (англ. optical character recognition, OCR) - перевод последовательности изображений символа в последовательность кодов, использующихся для представления в текстовом редакторе. Перевод осуществляется с помощью различных алгоритмов, после преобразования изображения в набор элементарных точек.

Первые публичные версии обоих программ увидели свет в 1993 году. Именно тогда молодая компания BIT Software (будущая ABBY) выпустила систему распознавания символов FineReader 1.0, а только что созданная Cognitive Technologies выпускает шрифтонезависимую систему распознавания OCR CuneiForm и даже лицензирует её канадской Corel Corporation - для использования в пакете Corel Draw 3.0. Год спустя ABBY подписывает контракт с Recognita Corp. И начинает распространение FineReader в Европе и США, а также договаривается с компанией «Фитек» о комплектации поставляемых ею сканеров Logitech системой FineReader 2.0 Light.

Год 1996-й ознаменовался выпуском CuneiForm ’96, в которой впервые в мире применены алгоритмы адаптивного распознавания. А ABBY тем временем продала исходный код FineReader компании Samsung Electronics (корейские специалисты использовали этот код при разработке фирменного программного обеспечения для своей продукции).

Адаптивное распознавание - метод, основанный на комбинации двух алгоритмов распознавания печатных символов: шрифтового (multifont) и шрифтонезависимого (omnifont). Система генерирует внутренний шрифт для каждого вводимого документа, основываясь на хорошо пропечатанных символах, адаптируясь к конкретным входным символам.

Дальнейшее развитие обеих систем шло практически параллельно. Однако, в 2004 году Cognitive Technologies практически остановила развитие CuneiForm, тогда как ABBYY продолжает совершенствовать свой продукт по сей день.

После нескольких лет перерыва в разработке, 12 декабря 2007 года Cognitive объявила об открытии исходных кодов своей OCR-системы. Само же открытие состоялось 2 апреля 2008 года. До сего момента, впрочем, сообщество OpenSource не опубликовало ни одной новой версии CuneiForm, сосредоточившись на чистке кода ядра распознавания и подготовке его к портированию на отличные от Windows платформы. Первые версии графических интерфейсов к модифицированному ядру уже опубликованы для платформы Linux.

Распознавание текста в FineReader.

Когда речь заходит о программах для распознавания символов, практически все русскоязычные пользователи уверенно заявляют: в этом секторе бесплатных альтернатив ABBYY FineReader нет.


Для эффективной работы со сканируемыми документами нужно знать, для чего нужна ABBYY FineReader, как пользоваться основными функциями программы и правильно запускать ее. Инструмент для сканирования предельно точно распознает текст в выбранном печатном документе, не перенося постранично информацию. Кроме того, программа старается сохранить шрифты, колонтитулы и разметку текста на странице максимально близко к оригиналу.

ABBYY FineReader отличается наличием хорошего функционала, поддержкой более ста пятидесяти языков, в том числе и языков программирования и математических формул. Чтобы начать пользоваться программой, достаточно установить лицензионную версию на домашний или рабочий ПК и запустить ярлык ABBYY FineReader с рабочего стола или из меню Пуск.

Для установки программы на ПК нужно после приобретения лицензии, запустить из папки с программой или диска файл setup.exe и выбрать один из видов инсталляции. Обычный режим установит FineReader в стандартной конфигурации на компьютер. В процессе установки необходимо будет выбрать язык интерфейса, место размещения программы и другие стандартные пункты по установке.

Выбрать в меню Пуск раздел Программы и запустить ABBYY FineReader.

Если вы пользуетесь приложениями Microsoft Office, то достаточно нажать на инструментальной панели значок программы.

Выберите в проводнике нужный документ и нажав правой кнопкой мыши, выберите в появившемся меню «Открыть с помощью ABBYY FineReader».

Инструмент автоматически распознает языки, сложные таблицы и списки, так что практически не требуется дополнительного редактирования.

Все автоматические функции могут использоваться в ручном режиме. Для комфортной работы на панели инструментов в «Сервис» можно выбрать пункт «Настройки», чтобы отрегулировать параметры. Можно самостоятельно задать настройки вида документа, режима сканирования, распознавания и сохранения файла.

Для качественной конвертации документов в программе предусмотрены встроенные стандартные задачи, используя которые можно перевести документ в нужный формат. Стандартные настройки предлагают перевести текстовый файл в документ Word, создать таблицу Exel, конвертировать в PDF-файл и другие нужные форматы. После выбора действия нужно будет указать язык распознавания, режим распознавания (цветной или черно-белый) и задать дополнительные пункты распознавания.

Для качественной конвертации полученной информации в PDF-формат, программа должна ее распознать. В ABBYY FineReader можно установить режим автоматического распознавания текста или ручного. Качество отсканированного документа можно отрегулировать настройками распознавания, такими как: режим сканирования, язык распознавания, тип печати и многое другое. Перед распознаванием текста, на этапе сканирования программа будет работать по одному из стандартных сценариев, который можно выбрать.


В меню выберите «Сервис», перейдите в «Опции» и укажите режим распознавания: тщательное или быстрое распознавание. Тщательный режим будет удобен для работы с некачественными текстовыми файлами, текстами на цветном фоне или сложными таблицами. Быстрое распознавание рекомендовано для больших объемов файлов или когда ограничены временные рамки.

Чтобы не возникало сложностей при редактировании в ABBYY FineReader 12, разработчики создали интуитивно понятный интерфейс и удобную навигацию по пунктам. Отредактировать текст можно двумя способами: непосредственно в окне «Текст», либо выбрав на панели инструментов «Сервис» и далее «Проверка». Доступные средства для изменения текста находятся над окном «Текст» и включают в себя стандартный набор для редактирования шрифта, его размера, отступов и замены символов. Для редактирования непосредственно PDF-изображения, нужно зайти в меню в «Редактор изображений» и выбрать из списка нужную функцию.

Автоматический перевод текста.

Программы автоматического перевода позволяют переводить отдельные слова и строить смысловые связи в предложениях, не всегда учитывая те или иные особенности языка. Поэтому они предназначены лишь для общего ознакомления с содержанием документа.

Программные средства автоматического перевода можно условно разделить на две основные категории:

  • Компьютерные словари. Назначение их - предоставить значения неизвестных слов быстро и удобно для пользователя.
  • Системы автоматического перевода - позволяют выполнять автоматический перевод связного текста. В ходе работы программа использует словари и наборы грамматических правил, обеспечивающих наилучшее качество перевода

Заключение.

Таким образом, в настоящие время, в связи с распространением информационных технологий, большинство документов составляется на компьютерах. Нередко возникает потребность перевода текста, документа в электронный формат. С помощью сканера достаточно просто получить изображение страницы текста в графическом файле. Однако работать с таким текстом невозможно: как любое сканированное изображение, страница с текстом представляет собой графический файл - обычную картинку. Текст можно будет читать и распечатывать, но нельзя его редактировать и форматировать. Для получения документа в формате текстового файла необходимо провести распознавание текста, то есть преобразовать элементы графического изображения в последовательности текстовых символов.