Файл: 1. Теоретическая часть Принципы автоматизации документационного обеспечения 6.docx
Добавлен: 06.12.2023
Просмотров: 43
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Электронное управления документами – обеспечивают процесс создания, управления доступом и распространения больших объёмов документов в компьютерных сетях, а также обеспечивают контроль над потоками документов в организации. Эти документы хранятся в специальных хранилищах или файловой системе. Типы файлов, которые, как правило, поддерживают ЭУД, включают в себе текстовые документы, электронные таблицы, видео – аудиоданные, графические объекты и документыWeb.
Электронные управления документами включают:
1)системы электронного документирования (делопроизводство);
2) системы электронного документооборота;
3) корпоративные системы электронного управления документами.
Многие поставщики и аналитические компании предлагают собственные системы классификации. Если положить в основу классификации роль документа в системе, то можно выделить два класса систем. К первой их них причислим так называемые корпоративные системы управления документами (EnterpriseDocumentManagementSystem - EDMS), ко второму - специализированные системы управления документами, ориентированные в основном на автоматизацию делопроизводственных процедур. Необходимо с документами выполнять некоторые действия: принимать и отправлять, регистрировать, передавать по назначению, контролировать ход исполнения, накладывать резолюцию.
Специализированные системы как раз предназначены для решения таких задач, например, для автоматизации делопроизводственной деятельности предприятия.
Корпоративные системы управления документами – это платформа для создания различных решений, ориентированных на обработку документов. Специализированные решения, в свою очередь, ориентированы на решение конкретных задач, таких как автоматизация делопроизводства, и внедряются на ограниченном числе рабочих мести. При этом специализированные системы не предназначены для решения задач, связанных с содержательной частью документа.
-
Этап работы в системе электронного документооборота (СЭД)
Существующие этапы внедрения электронного документооборота, с помощью возможностей распознавания компьютер сможет «прочесть» отсканированный текст. Потом воссоздать первоначальный вид страницы со всеми имеющими графическими элементами в электронном виде. Использование распознавания текста после сканирования печатного издания позволяет не только обеспечить доступ к нему широкого круга лиц
, но и сохранить редкий экземпляр документа. Материалы, хранящиеся в архивах, фондах, библиотеках могут быть активно использованы за счет электронных дубликатов. Такая возможность может быть полезна для: сохранения уже имеющейся на бумажном носителе информации в электронном виде; быстрый поиск информации; удобства пользования информацией, предоставленной в электронном виде для большого количества одновременно работающих пользователей.
Распознавание текста позволяет увеличить удобство работы с информацией за счет преобразования данных на отсканированном изображении в удобные форматы текстовых редакторов (doc, pdf). Таким образом, появляется возможность модифицировать полученный текст, использовать его в своих документах. Печать, а также осуществлять контекстный поиск.
Работы по распознаванию отсканированного текста можно подразделить на несколько этапов:
Распознавание структуры документа. С помощью специального программного обеспечения производится распознавания структуры документа. Стоит отметить, что современное ПО имеет режим автоматического определения типа, размера и структуры фрагментов изображения (текс, таблица, рисунок).
Распознавание текста. Особенно важно правильно установить параметры программы, чтобы минимизировать ошибки распознавания. Количество ошибок распознавания зависит от таких параметров, как полиграфическое качество документа, размер и контрастность текста, сложность взаимного размещения элементов документа.
Правильность распознавания. С помощью встроенных средств производится визуальная проверка распознанных символов. Проверка орфографических ошибок проходит в два этапа, как правило, не удается от всех ошибок, поэтому необходимо также проводить проверку орфографии, например, встроенными средствами MicrosoftWord.
Оформление и форматирование результирующего документа на этом этапе формируется документ. Устанавливаются единообразные значения параметров шрифта и абзацев. Производится размещение и формирование таблиц. Осуществляется ручной ввод текста, формул, таблиц, автоматизированное схожесть результатов с исходником, включая параметры шрифтов и верстку документа.
Название программы для распознавания текста называется – OpticalCharacterRecognition.
Основное назначение OCR – систем состоит в анализе отсканированного знака и присвоении фрагменту изображения соответствующего символа. Большинство программ оптического распознавания текста работают с изображением, которое получено через факс – модем, сканер или другое внешнее устройство, например, фотоаппарат. Сначала OCR должен разбить страницу на блоки текста, основываясь на особенностях правового и левого выравнивания и наличия нескольких колонок. Затем распознанный блок разбивается на строки, которые делятся на непрерывные области изображения, соответствующего отдельными буквам.
Алгоритм распознавания делает предположения относительно совпадения этих областей с символами, а затем происходит выбор каждого символа, в результате чего страница восстанавливается в символах текста, причем, как правило, в соответствующем формате. OCR – системы могут достигать наилучшей точности распознавания свыше 99,9% для чистых изображений, составленных из обычных шрифтов. На первый взгляд такая точность распознавания кажется идеальной, но уровень ошибок все же удручает, потому если имеется приблизительно 1500 символов на странице, то даже при коэффициенте успешного распознавания 99,9 % получается одна или две ошибки на странице. В таких случаях на помощь приходит метод проверки по словарю. То есть, если какого – то слова нет в словаре системы, то она по специальным правилам пытается найти похожее. Но это все равно не позволяет исправить 100 % ошибок, что требует человеческого контроля результатов.
Ускорить проверку результата и сделать ее более надежной пользователю поможет встроенная программа проверки орфографии.
После завершения процесса распознавания OCR – системы сохраняют формат исходных документов, присваивают в нужном месте атрибуты абзаца, сохраняют таблицы, графику и т.д. Современные программы распознавания поддерживают все известные текстовые и графические форматы и форматы электронных таблиц, а некоторые поддерживают такие форматы, как HTMLи PDF.
Современную OCR – систему отличают:
- отличное качество распознавания и точное сохранение оформления;
- документ анализируется и обрабатывается целиком, что позволяет понять такие элементы его внутренней структуры, как верхние и нижние колонтитулы, сноски, подписи к картинкам и диаграмма, стили, шрифты и т.д.;
- распознавание многоязычных документов (система может работать с документами на 184 языках);
- распознавание цифровых фотографий документов (сейчас для распознавания необязательно оснащать компьютер сканером.). Система распознавания позволяет распознать фотографии документов, сделанные цифровой камерой. Рекомендуется использовать цифровой фотоаппарат с размещением матрицы 4 Микст и выше.
- распознавание гиперссылок (OCR- система находит в тексте на веб – сайты, адреса электронной почты, файлы и воспроизводит их в выходных документах;
- сохранение результатов (программа легко и быстро экспортирует результаты распознавания в популярные офисные приложения. СрединихMicrosoft Word, Microsoft Excel, Microsoft PowerPoint, Lotus Word Pro, Corel WordPerfect, ОpenOffice);
- большой выбор форматов сохранения (распознанный текст можно сохранить в различных форматах: PDF, PDF/A, DOCX, XLSX, RTF, DOC, XLS, CSV, TXT, HTML, DBFи др.);
Работа с современными OCR – системами, как правило, не вызывает особых затруднений. Большинство таких систем имеют простейший автоматический режим «Сканируй и распознавай» (Scan&Read). Весь процесс переноса текста с бумаги на компьютер (от сканирования до сохранения результата) займет меньше одной минуты (время зависит от документа, возможностей используемого компьютера и сканера). И «электронный», документ будет выглядеть точно так же, как и бумажный оригинал.
Но перевод документов в электронный вид в графическом формате – это только часть процесса. Данные из электронной копии еще нужно ввести в информационную систему, а саму копию документа пока довольно трудно найти, пусть даже и в электронном архиве.
1.3 Согласование документов в СЭД
Одним из этапов жизненного цикла документа является его согласование, когда документ уходит от автора, и до вступления его в законную силу с ним знакомятся, высказывают свое мнение и спорят заинтересованные стороны.
Если рассмотреть жизненный цикл документа с учетом количества людей, работающих с ним на каждой стадии, получится следующий график. (рис. 5)
Наибольшее количество людей работают с документами на стадии согласования. Процесс согласования - одна из самых трудоемких стадий при подготовке документа.
Рисунок 5 – график жизненного цикла документа
Как правило, в ней участвует несколько служб, и работа с документом каждой из них занимает определенное время. А общее время на согласование документа может стать весьма продолжительным, учитывая, что циклов согласования иногда приходится выполнять несколько.
Задержки при передаче документа от одной службы к другой еще более затягивают процесс. А если о документе невзначай забывают в какой – ни будь службе, процесс просто встает, и требуется приложить усилия, чтобы понять, где же документ находится.
Для решения этих проблем системы электронного документооборота предлагают возможность совместной подготовки и согласования документов. Стоит отметить, что эти процессы похожи, но реализуются по- разному.
При согласовании документа, содержание его не изменяется. Участники согласования высказывают свои замечания («Согласен», «Не согласен», «Особое мнение») вне текста документа. Итогом является исходный текст документа, а также набор мнений и замечаний согласовывающих сторон. Инициатор согласования сам вносит все изменения в текст документа и, при необходимости, может оправить документ на повторное согласование.
Сложность согласования заключается в разнообразии маршрутов происхождения документов и ситуаций поведения участников этого процесса. Например, согласование может идти как независимо от порядка участников, так и в строгом с ним соответствии. Процесс согласования может как доводиться до конца вне зависимости от мнений его участников, так и приостанавливаться в случае, если кто – то выскажет свое несогласие.
При разработке маршрутов согласования документов в системе электронного документооборота CompanyMedia, используется специальный конструктор.
Так, с помощью конструктора пользователь системы может выбирать параметры согласования: параллельное, последовательное, комбинированное.
Как «работает» параллельное согласование? При работе в СЭД, реального движения документа не происходит. Он «лежит» в базе данных на сервере, поэтому эксперты, включенные в лист согласования, одновременно получают к документу и могут независимо друг от друга работать с ним. Сигналом к началу работы является получение участником согласования уведомления, которое поступает по электронной почте. Оно содержит стандартный текст, информирующий получателя о том, что он назначен участником согласований. Открыв уведомление, пользователь по ссылке может «перейти» на сам документ.
При последовательном согласовании, доступ к документу по очереди получают эксперты, включенные в список согласующих последовательное согласование при необходимости можно настроить сложным образом: указать длительность каждого согласования (и сделать их разными), «прописать», что именно делать в случае, когда срок согласования прошел, а виза не получена.
«Конструктор» предлагает такие варианты действий:
- ничего не делать;
-продолжить процесс;
-однократно уведомить инициатора о просроченном согласовании и продолжить процесс.
-приостановить согласование и наладить процесс периодического уведомления, визирующего и инициатора.
Если один из согласующих не согласен, «конструктор» предлагает такие варианты реакции:
- уведомить инициатора и продолжить процесс;
- продолжить процесс без уведомлений;
- уведомить инициатора и остановить процесс.
Когда лист согласования готов, инициатор нажимает кнопку.
Экономия времени при согласовании документа в системе достигается за счет увеличения скорости его перемещения от одного участника к другому. От инициатора согласования требуется гораздо меньше усилий и времени, чтобы контролировать данный процесс. Кроме того, эксплуатация системы позволит соблюсти жесткие сроки подготовки документов.