Файл: Функциональная технология электронного документооборота (Технологии систематизации, хранения и поиска ЭД).pdf

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 06.07.2023

Просмотров: 53

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

оперативного и потокового ввода документов, полеченных из бумажных документов путем сканирования (получение электронных графических образов) и OCR – распознавания (преобразование их в текстовые документы);

оперативного и потокового ввода электронных документов из других источников;

передачи электронных документов в подсистему «Делопроизводство»;

реквизитного и полнотекстового индексирования документов;

хранения электронных документов всех видов и представлений (в том числе графических образов), их поисковых образов и индексов (атрибутных и полнотекстовых);

адресация оригиналов документов в бумажном архиве;

поиска и извлечения документов из электронного архива;

вывода документов из системы в виде твердой (бумажной) копии или в электронном виде, в том числе для дельнейшей доставки средствами связи;

связи представлений хранимых документов с фактографической частью базы данных;

Подсистема «Ввод стандартных форм документов» обеспечивает:

проектирование представлений стандартных форм документов для их последующего ввода;

потоковый ввод стандартных форм документов в фактографическую часть подсистемы «Электронный архив» (включая сканирование, OCR (ICR) – стилизованное распознавание, контекстный контроль и экспорт в БД).

Подсистема «Делопроизводство» обеспечивает:

создание электронных документов средствами подсистемы;

ведение версий (редакций) документов и их авторства;

защиту от конфликтов при попытке одновременной модификации документа;

электронное визирование документов (электронная подпись);

связывание документов в логические группы;

организацию потока работ с документами: задание маршрута (регламентного или ситуационного) движения документов и условий осуществления работ с ними;

допуск к документам и расширенным видам работ с ними в соответствии с установленными правами пользователей;

протоколирование видов работ, производимых пользователями с документами;

управление маршрутами движения документов;

контроль местонахождения документа  и состояния его исполнения;

передачу и извлечение документов в/из подсистемы «Электронный архив».

Возможный состав программных инструментальных и технологических средств, ориентированных на управление документами и документооборотом, а также средств реализации процедур работы с документами может быть представлен следующим образом:

средства для ввода бумажных документов и распознавание образов;


средства для создания электронных документов;

средства для организации и работы с электронным архивом;

технологические средства, ориентированные на управление документооборотом;

технологические средства, ориентированные на управление документами;

инструментальные средства разработки приложений, реализующих специфические функции и технологии работы с документами.

Программные технологические пакеты, ориентированные на управление документами и документооборотом, должны быть открытыми для интеграции  с приложениями, реализующими специфические функции, характерные при работе с документами на предприятии.

        Инструментальные средства для разработки приложений должны быть такими, чтобы приложения, разработанные с их помощью, интегрировались в программную среду управления документами и документооборотом.

        Рассмотрим организационно – функциональные особенности основных подсистем, ориентируясь на решения и предложения фирмы «Интеллектуальные технологии» (Cognitive Technologies) – одного из лидеров на российском рынке по технологиям создания СУЭД и распознавания образов.

1.4 Корпоративный электронный архив

    Функциональные возможности подсистемы «Электронный архив», предлагаемой фирмой «Интеллектуальные технологии», соответствуют приведенным выше требованиям. Рассматриваемое решение выполнено в архитектуре «клиент - сервер» и ориентировано на использование оборудования, изготовленного согласно промышленным стандартам. Решение масштабируемом  и предполагает простую адаптацию к требованиям как по быстродействию, так и по количеству рабочих мест для ввода и поиска документов. Оно не накладывает никаких ограничений на формат документов, предусматривает обработку разнородных документов, хранение в одном архиве информации различного типа (например, технической документации, финансовых отчетов, документов и т.д.).

Основные преимущества предлагаемого решения заключаются в полной автоматизации следующих операций:

получение электронного образа документа (сканирование);

распознавание текста изображения документа (OCR - распознавание);

морфологического анализа (нормализация) текста документа;

полнотекстового индексирования текстовой информации в документе;

классификации, аннотирования и создания регистрационной карточки документа;


поиска и выборки электронного образа документа по значению его регистрационных атрибутов либо по текстовому содержанию.

Участие оператора требуется только на этапах формирования атрибутов и получения текста документа при использовании OCR – распознавания, если требуется редакторская правка распознанного текста. Выбор операций для конкретной реализации системы зависит от технологической цепочки при работе с разными типами документов.

Предлагаемая система предоставляет также дополнительные возможности:

разграничение доступа пользователей к документам на основе механизма привилегий;

ручное задание атрибутов документа в процессе его регистрации в системе.

В качестве программного обеспечения сервера баз данных можно использовать сервер баз данных ORACLE7  SERVER  фирмы  oracle  или другие типы развитых СУБД. Продукты этой фирмы вместе с услугами по техническому обслуживанию, обучению, консультированию и системной интеграции являются основой интегрированной, открытой, переносимой среды разработки приложений. Реализуя подход к проектированию на основе визульного моделирования объектов и  автоматизируя все этапы жизни приложения, эти средства обеспечивают высокую производительность разработчиков и создание приложений в архитектуре «клиент - сервер”».

Сервер приложений подсистемы «Электронный архив» реализует выполнение основных функций, перечисленных выше при рассмотрении требований к системе, включая разграничение доступа и защиту информации от несанкционированного доступа.На каждый документ в электронном архиве заполняется регистрационная карточка. Набор атрибутов в карточке для различных типов документов может различаться. Документ хранится в базе данных в виде совокупности своих представлений, например графического образа и текстового представления. Графический образ может быть получен в результате сканирования исходного документа в виде файла в одном из стандартных графических форматов. Текстовое представление может быть получено в результате распознавания текста отсканированного документа.

Подсистема доступа реализована в виде ПО для поиска, просмотра, выборки и печати документов из архива. Поиск можно выполнять как по тексту, имеющемуся на документе, так и по значению регистрационных атрибутов.

Выбор платформы во многом определяется требованиями к производительности системы. В настоящее время широкое применение получили многопроцессорные платформы с наращиваемой производительностью (за счет увеличения количества процессоров) с использованием операционных систем UNIX или Windows NT, которые поддерживают многопроцессорную архитектуру.


1.5 Информационно – поисковые технологии для электронного делопроизводства

Информационно – поисковые технологии представлены в рассматриваемом комплексе подсистемой поиска и воспроизведения. В системе предусмотрены развитые возможности индексирования, хранения и поиска документов, включая полнотекстовое индексирование

Индексирование документов означает:

реквизитную индексацию;

ручное управление структурами хранения документов;

настройку состава полей, типа и длины контрольных карточек документа в архиве;

автоматическую полнотекстовую индексацию документов;

автоматическое распознавание формата файла электронного документа;

индексацию текста документа сразу при его вводе;

морфологический анализ индексируемых текстов для приведения помещаемых в индекс слов к канонической форме (нормализация текста в индексе);

наличие стоп – словарей при полнотекстовой индексации и обеспечение их настройки;

выделение из текста сложных (составных) терминов и понятий;

поддержку и настройку словарей и тезауруса;

технологию реквизитной разметки документов;

настройку набора реквизитов;

возможность различных режимов реквизитной разметки документов (ручной, автоматический, полуавтоматический);

интеграцию с произвольными программами создания, просмотра и изменения электронных документов.

Хранение документов включает в себя возможность:

работы с библиотеками магнитооптических дисков, магнитных лент, компакт – дисков для хранения больших объемов информации;

управление внешними носителями;

хранение электронных документов произвольного формата, аннотированных текстов, по которым производится поиск;

хранения в системе для каждой страницы как исходного изображения, так и распознанного текста.

Поиск предусматривает:

наличие стандартного языка запросов к БД;

реквизитный поиск документов;

полнотекстовый поиск, точность поиска;

поиск по именам документов и аннотациям;

формирование сложных запросов с использованием логических операций;

контекстный поиск и меру близости слов при поиске;

адекватность результата поиска запросу;

морфологический анализ при построении запроса;


возможность работы с системой удаленных пользователей.

Поиск может быть составным и включать несколько поисковых атрибутов из перечисленных выше типов. Результатом поиска служат образ найденных документов и содержание аннотаций, построенных  в процессе индексирования или его ручного атрибутирования. Найденные образы могут быть распечатаны или переданы по корпоративной сети для просмотра с другого рабочего места.

Запрос строится путем заполнения шаблона ключевыми словами, содержание которых пользователь может задавать произвольно. Поиск документов по запросу осуществляется на двух уровнях: сначала происходит поиск в справочнике данных, а по ссылкам ищется (при задании пользователем соответствующих атрибутов) сам документ. Как правило, хранение документов осуществляется автономно из – за больших объемов архива и необходимости использования оптических накопителей информации. Такая архитектура, кроме всего, позволяет минимизировать время, затрачиваемое на физический доступ к документам в режиме множественных запросов, а также обеспечивает доступ данных из неоднородных (гетерогенных) сетей. Следует отметить, что образ документа может храниться как в текстовом, так и в графическом формате. В последнем   случае он, как правило, является результатом использования OCR – технологий.

 Заключение

Вопрос о необходимости автоматизации управления документооборотом давно перешел в практическую плоскость, и все больше российских предприятий внедряют у себя системы электронного документооборота (СЭД), позволяя организациям уже на собственном опыте оценить преимущества новой технологии работы с документами. Однако и для тех немногих, кто считает автоматизацию документооборота пройденным этапом, возможно, в скором времени потребуется переосмыслить сделанный выбор и вновь погрузиться в проблему повышения эффективности управления документооборотом. Это обусловливается, в частности, изменением рыночной ситуации, ростом организации, создающим кризисы «переходного возраста» и приводящим к необходимости реструктуризации, а также развитием информационно-коммуникационных технологий (ИКТ), с одной стороны, предоставляющих новые возможности для ведения бизнеса, с другой - заставляющих идти в ногу со временем, чтобы не отстать от конкурентов

Необходимость в автоматизации управления документооборотом разные организации сегодня видят по-разному: одни - в повышении эффективности организационно-распорядительного документооборота (ОРД), другие - в повышении эффективности работы функциональных специалистов, создающих документы и использующих их в повседневной работе, и лишь немногие уделяют внимание обоим аспектам. Такое разделение точек зрения в вопросах документооборота определяется разной ролью и значимостью самих документов в деятельности организации, что зависит от размера организации, стиля управления, отрасли производства, общего уровня технологической зрелости и многих других факторов. Поэтому для одних документ может быть базовым инструментом управления, а для других - средством и продуктом производства.