Добавлен: 05.07.2023
Просмотров: 40
Скачиваний: 1
СОДЕРЖАНИЕ
1. СИСТЕМЫ ЭЛЕКТРОННОГО ДОКУМЕНТООБОРОТА
1.1 Документооборот в мире безбумажных технологий
1.2 Делопроизводство и документооборот в управлении предприятием
1.3 Системы управления электронным документооборотом
1.4 Корпоративный электронный архив
2. Информационно – поисковые технологии для электронного делопроизводства.
- средства для ввода бумажных документов и распознавание образов;
- средства для создания электронных документов;
- средства для организации и работы с электронным архивом;
- технологические средства, ориентированные на управление документооборотом;
- технологические средства, ориентированные на управление документами;
- инструментальные средства разработки приложений, реализующих специфические функции и технологии работы с документами.
Программные технологические пакеты, ориентированные на управление документами и документооборотом, должны быть открытыми для интеграции с приложениями, реализующими специфические функции, характерные при работе с документами на предприятии.
Инструментальные средства для разработки приложений должны быть такими, чтобы приложения, разработанные с их помощью, интегрировались в программную среду управления документами и документооборотом.
Рассмотрим организационно – функциональные особенности основных подсистем, ориентируясь на решения и предложения фирмы «Интеллектуальные технологии» (Cognitive Technologies) – одного из лидеров на российском рынке по технологиям создания СУЭД и распознавания образов.
1.4 Корпоративный электронный архив
Функциональные возможности подсистемы «Электронный архив», предлагаемой фирмой «Интеллектуальные технологии», соответствуют приведенным выше требованиям. Рассматриваемое решение выполнено в архитектуре «клиент - сервер» и ориентировано на использование оборудования, изготовленного согласно промышленным стандартам. Решение масштабируемом и предполагает простую адаптацию к требованиям как по быстродействию, так и по количеству рабочих мест для ввода и поиска документов. Оно не накладывает никаких ограничений на формат документов, предусматривает обработку разнородных документов, хранение в одном архиве информации различного типа (например, технической документации, финансовых отчетов, документов и т.д.).
Основные преимущества предлагаемого решения заключаются в полной автоматизации следующих операций:
- получение электронного образа документа (сканирование);
- распознавание текста изображения документа (OCR - распознавание);
- морфологического анализа (нормализация) текста документа;
- полнотекстового индексирования текстовой информации в документе;
- классификации, аннотирования и создания регистрационной карточки документа;
- поиска и выборки электронного образа документа по значению его регистрационных атрибутов либо по текстовому содержанию.
Участие оператора требуется только на этапах формирования атрибутов и получения текста документа при использовании OCR – распознавания, если требуется редакторская правка распознанного текста. Выбор операций для конкретной реализации системы зависит от технологической цепочки при работе с разными типами документов.
Предлагаемая система предоставляет также дополнительные возможности:
- разграничение доступа пользователей к документам на основе механизма привилегий;
- ручное задание атрибутов документа в процессе его регистрации в системе.
В качестве программного обеспечения сервера баз данных можно использовать сервер баз данных ORACLE7 SERVER фирмы oracle или другие типы развитых СУБД. Продукты этой фирмы вместе с услугами по техническому обслуживанию, обучению, консультированию и системной интеграции являются основой интегрированной, открытой, переносимой среды разработки приложений. Реализуя подход к проектированию на основе визульного моделирования объектов и автоматизируя все этапы жизни приложения, эти средства обеспечивают высокую производительность разработчиков и создание приложений в архитектуре «клиент - сервер”».
Сервер приложений подсистемы «Электронный архив» реализует выполнение основных функций, перечисленных выше при рассмотрении требований к системе, включая разграничение доступа и защиту информации от несанкционированного доступа. На каждый документ в электронном архиве заполняется регистрационная карточка. Набор атрибутов в карточке для различных типов документов может различаться. Документ хранится в базе данных в виде совокупности своих представлений, например графического образа и текстового представления. Графический образ может быть получен в результате сканирования исходного документа в виде файла в одном из стандартных графических форматов. Текстовое представление может быть получено в результате распознавания текста отсканированного документа.
Подсистема доступа реализована в виде ПО для поиска, просмотра, выборки и печати документов из архива. Поиск можно выполнять как по тексту, имеющемуся на документе, так и по значению регистрационных атрибутов.
Выбор платформы во многом определяется требованиями к производительности системы. В настоящее время широкое применение получили многопроцессорные платформы с наращиваемой производительностью (за счет увеличения количества процессоров) с использованием операционных систем UNIX или Windows NT, которые поддерживают многопроцессорную архитектуру.
2. Информационно – поисковые технологии для электронного делопроизводства.
Информационно – поисковые технологии представлены в рассматриваемом комплексе подсистемой поиска и воспроизведения. В системе предусмотрены развитые возможности индексирования, хранения и поиска документов, включая полнотекстовое индексирование
Индексирование документов означает:
- реквизитную индексацию;
- ручное управление структурами хранения документов;
- настройку состава полей, типа и длины контрольных карточек документа в архиве;
- автоматическую полнотекстовую индексацию документов;
- автоматическое распознавание формата файла электронного документа;
Хранение документов включает в себя возможность:
- работы с библиотеками магнитооптических дисков, магнитных лент, компакт – дисков для хранения больших объемов информации;
- управление внешними носителями;
- хранение электронных документов произвольного формата, аннотированных текстов, по которым производится поиск;
- хранения в системе для каждой страницы как исходного изображения, так и распознанного текста.
Поиск предусматривает:
- наличие стандартного языка запросов к БД;
- реквизитный поиск документов;
- полнотекстовый поиск, точность поиска;
- поиск по именам документов и аннотациям;
- формирование сложных запросов с использованием логических операций;
Поиск может быть составным и включать несколько поисковых атрибутов из перечисленных выше типов. Результатом поиска служат образ найденных документов и содержание аннотаций, построенных в процессе индексирования или его ручного атрибутирования. Найденные образы могут быть распечатаны или переданы по корпоративной сети для просмотра с другого рабочего места.
Заключение
Необходимость в автоматизации управления документооборотом разные организации сегодня видят по-разному: одни - в повышении эффективности организационно-распорядительного документооборота (ОРД), другие - в повышении эффективности работы функциональных специалистов, создающих документы и использующих их в повседневной работе, и лишь немногие уделяют внимание обоим аспектам.