Файл: Способы представления ДАННЫХ в информационных системах (Технологии ECM-систем).pdf
Добавлен: 30.06.2023
Просмотров: 90
Скачиваний: 2
СОДЕРЖАНИЕ
1. Представление информации в системах управления контентом
1.1 Способы представления данных в ECM-системах
1.2 Схема построения типового ECM-решения
2.1 ECM-технологии ввода и управления документами
2.2 ECM-технологии хранения , доставки и сохранения
3. Архитектуры платформ ECM-решений
3.1 Комплексная интегрированная корпоративная ECM-платформа Oracle
3.2 Независимая от инфраструктуры хранения контента ECM-платформа OpenText ECM Suite
Введение
Актуальность темы объясняется разнообразием способов представления данных в современных информационных системах, которые определяют их форму и структуру. При их рассмотрении интерес представляет анализ систем управления контентом (Enterprise Content Management – ECM), назначение которых состоит в представлении и управлении корпоративными информационными ресурсами разной природы и содержания. В них используются технологии представления структурированной, частично-структурированной и неструктурированной информации на всех этапах ее жизненного цикла. Изучение особенностей архитектуры ECM-систем и особенностей ее реализации в соответствии с методиками разработки программного обеспечения (ПО) ведущих вендоров позволит оценить текущие тенденции в их проектировании и сделать соответствующие прогнозы.
Объектом исследования являются способы представления данных в информационных системах, предметом исследования – технологии ECM-систем, представляющие собой совокупность методов обработки и хранения данных.
Целью исследования является анализ функциональных возможностей ECM-систем с целью рассмотрения используемых в них способов представления данных.
Для достижения указанной цели необходимо решить следующие задачи:
- рассмотреть типовую архитектуру и функциональные возможности ECM-систем;
- определить особенности технологий ECM-систем, связанные с используемыми в них способами представления данных;
- выявить различия и преимущества функционалов ECM-решений на основе анализа архитектурных решений лидеров рынка.
В исследовании применены принципы системного подходов, методы информационного менеджмента.
Информационную базу курсовой работы составляет документация ECM-решений. Были использованы аналитические информационные ресурсы сети Интернет и официальные сайты ECM-систем.
Курсовая работа состоит из введения, трех основных частей, заключения, списка использованных источников.
Во введении обосновывается актуальность темы исследования, дается характеристика степени ее разработанности, формулируется цель и соответствующие задачи, определяется объект и предмет исследования, информационная база.
В первой главе раскрывается концепция ICM-решений на основе анализа их архитектуры с целью выявления особенностей представления структурированной, частично-структурированной и неструктурированной информации с использованием данных различной формы и разной структуры. Анализируется логическая структура ICM-систем с целью выявления используемых технологий представления данных и управления ими.
Во второй главе представлены особенности данных технологий, связанные с хранением и обработкой данных при условии использовании их представления. Особое внимание уделяется получению данных на основе сканирования и распознавания информации.
В третьей главе особе внимание уделено рассмотрению структуры рынка ECM-систем и анализу функционала его лидеров. Оценены текущие тенденции и прогноз на основе аналитических исследований Gartner.
В заключении подведены итоги достижения поставленной цели исследования через решение указанных задач, обозначены выявившиеся проблемы и указаны пути их решения.
1. Представление информации в системах управления контентом
1.1 Способы представления данных в ECM-системах
Данные от информации отличаются формой представления и являются некоторым ее подмножеством, определяемым целями и задачами сбора и обработки информации [18].
Данные могут быть представлены в структурированной и неструктурированной форме. Структура данных определяется выбранным представлением информации и зависит от специфики предметной области. Наиболее развиты программные средства обработки структурированных данных, т. к. структуризацию можно считать первичной и наиболее трудно формализуемой и алгоритмизируемой обработкой.
При оперировании с информацией в процессах ее создания (порождения), сбора, выдачи и потребления важное значение имеет понятие документированной информации или просто документа. Процесс документирования превращает информацию в информационные ресурсы [1]. Информационная система определяется как организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе и с использованием средств вычислительной техники и связи, реализующих информационные процессы.
Исторически первыми видами информационных систем являются архивы и библиотеки. Их современным аналогом являются системы управления контентом или ECM-системы.
По определению аналитической консалтинговой компании Gartner системы управления корпоративным информационными ресурсами (Enterprise Content Management – ECM) – стратегическая инфраструктура и техническая архитектура для поддержки единого жизненного цикла неструктурированной информации (контента) различных типов и форматов [6].
Основная цель ECM-системы состоит в обеспечении эффективного управления информационными активами предприятия с целью повышения производительности и обеспечения компании устойчивого конкурентного преимущества [3].
Место ECM-технологий в вертикальной сервис-ориентированной IT-инфраструктуре представлено на рисунке 1.1. доставки или распространения (Deliver) документов [41].
Рис. 1.1. ECM как прикладная область электронного бизнеса
Источник: Ulrich Kampffmeyer . ECM Enterprise Content Management. [Электронный ресурс] – Hamburg, 2016 – URL: http://www.project-consult.net/Files/ECM_White%20Paper_kff_2006.pdf . Перевод автора.
Специализированные приложения и подчиненные сервисы обеспечивают представление и работу с содержимым разных типов и форматов на протяжении всего жизненного цикла контента, а ECM-решения играют роль промежуточного программного обеспечения (middleware), реализуемым и используемым средствами интеграции корпоративных приложений (Enterprise Application Integration – EAI) [41]. В такой инфраструктуре ECM рассматривается как единое унифицированное хранилище контента, представляющее собой совокупность хранилища данных и хранилища документов [41] .
Gartner выделяет по целевому назначению ключевые компоненты ПО ECM (рис.1.2) [22] [27]:
Рис. 1.2. Логическая структура ECM
Источник: Прохоров Н. Системы управления контентом [Электронный ресурс] // Компьтер-Пресс, - №8, 2007 – URL: http://compress.ru/article.aspx?id=17795&iid=822#begin/.
- Управление документами (Document Management - DM).
- Управление записями (Records Management - RM)
- Управление потоками работ (Workflow) / управление бизнес-процессами (Business Process Management - BPM).
- Управление Web-контентом (Web Content Management - WCM).
- Документо-ориентированная групповая работа (GroupWare или Document-Centric Collaboration).
Базовые технологии ECM жизненного цикла контента реализуются в системах [23]:
- ввода или захвата (Capture);
- управления (Management);
- хранения (Store);
- сохранения (Preserve);
1.2 Схема построения типового ECM-решения
При реализации архитектуры и логической структуры ECM-решений нужно учитывать, что отдельные технологические модули будут общими, (рис.1.3) [6]. Развитие ECM-технологий идет по пути создания ECM-платформ и дальнейшего перехода ECM на уровень инфраструктуры. Поскольку наполнение, структура и объем корпоративного контента различаются в зависимости от масштабов и специфики организации, это вполне оправданный поход [16]. Ведь для автоматизации и управления разными видами контента могут применяться разные продукты и платформы, тем более, что ряд ECM-решений разрабатывается для решения определенных задач, имея дополнительные компоненты для бесшовной интеграции с существующими решениями ведущих мировых вендоров:
- Oracle;
- IBM;
- EMC;
- OpenText;
- Microsoft.
Рис. 1.3. Схема построения типового ECM-решения
Источник: Ланкин В.Е., Бричеева Н.Н., Макарова И.В. Система управления сервисами и контентом / Учебное пособие на модульной основе [Электронный ресурс] – Таганрог, 2012 – URL: http://management.tti.sfedu.ru/uploads/doc/Lankin.Bricheeva.Makarova_Upravlenie_IT-servisami_i_kontentom.pdf .
Диаграмма сравнений их ECM-платформ по оценкам аналитических агентств приведена на рис.1.4 [6], [21], [1].
Сравнение проводилось по шести основным критериям:
- Полнота решения с точки зрения наличия совокупности компонентов Enterprise Content Management и интеграции со средства Enterprise 2.0 и др.
Рис. 1.4. Диаграмма сравнений ECM-платформ ведущих мировых вендоров
Источник: Шмаков А. Сравнение крупных поставщиков ECM решений. Новости и обзоры в мире Oracle Enterprise 2.0 – Управление контентом, порталы и бизнес-процессы. [Электронный ресурс] – URL: http://content.fm/ru/2010/11/ecm_comparison/.
- Единое универсальное хранилище для всех типов документов, представленных в различных форматах файлов;
- Управление Web-ресурсами – с точки зрения возможности автоматизация роли Web-мастера при управлении статическим и динамическим контентом.
- Интеграция с бизнес-приложениями (ERP, CRM, SCM и т.д.) на уровне ввода, хранения и управления данными.
- Управление записями (карточками документов) и обеспечение безопасности документов.
- Экстремальная производительность и масштабируемость при наличии средств кластеризации и отказоустойчивости [6], [21], [1].
В последнем отчете Magic Quadrant for Enterprise Content Management (рис. 1.5) [32] аналитики Gartner описали ситуацию на рынке ECM в 2014 году и сделали прогноз до 2019 года
Рис. 1.5. Волшебный квадрант Gartner, рынок ECM, 2015
Источник: Magic quadrant for enterprise информации [Электронный ресурс] // Gartner [сайт]. URL: https://www.gartner.com/doc/reprints?id=1-2QTDCHO&ct=151028&st=sg.
В 2014 году мировой рынок ECM-систем вырос на 6,2% до $5,4 млрд, что меньше прогноза Gartner [32], [28]. Рост был неравномерно распределен по регионам мира, причем в регионе Азия / Тихоокеанский регион, Большой Китай, Ближний Восток и Африка был достигнут двузначный рост, в то время как в Западной Европе наблюдались самые медленные темпы. По прогнозам последнего отчета в Западной Европе доля ECM будет расти лишь около 5% и в 2015 и 2016 годах, что связано с продолжающимися экономическими проблемами данного региона [32].
Выводы по первой главе.
Представление данных разной структуры и формы в различных ECM-системах на основе унифицированного подхода и в рамках общей архитектуры и логической структуры позволяет из использовать в нужных целях в рамках информационных систем предприятий. Многообразие видов и типов информации, а также наличия структурированной, частично-структурированной и неструктурированной информации, учитывается технологиями ввода, управлении, хранения, доставки и сохранения.
2. Технологии ECM-систем
2.1 ECM-технологии ввода и управления документами
В состав системы ввода документов (Capture) включены компоненты для генерации, захвата, подготовки и обработки аналоговой и электронной информации (рис.2.1) [6], [12]. Поддерживается несколько уровней и технологий от простого захвата информации до комплексной подготовки информации с использованием автоматической классификации.
Рис. 2.1. Функциональность и компоненты системы ввода документов
Источник: Ulrich Kampffmeyer . ECM Enterprise Content Management. [Электронный ресурс] – Hamburg, 2016 – URL: http://www.project-consult.net/Files/ECM_White%20Paper_kff_2006.pdf . Перевод автора.
Захват вручную может включать все формы информации от бумажных документов до электронных офисных документов, электронные письма, формы, мультимедийные объекты, цифровые аудио- и видеозаписи, микрофильмы [41].
Документы, переводимые в электронный вид, условно делят на [19]:
- формализованные (бланки, накладные, анкеты, картотеки и т.д), для которых форма определена заранее, то есть задано расположение и размер обязательных полей;
- неформализованные с произвольной формой (договоры, письма и т.д.);
- специальные (карты или отпечатки пальцев).
При вводе с бумажного носителя на первом этапе документ сканируется и создается электронная копия документа (образ).
При необходимости, на втором этапе полученный образ можно перевести в текстовый документ с использованием технологий оптического распознавания символов (Optical Character Recognition - OCR) и более совершенных технологий оптического распознавания рукопечатных символов в закодированном виде, например ASCII и WP-формате (Handprint Character Recognition - HCR) [13].
ICR (интеллектуальное распознавание символов) является дальнейшим развитием OCR и HCR и использует сравнение, логические связи, а также проверку на соответствие контрольных списков и существующих основных данных для улучшения результатов OMR (Optical Марк Recognition) [13].