Файл: Способы представления информации в информационных системах.pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 25.06.2023

Просмотров: 91

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Введение

Актуальность темы объясняется разнообразием способов представления данных в современных информационных системах, которые определяют их форму и структуру. При их рассмотрении интерес представляет анализ систем управления контентом (Enterprise Content Management – ECM), назначение которых состоит в представлении и управлении корпоративными информационными ресурсами разной природы и содержания. В них используются технологии представления структурированной, частично-структурированной и неструктурированной информации на всех этапах ее жизненного цикла. Изучение особенностей архитектуры ECM-систем и особенностей ее реализации в соответствии с методиками разработки программного обеспечения (ПО) ведущих вендоров позволит оценить текущие тенденции в их проектировании и сделать соответствующие прогнозы.

Объектом исследования являются способы представления данных в информационных системах, предметом исследования – технологии ECM-систем, представляющие собой совокупность методов обработки и хранения данных.

Целью исследования является анализ функциональных возможностей ECM-систем с целью рассмотрения используемых в них способов представления данных.

Для достижения указанной цели необходимо решить следующие задачи:

  • рассмотреть типовую архитектуру и функциональные возможности ECM-систем;
  • определить особенности технологий ECM-систем, связанные с используемыми в них способами представления данных;
  • выявить различия и преимущества функционалов ECM-решений на основе анализа архитектурных решений лидеров рынка.

В исследовании применены принципы системного подходов, методы информационного менеджмента.

Информационную базу курсовой работы составляет документация ECM-решений. Были использованы аналитические информационные ресурсы сети Интернет и официальные сайты ECM-систем.

Курсовая работа состоит из введения, трех основных частей, заключения, списка использованных источников.

Во введении обосновывается актуальность темы исследования, дается характеристика степени ее разработанности, формулируется цель и соответствующие задачи, определяется объект и предмет исследования, информационная база.

В первой главе раскрывается концепция ICM-решений на основе анализа их архитектуры с целью выявления особенностей представления структурированной, частично-структурированной и неструктурированной информации с использованием данных различной формы и разной структуры. Анализируется логическая структура ICM-систем с целью выявления используемых технологий представления данных и управления ими.


Во второй главе представлены особенности данных технологий, связанные с хранением и обработкой данных при условии использовании их представления. Особое внимание уделяется получению данных на основе сканирования и распознавания информации.

В третьей главе особе внимание уделено рассмотрению структуры рынка ECM-систем и анализу функционала его лидеров. Оценены текущие тенденции и прогноз на основе аналитических исследований Gartner.

В заключении подведены итоги достижения поставленной цели исследования через решение указанных задач, обозначены выявившиеся проблемы и указаны пути их решения.

Представление информации в системах управления контентом

Способы представления данных в ECM-системах

Данные от информации отличаются формой представления и являются некоторым ее подмножеством, определяемым целями и задачами сбора и обработки информации [18].

Данные могут быть представлены в структурированной и неструктурированной форме. Структура данных определяется выбранным представлением информации и зависит от специфики предметной области. Наиболее развиты программные средства обработки структурированных данных, т. к. структуризацию можно считать первичной и наиболее трудно формализуемой и алгоритмизируемой обработкой.

При оперировании с информацией в процессах ее создания (порождения), сбора, выдачи и потребления важное значение имеет понятие документированной информации или просто документа. Процесс документирования превращает информацию в информационные ресурсы [1]. Информационная система определяется как организационно упорядоченная совокупность документов (массивов документов) и информационных технологий, в том числе и с использованием средств вычислительной техники и связи, реализующих информационные процессы.

Исторически первыми видами информационных систем являются архивы и библиотеки. Их современным аналогом являются системы управления контентом или ECM-системы.

По определению аналитической консалтинговой компании Gartner системы управления корпоративным информационными ресурсами (Enterprise Content Management – ECM) – стратегическая инфраструктура и техническая архитектура для поддержки единого жизненного цикла неструктурированной информации (контента) различных типов и форматов [6].


Основная цель ECM-системы состоит в обеспечении эффективного управления информационными активами предприятия с целью повышения производительности и обеспечения компании устойчивого конкурентного преимущества [3].

Место ECM-технологий в вертикальной сервис-ориентированной IT-инфраструктуре представлено на рисунке 1.1. доставки или распространения (Deliver) документов [41].

Рис. 1.1. ECM как прикладная область электронного бизнеса

Источник: Ulrich Kampffmeyer . ECM Enterprise Content Management. [Электронный ресурс] – Hamburg, 2016 – URL: http://www.project-consult.net/Files/ECM_White%20Paper_kff_2006.pdf . Перевод автора.

Специализированные приложения и подчиненные сервисы обеспечивают представление и работу с содержимым разных типов и форматов на протяжении всего жизненного цикла контента, а ECM-решения играют роль промежуточного программного обеспечения (middleware), реализуемым и используемым средствами интеграции корпоративных приложений (Enterprise Application Integration – EAI) [41]. В такой инфраструктуре ECM рассматривается как единое унифицированное хранилище контента, представляющее собой совокупность хранилища данных и хранилища документов [41] .

Gartner выделяет по целевому назначению ключевые компоненты ПО ECM (рис.1.2) [22] [27]:

Рис. 1.2. Логическая структура ECM

Источник: Прохоров Н. Системы управления контентом [Электронный ресурс] // Компьтер-Пресс, - №8, 2007 – URL: http://compress.ru/article.aspx?id=17795&iid=822#begin/.

  1. Управление документами (Document Management - DM).
  2. Управление записями (Records Management - RM)
  3. Управление потоками работ (Workflow) / управление бизнес-процессами (Business Process Management - BPM).
  4. Управление Web-контентом (Web Content Management - WCM).
  5. Документо-ориентированная групповая работа (GroupWare или Document-Centric Collaboration).

Базовые технологии ECM жизненного цикла контента реализуются в системах [23]:

  • ввода или захвата (Capture);
  • управления (Management);
  • хранения (Store);
  • сохранения (Preserve);

Схема построения типового ECM-решения

При реализации архитектуры и логической структуры ECM-решений нужно учитывать, что отдельные технологические модули будут общими, (рис.1.3) [6].  Развитие ECM-технологий идет по пути создания ECM-платформ и дальнейшего перехода ECM на уровень инфраструктуры. Поскольку наполнение, структура и объем корпоративного контента различаются в зависимости от масштабов и специфики организации, это вполне оправданный поход [16]. Ведь для автоматизации и управления разными видами контента могут применяться разные продукты и платформы, тем более, что ряд ECM-решений разрабатывается для решения определенных задач, имея дополнительные компоненты для бесшовной интеграции с существующими решениями ведущих мировых вендоров:


  • Oracle;
  • IBM;
  • EMC;
  • OpenText;
  • Microsoft.

Рис. 1.3. Схема построения типового ECM-решения

Источник: Ланкин В.Е., Бричеева Н.Н., Макарова И.В. Система управления сервисами и контентом / Учебное пособие на модульной основе [Электронный ресурс] – Таганрог, 2012 – URL: http://management.tti.sfedu.ru/uploads/doc/Lankin.Bricheeva.Makarova_Upravlenie_IT-servisami_i_kontentom.pdf .

Диаграмма сравнений их ECM-платформ по оценкам аналитических агентств приведена на рис.1.4 [6], [21], [1].

Сравнение проводилось по шести основным критериям:

  1. Полнота решения с точки зрения наличия совокупности компонентов Enterprise Content Management и интеграции со средства Enterprise 2.0 и др.

Рис. 1.4. Диаграмма сравнений ECM-платформ ведущих мировых вендоров

Источник: Шмаков А. Сравнение крупных поставщиков ECM решений. Новости и обзоры в мире Oracle Enterprise 2.0 – Управление контентом, порталы и бизнес-процессы. [Электронный ресурс] – URL: http://content.fm/ru/2010/11/ecm_comparison/.

  1. Единое универсальное хранилище для всех типов документов, представленных в различных форматах файлов;
  2. Управление Web-ресурсами – с точки зрения возможности автоматизация роли Web-мастера при управлении статическим и динамическим контентом.
  3. Интеграция с бизнес-приложениями (ERP, CRM, SCM и т.д.) на уровне ввода, хранения и управления данными.
  4. Управление записями (карточками документов) и обеспечение безопасности документов.
  5. Экстремальная производительность и масштабируемость при наличии средств кластеризации и отказоустойчивости [6], [21], [1].

В последнем отчете Magic Quadrant for Enterprise Content Management (рис. 1.5) [32] аналитики Gartner описали ситуацию на рынке ECM в 2014 году и сделали прогноз до 2018 года

Рис. 1.5. Волшебный квадрант Gartner, рынок ECM, 2015

Источник: Magic quadrant for enterprise информации [Электронный ресурс] // Gartner [сайт]. URL: https://www.gartner.com/doc/reprints?id=1-2QTDCHO&ct=151028&st=sg.

В 2014 году мировой рынок ECM-систем вырос на 6,2% до $5,4 млрд, что меньше прогноза Gartner [32], [28]. Рост был неравномерно распределен по регионам мира, причем в регионе Азия / Тихоокеанский регион, Большой Китай, Ближний Восток и Африка был достигнут двузначный рост, в то время как в Западной Европе наблюдались самые медленные темпы. По прогнозам последнего отчета в Западной Европе доля ECM будет расти лишь около 5% и в 2015 и 2016 годах, что связано с продолжающимися экономическими проблемами данного региона [32].


Выводы по первой главе.

Представление данных разной структуры и формы в различных ECM-системах на основе унифицированного подхода и в рамках общей архитектуры и логической структуры позволяет из использовать в нужных целях в рамках информационных систем предприятий. Многообразие видов и типов информации, а также наличия структурированной, частично-структурированной и неструктурированной информации, учитывается технологиями ввода, управлении, хранения, доставки и сохранения.

Технологии ECM-систем

ECM-технологии ввода и управления документами

В состав системы ввода документов (Capture) включены компоненты для генерации, захвата, подготовки и обработки аналоговой и электронной информации (рис.2.1) [6], [12]. Поддерживается несколько уровней и технологий от простого захвата информации до комплексной подготовки информации с использованием автоматической классификации.

Рис. 2.1. Функциональность и компоненты системы ввода документов

Источник: Ulrich Kampffmeyer . ECM Enterprise Content Management. [Электронный ресурс] – Hamburg, 2016 – URL: http://www.project-consult.net/Files/ECM_White%20Paper_kff_2006.pdf . Перевод автора.

Захват вручную может включать все формы информации от бумажных документов до электронных офисных документов, электронные письма, формы, мультимедийные объекты, цифровые аудио- и видеозаписи, микрофильмы [41].

Документы, переводимые в электронный вид, условно делят на [19]:

  • формализованные (бланки, накладные, анкеты, картотеки и т.д), для которых форма определена заранее, то есть задано расположение и размер обязательных полей;
  • неформализованные с произвольной формой (договоры, письма и т.д.);
  • специальные (карты или отпечатки пальцев).

При вводе с бумажного носителя на первом этапе документ сканируется и создается электронная копия документа (образ).

При необходимости, на втором этапе полученный образ можно перевести в текстовый документ с использованием технологий оптического распознавания символов (Optical Character Recognition - OCR) и более совершенных технологий оптического распознавания рукопечатных символов в закодированном виде, например ASCII и WP-формате (Handprint Character Recognition - HCR) [13].