Файл: Учебник Рекомендовано Федеральным государственным учреждением.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 08.11.2023
Просмотров: 782
Скачиваний: 16
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
1.4.3. Системы классификации информации
Для того чтобы обеспечить эффективный поиск, обработку на
ЭВМ и передачу по каналам связи технико-экономической ин
формации, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классифика
тора.
К л а с с и ф и к а т о р — это систематизированный свод наи
менований и кодов классификационных группировок. Классифи
каторы по сфере действия разделяются на международные, обще
государственные (общесистемные), отраслевые, локальные.
Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязатель
ны для передачи информации между организациями разных стран мирового сообщества.
Общегосударственные (общесистемные) классификаторы обязательны для организации процессов передачи и обработки информации между экономическими системами государственно
го уровня внутри страны.
Отраслевые классификаторы используют для выполнения процедур обработки информации и передачи ее между организа
циями внутри отрасли.
Локальные классификаторы используют в пределах отдельных предприятий.
К л а с с и ф и к а ц и я о б ъ е к т о в — это процедура группи
ровки на качественном уровне, направленная на выделение одно
родных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
Свойства информационного объекта определяются информа
ционными параметрами — р е к в и з и т а м и , логически недели
мым информационным элементом, описывающим определенное свойство объекта, явления и т. п. Реквизиты выражаются либо числовыми данными (масса, стоимость, год), либо признаками
(цвет, марка машины, фамилия).
Классификация предусматривает следующие задачи — выяв
ление общих свойств информационного объекта; разработку правил (алгоритмов) и процедур обработки информации, пред
ставленной совокупностью реквизитов. При классификации объ
ектов необходимо соблюдать определенные требования, а именно: полноту охвата объектов, однозначность реквизитов, возможность включения новых реквизитов.
При классификации применяются понятия классификацион
ный признак и его значение, которые позволяют установить сход
43
ство или различие объектов. Признак классификации — свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами клас
сификации.
К л а с с и ф и к а ц и о н н а я г р у п п и р о в к а — это множе
ство или подмножество, объединяющее часть объектов классифи
кации по одному или нескольким признакам.
В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная. Эти системы различаются разной стратегией применения классификационных признаков.
Иерархическая система классификации информации по
строена следующим образом.
1. Исходное множество элементов составляет нулевой уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют первый уровень.
2. Каждый класс первого уровня в соответствии с характерным для него классификационным признаком делится на подклассы, которые образуют второй уровень.
3. Каждый класс второго уровня аналогично делится на группы, которые образуют третий уровень и т.д.
Достоинства иерархической системы классификации — про
стота построения; использование независимых классификацион
ных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации — жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Многоаспектная система (фасетная и дескрипторная) — это система классификации, которая использует параллельно несколь
ко независимых признаков ( а с п е к т о в ) в качестве основания классификации.
Фасетная система классификации информации представля
ет собой параллельное разделение множества объектов на неза
висимые классификационные группировки по определенному аспекту классификации — ф а с е т у . Например, классифициро
вать фильмы можно в соответствии со следующими группами — тип (документальный, игровой, анимационный); жанр (боевик, комедия, романтика, фантастика); продолжительность; год; стра
на; режиссер; другие параметры (немой, звуковой, цветной, черно
белый и т. п.). Таким образом, каждый фильм обладает множеством признаков. При поиске нужного фильма используется пересечение требуемых атрибутов.
44
сификации.
К л а с с и ф и к а ц и о н н а я г р у п п и р о в к а — это множе
ство или подмножество, объединяющее часть объектов классифи
кации по одному или нескольким признакам.
В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная. Эти системы различаются разной стратегией применения классификационных признаков.
Иерархическая система классификации информации по
строена следующим образом.
1. Исходное множество элементов составляет нулевой уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют первый уровень.
2. Каждый класс первого уровня в соответствии с характерным для него классификационным признаком делится на подклассы, которые образуют второй уровень.
3. Каждый класс второго уровня аналогично делится на группы, которые образуют третий уровень и т.д.
Достоинства иерархической системы классификации — про
стота построения; использование независимых классификацион
ных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации — жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Многоаспектная система (фасетная и дескрипторная) — это система классификации, которая использует параллельно несколь
ко независимых признаков ( а с п е к т о в ) в качестве основания классификации.
Фасетная система классификации информации представля
ет собой параллельное разделение множества объектов на неза
висимые классификационные группировки по определенному аспекту классификации — ф а с е т у . Например, классифициро
вать фильмы можно в соответствии со следующими группами — тип (документальный, игровой, анимационный); жанр (боевик, комедия, романтика, фантастика); продолжительность; год; стра
на; режиссер; другие параметры (немой, звуковой, цветной, черно
белый и т. п.). Таким образом, каждый фильм обладает множеством признаков. При поиске нужного фильма используется пересечение требуемых атрибутов.
44
Эта система классификации позволяет (в отличие от иерархи
ческой) выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемо
го объекта. При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись.
Достоинства фасетной системы классификации — возможность создания классификации большой емкости без изменения струк
туры существующих группировок; возможность простой модифи
кации всей системы классификации без изменения структуры существующих группировок.
Недостаток фасетной системы классификации — сложность ее построения, (необходимо учитывать все разнообразие классифи
кационных признаков).
Для организации поиска информации, для ведения тезаурусов
(словарей) эффективно используется дескрипторная система
классификации, язык которой приближается к естественному языку описания информационных объектов. Суть дескрипторно- го метода заключается в следующем.
1. Отбирают совокупность ключевых слов ( д е с к р и п т о р о в ) или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов, причем среди ключевых слов могут находиться синонимы.
2. Выбранные ключевые слова и словосочетания подвергают нормализации, т.е. из совокупности синонимов выбирают один или несколько наиболее употребляемых.
3. Создают словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормали
зации.
Между дескрипторами устанавливаются связи, которые по
зволяют расширить область поиска информации. Связи могут быть трех видов:
— синонимические, указывающие на некоторую совокупность ключевых слов как синонимов («студент — учащийся — обучае
мый»);
— родовидовые, отображающие включение некоторого класса объектов в более представительный класс («университет — фа
культет — кафедра»);
— ассоциативные, соединяющие дескрипторы, обладающие общими свойствами («студент — экзамен — профессор — ауди
тория»).
Наиболее сложными вопросами, которые приходится решать при разработке классификатора, являются выбор методов клас
сификации и кодирования и выбор системы признаков класси
фикации. Основой классификатора должны быть наиболее су
45
щественные признаки классификации, соответствующие харак
теру решаемых с помощью классификатора задач. При этом данные признаки могут быть или соподчиненными, или несо
подчиненными. При соподчиненных признаках классификации и стабильном комплексе задач, для решения которых предна
значен классификатор, целесообразно использовать иерархиче
ский метод классификации, который представляет собой после
довательное разделение множества объектов на подчиненные классификационные группировки. При несоподчиненных при
знаках классификации и при большой динамичности решаемых задач целесообразно использовать фасетный метод классифика
ции.
1.4.4. Экспортирование структур баз данных
При работе с информационной системой могут возникать си
туации, когда требуется производить перенос данных из одной базы данных в другую. Этот процесс называется э к с п о р т и р о
в а н и е м .
Экспортирование данных требуется при переводе БД на другой физический носитель, при создании копии БД, переносе данных между информационными системами. Задачи переноса данных между ИС возникают при пересечении предметных областей си
стем, что приводит их к согласованной работе с одними и теми же данными. Например, это могут быть системы различного уровня иерархии (информационные системы министерства и подчинен
ной организации) либо автоматизированная система бухгалтер
ского учета на предприятии и информационная система в нало
говой инспекции, куда поступает отчетность и т. п. Сложность экспортирования данных зависит от характеристик источника и получателя данных и их соответствия друг другу. Экспортирование может заключаться в простом переносе данных или в выполнении ряда преобразований переносимых данных.
Преобразование данных может быть следующих видов:
— переименование — объекты данных (таблицы, поля и т.п.) источника получают имена в соответствии с организацией данных получателя;
— реструктуризация — изменение структуры БД источника в соответствии со структурой получателя;
— агрегирование — БД получает не просто данные, а некоторый сводный или итоговый отчет;
— кодирование и декодирование — данные изменяются так, чтобы они соответствовали системе кодирования БД-получа- теля;
46
теру решаемых с помощью классификатора задач. При этом данные признаки могут быть или соподчиненными, или несо
подчиненными. При соподчиненных признаках классификации и стабильном комплексе задач, для решения которых предна
значен классификатор, целесообразно использовать иерархиче
ский метод классификации, который представляет собой после
довательное разделение множества объектов на подчиненные классификационные группировки. При несоподчиненных при
знаках классификации и при большой динамичности решаемых задач целесообразно использовать фасетный метод классифика
ции.
1.4.4. Экспортирование структур баз данных
При работе с информационной системой могут возникать си
туации, когда требуется производить перенос данных из одной базы данных в другую. Этот процесс называется э к с п о р т и р о
в а н и е м .
Экспортирование данных требуется при переводе БД на другой физический носитель, при создании копии БД, переносе данных между информационными системами. Задачи переноса данных между ИС возникают при пересечении предметных областей си
стем, что приводит их к согласованной работе с одними и теми же данными. Например, это могут быть системы различного уровня иерархии (информационные системы министерства и подчинен
ной организации) либо автоматизированная система бухгалтер
ского учета на предприятии и информационная система в нало
говой инспекции, куда поступает отчетность и т. п. Сложность экспортирования данных зависит от характеристик источника и получателя данных и их соответствия друг другу. Экспортирование может заключаться в простом переносе данных или в выполнении ряда преобразований переносимых данных.
Преобразование данных может быть следующих видов:
— переименование — объекты данных (таблицы, поля и т.п.) источника получают имена в соответствии с организацией данных получателя;
— реструктуризация — изменение структуры БД источника в соответствии со структурой получателя;
— агрегирование — БД получает не просто данные, а некоторый сводный или итоговый отчет;
— кодирование и декодирование — данные изменяются так, чтобы они соответствовали системе кодирования БД-получа- теля;
46
— конвертирование — приведение к формату атрибута в БД- получателе;
— согласование — в разных БД могут использоваться разные способы отображения одной и той же информации (например, в километрах и в метрах), необходимо обеспечить их согласова
ние;
— проверка на допустимость значений.
Таким образом, преобразование данных при экспортирова
нии — это сложная задача, требующая создания специального алгоритма запросов (сценария).
1 2 3 4 5 6 7 8 9 ... 19
1.5. Показатели эф ф ективности
инф ормационны х с и ст е м
Эффективность информационной системы — это совокупность свойств системы, обусловливающих возможность ее использова
ния для удовлетворения определенных потребностей пользовате
лей в соответствии с ее назначением.
Основными показателями эффективности информационных систем являются надежность, достоверность, безопасность.
Надежность — свойство системы сохранять во времени в установленных пределах значения всех параметров, характери
зующих способность выполнять требуемые функции в заданных условиях применения. Надежность информационных систем яв
ляется средством обеспечения актуальной и достоверной инфор
мации на выходе системы.
Достоверность — свойство системы, обусловливающее безо
шибочность производимых ею преобразований информации.
Достоверность функционирования информационной системы полностью определяется и измеряется достоверностью ее резуль
татной информации.
Безопасность информационной системы — свойство, заклю
чающееся в способности системы обеспечить конфиденциаль
ность и целостность информации, то есть защиту информации от несанкционированного доступа.
Показатели эффективности должны отражать количественную оценку степени достижения системой поставленной цели.
Эффективность системы является сложным, интегральным свойством и зависит также от ряда простых свойств, таких как:
— прагматическая эффективность — действенность системы, т. е. степень реализации системой своего предназначения;
— техническая эффективность — техническое совершенство системы;
47
— технологическая эффективность — простота и технологич
ность разработки и создания системы;
— эксплуатационная эффективность — удобство использования и обслуживания системы и др.
Прагматическую эффективность можно представить показате
лями достоверности преобразования информации, безопасности информационной системы, точности вычислений и преобразова
ния информации; полноты формирования системой результатной информации, оперативности.
Показатели технической эффективности должны оценивать техническое совершенство информационной системы, научно- технический уровень организации и функционирования этой системы.
Показатели технологическо-эксплуатационной эффективности весьма разнообразны. В качестве таких показателей могут высту
пать показатели надежности, функциональные возможности, количество обслуживаемых клиентов, производительность, про
пускная способность, тактовая частота, временные задержки, емкость памяти, эксплуатационные характеристики, технологии обслуживания и т.п.
Обобщающими показателями эффективности информацион
ной системы являются показатели экономической эффективности, характеризующие целесообразность произведенных на создание и функционирование системы затрат. Расчет затрат обычно не составляет большого труда, а вот расчет результатов остается сложной, до конца не решенной проблемой. Часто прибыль определяется путем экспертной оценки и по аналогии с другими подобными системами, а социальный эффект количественно во
обще не определяется.
Подробно о расчете экономической эффективности информа
ционных систем мы будем говорить в завершении изучения курса.
А теперь подробнее остановимся на вопросах безопасности ин
формации, так как именно безопасность оказывает огромное влияние и на надежность, и на эффективность, и на достоверность информации в ИС.
1.6. Б е зоп а сн о сть инф ормационны х си ст е м
Безопасность информационной системы — свойство, заклю
чающееся в способности системы обеспечить конфиденциаль
ность и целостность информации, т.е. защиту информации от несанкционированного доступа, обращенного на ее раскрытие, изменение или разрушение. Информационную безопасность часто указывают среди основных информационных проблем XXI века.
48