Файл: Учебник Рекомендовано Федеральным государственным учреждением.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 08.11.2023

Просмотров: 654

Скачиваний: 13

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1.4.3. Системы классификации информации
Для того чтобы обеспечить эффективный поиск, обработку на
ЭВМ и передачу по каналам связи технико-экономической ин­
формации, ее необходимо представить в цифровом виде. С этой целью ее нужно сначала упорядочить (классифицировать), а затем формализовать (закодировать) с использованием классифика­
тора.
К л а с с и ф и к а т о р — это систематизированный свод наи­
менований и кодов классификационных группировок. Классифи­
каторы по сфере действия разделяются на международные, обще­
государственные (общесистемные), отраслевые, локальные.
Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС) и обязатель­
ны для передачи информации между организациями разных стран мирового сообщества.
Общегосударственные (общесистемные) классификаторы обязательны для организации процессов передачи и обработки информации между экономическими системами государственно­
го уровня внутри страны.
Отраслевые классификаторы используют для выполнения процедур обработки информации и передачи ее между организа­
циями внутри отрасли.
Локальные классификаторы используют в пределах отдельных предприятий.
К л а с с и ф и к а ц и я о б ъ е к т о в — это процедура группи­
ровки на качественном уровне, направленная на выделение одно­
родных свойств. Применительно к информации как к объекту классификации выделенные классы называют информационными объектами.
Свойства информационного объекта определяются информа­
ционными параметрами — р е к в и з и т а м и , логически недели­
мым информационным элементом, описывающим определенное свойство объекта, явления и т. п. Реквизиты выражаются либо числовыми данными (масса, стоимость, год), либо признаками
(цвет, марка машины, фамилия).
Классификация предусматривает следующие задачи — выяв­
ление общих свойств информационного объекта; разработку правил (алгоритмов) и процедур обработки информации, пред­
ставленной совокупностью реквизитов. При классификации объ­
ектов необходимо соблюдать определенные требования, а именно: полноту охвата объектов, однозначность реквизитов, возможность включения новых реквизитов.
При классификации применяются понятия классификацион­
ный признак и его значение, которые позволяют установить сход­
43

ство или различие объектов. Признак классификации — свойство или характеристика объекта классификации, которое позволяет установить его сходство или различие с другими объектами клас­
сификации.
К л а с с и ф и к а ц и о н н а я г р у п п и р о в к а — это множе­
ство или подмножество, объединяющее часть объектов классифи­
кации по одному или нескольким признакам.
В настоящее время чаще всего применяются два типа систем классификации: иерархическая и многоаспектная. Эти системы различаются разной стратегией применения классификационных признаков.
Иерархическая система классификации информации по­
строена следующим образом.
1. Исходное множество элементов составляет нулевой уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют первый уровень.
2. Каждый класс первого уровня в соответствии с характерным для него классификационным признаком делится на подклассы, которые образуют второй уровень.
3. Каждый класс второго уровня аналогично делится на группы, которые образуют третий уровень и т.д.
Достоинства иерархической системы классификации — про­
стота построения; использование независимых классификацион­
ных признаков в различных ветвях иерархической структуры.
Недостатки иерархической системы классификации — жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки; невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Многоаспектная система (фасетная и дескрипторная) — это система классификации, которая использует параллельно несколь­
ко независимых признаков ( а с п е к т о в ) в качестве основания классификации.
Фасетная система классификации информации представля­
ет собой параллельное разделение множества объектов на неза­
висимые классификационные группировки по определенному аспекту классификации — ф а с е т у . Например, классифициро­
вать фильмы можно в соответствии со следующими группами — тип (документальный, игровой, анимационный); жанр (боевик, комедия, романтика, фантастика); продолжительность; год; стра­
на; режиссер; другие параметры (немой, звуковой, цветной, черно­
белый и т. п.). Таким образом, каждый фильм обладает множеством признаков. При поиске нужного фильма используется пересечение требуемых атрибутов.
44


Эта система классификации позволяет (в отличие от иерархи­
ческой) выбирать признаки классификации независимо как друг от друга, так и от семантического содержания классифицируемо­
го объекта. При построении фасетной системы классификации необходимо, чтобы значения, используемые в различных фасетах, не повторялись.
Достоинства фасетной системы классификации — возможность создания классификации большой емкости без изменения струк­
туры существующих группировок; возможность простой модифи­
кации всей системы классификации без изменения структуры существующих группировок.
Недостаток фасетной системы классификации — сложность ее построения, (необходимо учитывать все разнообразие классифи­
кационных признаков).
Для организации поиска информации, для ведения тезаурусов
(словарей) эффективно используется дескрипторная система
классификации, язык которой приближается к естественному языку описания информационных объектов. Суть дескрипторно- го метода заключается в следующем.
1. Отбирают совокупность ключевых слов ( д е с к р и п т о р о в ) или словосочетаний, описывающих определенную предметную область или совокупность однородных объектов, причем среди ключевых слов могут находиться синонимы.
2. Выбранные ключевые слова и словосочетания подвергают нормализации, т.е. из совокупности синонимов выбирают один или несколько наиболее употребляемых.
3. Создают словарь дескрипторов, т.е. словарь ключевых слов и словосочетаний, отобранных в результате процедуры нормали­
зации.
Между дескрипторами устанавливаются связи, которые по­
зволяют расширить область поиска информации. Связи могут быть трех видов:
— синонимические, указывающие на некоторую совокупность ключевых слов как синонимов («студент — учащийся — обучае­
мый»);
— родовидовые, отображающие включение некоторого класса объектов в более представительный класс («университет — фа­
культет — кафедра»);
— ассоциативные, соединяющие дескрипторы, обладающие общими свойствами («студент — экзамен — профессор — ауди­
тория»).
Наиболее сложными вопросами, которые приходится решать при разработке классификатора, являются выбор методов клас­
сификации и кодирования и выбор системы признаков класси­
фикации. Основой классификатора должны быть наиболее су­
45
щественные признаки классификации, соответствующие харак­
теру решаемых с помощью классификатора задач. При этом данные признаки могут быть или соподчиненными, или несо­
подчиненными. При соподчиненных признаках классификации и стабильном комплексе задач, для решения которых предна­
значен классификатор, целесообразно использовать иерархиче­
ский метод классификации, который представляет собой после­
довательное разделение множества объектов на подчиненные классификационные группировки. При несоподчиненных при­
знаках классификации и при большой динамичности решаемых задач целесообразно использовать фасетный метод классифика­
ции.
1.4.4. Экспортирование структур баз данных
При работе с информационной системой могут возникать си­
туации, когда требуется производить перенос данных из одной базы данных в другую. Этот процесс называется э к с п о р т и р о ­
в а н и е м .
Экспортирование данных требуется при переводе БД на другой физический носитель, при создании копии БД, переносе данных между информационными системами. Задачи переноса данных между ИС возникают при пересечении предметных областей си­
стем, что приводит их к согласованной работе с одними и теми же данными. Например, это могут быть системы различного уровня иерархии (информационные системы министерства и подчинен­
ной организации) либо автоматизированная система бухгалтер­
ского учета на предприятии и информационная система в нало­
говой инспекции, куда поступает отчетность и т. п. Сложность экспортирования данных зависит от характеристик источника и получателя данных и их соответствия друг другу. Экспортирование может заключаться в простом переносе данных или в выполнении ряда преобразований переносимых данных.
Преобразование данных может быть следующих видов:
— переименование — объекты данных (таблицы, поля и т.п.) источника получают имена в соответствии с организацией данных получателя;
— реструктуризация — изменение структуры БД источника в соответствии со структурой получателя;
— агрегирование — БД получает не просто данные, а некоторый сводный или итоговый отчет;
— кодирование и декодирование — данные изменяются так, чтобы они соответствовали системе кодирования БД-получа- теля;
46


— конвертирование — приведение к формату атрибута в БД- получателе;
— согласование — в разных БД могут использоваться разные способы отображения одной и той же информации (например, в километрах и в метрах), необходимо обеспечить их согласова­
ние;
— проверка на допустимость значений.
Таким образом, преобразование данных при экспортирова­
нии — это сложная задача, требующая создания специального алгоритма запросов (сценария).
1   2   3   4   5   6   7   8   9   ...   19

1.5. Показатели эф ф ективности
инф ормационны х с и ст е м
Эффективность информационной системы — это совокупность свойств системы, обусловливающих возможность ее использова­
ния для удовлетворения определенных потребностей пользовате­
лей в соответствии с ее назначением.
Основными показателями эффективности информационных систем являются надежность, достоверность, безопасность.
Надежность — свойство системы сохранять во времени в установленных пределах значения всех параметров, характери­
зующих способность выполнять требуемые функции в заданных условиях применения. Надежность информационных систем яв­
ляется средством обеспечения актуальной и достоверной инфор­
мации на выходе системы.
Достоверность — свойство системы, обусловливающее безо­
шибочность производимых ею преобразований информации.
Достоверность функционирования информационной системы полностью определяется и измеряется достоверностью ее резуль­
татной информации.
Безопасность информационной системы — свойство, заклю­
чающееся в способности системы обеспечить конфиденциаль­
ность и целостность информации, то есть защиту информации от несанкционированного доступа.
Показатели эффективности должны отражать количественную оценку степени достижения системой поставленной цели.
Эффективность системы является сложным, интегральным свойством и зависит также от ряда простых свойств, таких как:
— прагматическая эффективность — действенность системы, т. е. степень реализации системой своего предназначения;
— техническая эффективность — техническое совершенство системы;
47

— технологическая эффективность — простота и технологич­
ность разработки и создания системы;
— эксплуатационная эффективность — удобство использования и обслуживания системы и др.
Прагматическую эффективность можно представить показате­
лями достоверности преобразования информации, безопасности информационной системы, точности вычислений и преобразова­
ния информации; полноты формирования системой результатной информации, оперативности.
Показатели технической эффективности должны оценивать техническое совершенство информационной системы, научно- технический уровень организации и функционирования этой системы.
Показатели технологическо-эксплуатационной эффективности весьма разнообразны. В качестве таких показателей могут высту­
пать показатели надежности, функциональные возможности, количество обслуживаемых клиентов, производительность, про­
пускная способность, тактовая частота, временные задержки, емкость памяти, эксплуатационные характеристики, технологии обслуживания и т.п.
Обобщающими показателями эффективности информацион­
ной системы являются показатели экономической эффективности, характеризующие целесообразность произведенных на создание и функционирование системы затрат. Расчет затрат обычно не составляет большого труда, а вот расчет результатов остается сложной, до конца не решенной проблемой. Часто прибыль определяется путем экспертной оценки и по аналогии с другими подобными системами, а социальный эффект количественно во­
обще не определяется.
Подробно о расчете экономической эффективности информа­
ционных систем мы будем говорить в завершении изучения курса.
А теперь подробнее остановимся на вопросах безопасности ин­
формации, так как именно безопасность оказывает огромное влияние и на надежность, и на эффективность, и на достоверность информации в ИС.
1.6. Б е зоп а сн о сть инф ормационны х си ст е м
Безопасность информационной системы — свойство, заклю­
чающееся в способности системы обеспечить конфиденциаль­
ность и целостность информации, т.е. защиту информации от несанкционированного доступа, обращенного на ее раскрытие, изменение или разрушение. Информационную безопасность часто указывают среди основных информационных проблем XXI века.
48