ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.07.2024
Просмотров: 1288
Скачиваний: 2
Прагматическая мера информации
Эта мера определяет полезность информации (ценность) для достижения пользователем поставленной цели. Эта мера также величина относительная, обусловленная особенностями использования этой информации в той или иной системе. Ценность информации целесообразно измерять в тех же самых единицах (или близких к ним), в которых измеряется целевая функция.
Пример 2.5. В экономической системе прагматические свойства (ценность) информации можно определить приростом экономического эффекта функционирования, достигнутым благодаря использованию этой информации для управления системой:
где - ценность информационного сообщения β для системы управления γ,
- априорный ожидаемый экономический эффект функционирования системы управления
γ,
- ожидаемый эффект функционирования системы γ при условии, что для управления будет использована информация, содержащаяся в сообщении β.
Для сопоставления введенные меры информации представим в табл. 2.1.
Таблица 2.1. Единицы измерения информации и примеры
Мера информации |
Единицы измерения |
Примеры (для компьютерной |
|
области) |
|||
|
|
||
Синтаксическая: |
|
|
|
шенноновский подход |
Степень уменьшения неопределенности |
Вероятность события |
|
компьютерный подход |
Единицы представления информации |
Бит, байт, Кбайт и т.д. |
|
|
|
|
|
Семантическая |
Тезаурус |
Пакет прикладных программ, |
|
|
|
персональный компьютер, |
|
|
|
компьютерные сети и т.д. |
|
|
Экономические показатели |
Рентабельность, |
|
|
|
производительность, |
|
|
|
коэффициент амортизации и |
|
|
|
т.д. |
|
Прагматическая |
Ценность использования |
Емкость памяти, |
|
|
|
производительность |
|
|
|
компьютера, скорость передачи |
|
|
|
данных и т.д. |
|
|
|
Денежное выражение |
|
|
|
Время обработки |
|
|
|
информации и принятия |
|
|
|
решений |
|
КАЧЕСТВО ИНФОРМАЦИИ |
|
Возможность и эффективность использования информации обусловливаются такими основными ее потребительскими показателями качества, как репрезентативность, содержательность, достаточность, доступность, актуальность, своевременность, точность, достоверность, устойчивость.
33
Репрезентативность информации связана с правильностью ее отбора и формирования в целях адекватного отражения свойств объекта. Важнейшее значение здесь имеют:
§правильность концепции, на базе которой сформулировано исходное понятие;
§обоснованность отбора существенных признаков и связей отображаемого явления. Нарушение репрезентативности информации приводит нередко к существенным ее погрешностям. Содержательность информации отражает семантическую емкость, равную отношению количества
семантической информации в сообщении к объему обрабатываемых данных, т.е.
С увеличением содержательности информации растет семантическая пропускная способность информационной системы, так как для получения одних и тех же сведений требуется преобразовать меньший объем данных.
Наряду с коэффициентом содержательности С, отражающим семантический аспект, можно использовать и коэффициент информативности, характеризующийся отношением количества
синтаксической информации (по Шеннону) к объему данных Достаточность (полнота) информации означает, что она содержит минимальный, но достаточный
для принятия правильного решения состав (набор показателей). Понятие полноты информации связано с ее смысловым содержанием (семантикой) и прагматикой. Как неполная, т.е. недостаточная для принятия правильного решения, так и избыточная информация снижает эффективность принимаемых пользователем решений.
Доступность информации восприятию пользователя обеспечивается выполнением соответствующих процедур ее получения и преобразования. Например, в информационной системе информация преобразовывается к доступной и удобной для восприятия пользователя форме. Это достигается, в частности, и путем согласования ее семантической формы с тезаурусом пользователя.
Актуальность информации определяется степенью сохранения ценности информации для управления в момент ее использования и зависит от динамики изменения ее характеристик и от интервала времени, прошедшего с момента возникновения данной информации.
Своевременность информации означает ее поступление не позже заранее назначенного момента времени, согласованного с временем решения поставленной задачи.
Точность информации определяется степенью близости получаемой информации к реальному состоянию объекта, процесса, явления и т.п. Для информации, отображаемой цифровым кодом, известны четыре классификационных понятия точности:
§формальная точность, измеряемая значением единицы младшего разряда числа;
§реальная точность, определяемая значением единицы последнего разряда числа, верность которого гарантируется;
§максимальная точность, которую можно получить в конкретных условиях функционирования системы;
§необходимая точность, определяемая функциональным назначением показателя.
Достоверность информации определяется ее свойством отражать реально существующие объекты с
необходимой точностью. Измеряется достоверность информации доверительной вероятностью необходимой точности, т.е. вероятностью того, что отображаемое информацией значение параметра отличается от истинного значения этого параметра в пределах необходимой точности.
Устойчивость информации отражает ее способность реагировать на изменения исходных данных без нарушения необходимой точности. Устойчивость информации, как и репрезентативность, обусловлена выбранной методикой ее отбора и формирования.
В заключение следует отметить, что такие параметры качества информации, как репрезентативность, содержательность, достаточность, доступность, устойчивость, целиком определяются на методическом уровне разработки информационных систем. Параметры актуальности, своевременности, точности и достоверности обусловливаются в большей степени также на методическом уровне, однако на их величину существенно влияет и характер функционирования системы, в первую очередь ее надежность.
При этом параметры актуальности и точности жестко связаны соответственно с параметрами своевременности и достоверности.
2.2. КЛАССИФИКАЦИЯ И КОДИРОВАНИЕ ИНФОРМАЦИИ
34
Система классификации Система кодирования
Классификация информации по разным признакам
СИСТЕМА КЛАССИФИКАЦИИ
Общие сведения
Важным понятием при работе с информацией является классификация объектов.
Классификация – система распределения объектов (предметов, явлений, процессов, понятий) по классам в соответствии с определенным признаком.
Под объектом понимается любой предмет, процесс, явление материального или нематериального свойства. Система классификации позволяет сгруппировать объекты и выделить определенные классы, которые будут характеризоваться рядом общих свойств. Классификация объектов – это процедура группировки на качественном уровне, направленная на выделение однородных свойств. Применительно
к информации как к объекту классификации выделенные классы называют информационными объектами.
Пример 2.6. Всю информацию об университете можно классифицировать по многочисленным информационным объектам, которые будут характеризоваться общими свойствами:
§информация о студентах – в виде информационного объекта "Студент";
§информация о преподавателях – в виде информационного объекта "Преподаватель";
§информация о факультетах – в виде информационного объекта "Факультет" и т.п.
Свойства информационного объекта определяются информационными параметрами, называемыми реквизитами. Реквизиты представляются либо числовыми данными, например вес, стоимость, год, либо признаками, например цвет, марка машины, фамилия.
Реквизит – логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.
Пример 2.7. Информация о каждом студенте в отделе кадров университета систематизирована и представлена посредством одинаковых реквизитов:
§фамилия, имя, отчество;
§пол;
§год рождения;
§место рождения;
§адрес проживания;
§факультет, где проходит обучение студент, и т.д.
Все перечисленные реквизиты характеризуют свойства информационного объекта "Студент".
Кроме выявления общих свойств информационного объекта классификация нужна для разработки правил (алгоритмов) и процедур обработки информации, представленной совокупностью реквизитов.
Пример 2.8. Алгоритм обработки информационных объектов библиотечного фонда позволяет получить информацию о всех книгах по определенной тематике, об авторах, абонентах и т.д.
Алгоритм обработки информационных объектов фирмы позволяет получить информацию об объемах продаж, о прибыли, заказчиках, видах производимой продукции и т.д. Алгоритмы обработки в том и другом случае преследуют разные цели, обрабатывают разную информацию, реализуются разными способами.
При любой классификации желательно, чтобы соблюдались следующие требования:
35
§полнота охвата объектов рассматриваемой области;
§однозначность реквизитов;
§возможность включения новых объектов.
Влюбой стране разработаны и применяются государственные, отраслевые, региональные классификаторы. Например, классифицированы: отрасли промышленности, оборудование, профессии, единицы измерения, статьи затрат и т.д.
Классификатор – систематизированный свод наименований и кодов классификационных группировок.
При классификации широко используются понятия классификационный признак и значение классификационного признака, которые позволяют установить сходство или различие объектов. Возможен подход к классификации с объединением этих двух понятий в одно, названное как признак классификации. Признак классификации имеет также синоним основание деления.
Пример 2.9. В качестве признака классификации выбирается возраст, который состоит из трех значений: до 20 лет, от 20 до 30 лет, свыше 30 лет.
Можно в качестве признаков классификации использовать: возраст до 20 лет, возраст от 20 до 30 лет, возраст свыше 30 лет.
Разработаны три метода классификации объектов: иерархический, фасетный, дескрипторный. Эти методы различаются разной стратегией применения классификационных признаков. Рассмотрим основные идеи этих методов для создания систем классификации.
Рис. 2.3. Иерархическая система классификации
Иерархическая система классификации
Иерархическая система классификации (рис. 2.3) строится следующим образом:
§исходное множество элементов составляет 0-й уровень и делится в зависимости от выбранного классификационного признака на классы (группировки), которые образуют 1-й уровень;
§каждый класс 1-го уровня в соответствии со своим, характерным для него классификационным признаком делится на подклассы, которые образуют 2-й уровень;
§каждый класс 2-го уровня аналогично делится на группы, которые образуют 3-й уровень, и т.д.
Учитывая достаточно жесткую процедуру построения структуры классификации, необходимо перед началом работы определить ее цель, т.е. какими свойствами должны обладать объединяемые в классы объекты. Эти свойства принимаются в дальнейшем за признаки классификации.
Запомните! В иерархической системе классификации из-за жесткой
структуры особое внимание следует уделить выбору классификационных признаков.
36
В иерархической системе классификации каждый объект на любом уровне должен быть отнесен к одному классу, который характеризуется конкретным значением выбранного классификационного признака. Для последующей группировки в каждом новом классе необходимо задать свои классификационные признаки и их значения. Таким образом, выбор классификационных признаков будет зависеть от семантического содержания того класса, для которого необходима группировка на последующем уровне иерархии.
Количество уровней классификации, соответствующее числу признаков, выбранных в качестве основания деления, характеризует глубину классификации.
Достоинства иерархической системы классификации:
§простота построения;
§использование независимых классификационных признаков в различных ветвях
иерархической структуры.
Недостатки иерархической системы классификации:
§жесткая структура, которая приводит к сложности внесения изменений, так как приходится перераспределять все классификационные группировки;
§невозможность группировать объекты по заранее не предусмотренным сочетаниям признаков.
Пример 2.10. Поставлена задача – создать иерархическую систему классификации для информационного объекта "Факультет", которая позволит классифицировать информацию обо всех студентах по следующим классификационным признакам: факультет, на котором он учится, возрастной состав студентов, пол студента, для женщин – наличие детей.
Система классификации представлена на рис.2.4 и будет иметь следующие уровни: 0-й уровень. Информационный объект "Факультет"; 1-й уровень. Выбирается классификационный признак – название факультета, что
позволяет выделить несколько классов с разными названиями факультетов, в которых хранится информация обо всех студентах.
2-й уровень. Выбирается классификационный признак – возраст, который имеет три градации: до 20 лет, от 20 до 30 лет, свыше 30 лет. По каждому факультету выделяются три возрастных подкласса студентов.
3-й уровень. Выбирается классификационный признак – пол. Каждый подкласс 2- го уровня разбивается на две группы. Таким образом, информация о студентах каждого факультета в каждом возрастном подклассе разделяется на две группы – мужчин и женщин.
4-й уровень. Выбирается классификационный признак – наличие детей у женщин: есть, нет.
Созданная иерархическая система классификации имеет глубину классификации, равную четырем.
Рис. 2.4. Пример иерархической системы классификации для информационного объекта "Факультет"
Фасетная система классификации
37