Файл: Способы представления данных в информационных системах(Представление и кодирование числовой информации).pdf
Добавлен: 17.05.2023
Просмотров: 100
Скачиваний: 3
СОДЕРЖАНИЕ
1 ПРЕДСТАВЛЕНИЕ И КОДИРОВАНИЕ ИНФОРМАЦИИ
1.1 Представление и кодирование числовой информации
1.2 Представление и кодирование текстовой информации
1.3 Представление цветной и графической информации
1.4 Представление и кодирование звуковой информации
2 ВИДЫ И ФОРМЫ ПРЕДСТАВЛЕНИЯ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ
2.1 Информационная модель и ее описание
2.2 Используемые классификаторы и системы кодирования
2.3 Уровни проблем передачи информации
2.4 Меры и качество информации
3 ПРАКТИЧЕСКОЕ ПРЕДСТАВЛЕНИЕ ИНФОРМАЦИИ В ИНФОРМАЦИОННОЙ СИСТЕМЕ
3.1 Представление информации в информационных системах
Сообщение - форма представления информации в виде набора символов (символов), используемых для передачи.
Сообщение как совокупность знаков с точки зрения семиотики (от греч. semeion - знак, знак) - наука, занимающаяся изучением свойств знаков и знаковых систем - может изучаться на трех уровнях [8]:
1) синтаксический, где рассматриваются внутренние свойства сообщений, т. е. отношения между знаками, отражающие структуру данной знаковой системы. Внешние свойства изучаются на семантическом и прагматическом уровнях;
2) семантический, анализирующий отношения между знаками и обозначаемыми ими объектами, действиями, качествами, т. е. смысловое содержание сообщения, его отношение к источнику информации;
3) прагматический, где рассматривается отношение между сообщением и получателем, т. е. потребительское содержание сообщения, его отношение к получателю.
Проблемы синтаксического уровня касаются создания теоретических основ построения информационных систем, основные показатели функционирования которых были бы близки к предельно возможным, а также совершенствования существующих систем с целью повышения эффективности их использования [11]. Это чисто технические проблемы совершенствования методов передачи сообщений и их материальных носителей - сигналов.
На этом уровне рассматривается задача доставки получателю сообщения в виде набора символов с учетом типа носителя и представления информации, скорости передачи и обработки, размера кодов для сообщения, надежности и точности этих кодов преобразования и т.д. полностью абстрагируются от смыслового содержания сообщений и их целевого назначения [9]. На этом уровне информация, рассматриваемая только с синтаксических позиций, обычно называется данными, поскольку семантическая сторона не имеет значения.
Современная теория информации исследует в основном проблемы этого уровня. В его основе лежит понятие «объем информации», представляющее собой меру частоты использования знаков, которая не отражает смысла или важности передаваемых сообщений [1]. В связи с этим иногда говорят, что современная теория информации находится на синтаксическом уровне. Проблемы семантического уровня связаны с формализацией и учетом смысла передаваемой информации, определением степени соответствия образа объекта и самого объекта. На этом уровне анализируется отраженная информация, рассматриваются смысловые связи, формируются понятия и представления, раскрывается смысл и содержание информации, осуществляется ее обобщение [6]. Задачи этого уровня чрезвычайно сложны, так как семантическое содержание информации в большей степени зависит от адресата, чем от семантики сообщения, представленного на любом языке [6].
На прагматическом уровне нас интересуют последствия получения и использования этой информации потребителем. Проблемы этого уровня связаны с определением ценности и полезности использования информации при разработке потребителем решения для достижения цели. Основная сложность здесь заключается в том, что ценность, полезность информации может быть совершенно разной для разных получателей и, кроме того, она зависит от ряда факторов, таких как своевременность ее доставки и использования [7].
Высокие требования к скорости доставки информации часто диктуются тем, что управляющие воздействия должны осуществляться в режиме реального времени, т. е. со скоростью изменения состояния контролируемых объектов или процессов. Задержки в доставке или использовании информации могут привести к катастрофическим последствиям.
Таким образом, учитывая определенную взаимосвязь проблем передачи информации с уровнями изучения знаковых систем, их можно разделить на три уровня: синтаксический, семантический и прагматический.
2.4 Меры и качество информации
Для каждого из вышеперечисленных уровней проблем передачи информации существуют различные подходы к измерению объема информации и их меры информативности. Существуют соответственно показатели информационного синтаксического уровня, семантического уровня и прагматического уровня [13].
Эффективность применения и качество функционирования: спутниковые системы во многом определяются качеством информации, на основе которой принимаются управленческие решения.
Качество информации - это совокупность информационных свойств, характеризующих степень ее соответствия потребностям (целям, ценностям) пользователей (средств автоматизации, персонала и др.) [13]. Различают внутреннее качество - содержание (присущее самой информации и сохраняемое при ее передаче в другую систему) и внешнее - безопасность (присущее информации, находящейся или используемой только в определенной системе) [16].
Содержание информации - совокупность сведений о конкретном объекте (системе) или процессе, содержащихся в сообщениях и воспринимаемых получателем.
Содержание отражает семантическую емкость информации в информационных массивах (им) (массивы данных, программные массивы, сообщения, факты). Содержательная информация используется, как правило, для разработки и принятия управляющего воздействия [11]. Содержание информации определяется такими свойствами, как значимость и кумулятивность.
Важность информации - это свойство информации сохранять ценность для потребителя с течением времени, т. е. не подвергаться моральному старению [22].
Полнота информации - это свойство содержательной информации, характеризующееся мерой ее достаточности для решения определенных задач. Полнота (достаточность) информации означает, что она обеспечивает правильное (оптимальное) решение.
Отсюда следует, что это свойство является относительным: полнота информации оценивается относительно четко определенной задачи или группы задач. Поэтому для того, чтобы иметь возможность определить полноту информации, необходимо для каждой значимой задачи или группы задач иметь список той информации, которая необходима для их решения. Как неполная, т. е. недостаточная для принятия правильного решения, так и избыточная информация снижают эффективность принимаемых пользователем решений.
Идентичность - это свойство, которое заключается в соответствии информации о содержании состоянию объекта. Нарушение идентичности связано с техническим (путем несовпадения признаков) старением информации, при котором возникает несоответствие между реальными признаками объектов и теми же признаками, отображенными в информации.
Совокупная информация - свойство содержательной информации, содержащейся в массиве небольшого объема, достаточно полно отображать действительность.
Задача обеспечения кумулятивности информации может быть решена без учета и учета опыта и квалификации конкретного потребителя информации, с использованием формально - технических и социально - психологических приемов соответственно [11]. Формальные и технические методы включают, например, агрегирование - получение сводных показателей различных уровней обобщения или выделение отдельных показателей из массивов исходных данных. Эти и другие формальные приемы направлены на построение моделей типа «много в одном», когда реальность отображается с небольшим количеством символов [7]. Такие модели называются гомоморфными, и соответствующим свойством является информационный гомоморфизм. Это формальная и техническая составляющая совокупной информации.
Информационный гомоморфизм - это свойство содержательной информации, связанное с достаточно полным отображением действительности, представленной крупнообъемными информационными массивами, использующими небольшое количество информационных единиц (символов) на основе соответствующих агрегационных моделей [20].
Информационное обеспечение конкретного потребителя может осуществляться с учетом его опыта, квалификации и других свойств, а также с учетом решаемых им задач.
Информация, специально подобранная для конкретного потребителя, обладает определенным свойством - избирательностью. Это социально - психологическая составляющая свойства кумулятивности.
Избирательность информации - это свойство содержательной информации, заключающееся в достаточно полном отображении действительности, представленной информационными массивами, использующими небольшое количество информационных единиц (символов) с учетом квалификации, опыта и других качеств конкретного потребителя [7].
Безопасность отражает внешнее качество информации, определяемое совокупностью свойств информации, обеспечиваемой системой контроля и защиты информации в конкретной информационной системе. Основными из них являются свойства, заключающиеся в возможности предотвращения случайного или целенаправленного искажения или уничтожения, раскрытия или модификации информационных массивов, соответственно надежности, конфиденциальности и сохранности информации [9].
Достоверность информации - это свойство информации, характеризующееся степенью соответствия (в пределах заданной точности) реальных информационных единиц (символов, знаков, записей, сообщений, информационных массивов и др.) к их истинному значению и определяется возможностью обеспечения отсутствия ошибок обработки информации, искажений информационных обязательств, их смыслового значения, замены символов вследствие несовершенства организации (структуры) процесса обработки, несовершенства алгоритмов, ненадежной работы аппаратных и программных средств, ошибок пользователей и др [12]. Требуемый уровень достоверности информации достигается внедрением методов контроля и защиты информации на всех уровнях. Критериями оптимальности в этом случае, как правило, являются:
- минимизация вероятности искажения одного массива информации;
- максимизация надежности обработки информации в зависимости от вероятности ошибки;
- минимизация времени обработки и материальных затрат при ограничении надежности;
- минимизация общего среднего времени на их обработку, контроль и исправление;
- минимизация суммарных потерь с учетом затрат на разработку и эксплуатацию структур управления, исправление ошибок и потерь в информационной системе (ИС) при использовании недостоверной информации и др.
Конфиденциальность информации - это свойство информации, позволяющее сохранять присвоенный ей статус. Конфиденциальность информации характеризуется такими показателями, как доступность, секретность и имитостойкость [14].
Доступность информации характеризуется степенью дифференциации действий объектов информационной системы (операторов, задач, устройств, программ, подсистем и др.) и заключается в возможности их использования по требованию объектов системы, обладающих соответствующими полномочиями (мандатами).
Информационная секретность характеризуется степенью маскировки информации и отражает ее способность противостоять раскрытию смысла им (смысловая секретность на основе обратимых преобразований информации), определению структуры хранящегося им или передаваемого им носителя (несущего сигнала) (структурная секретность на основе необратимых преобразований, использование специального оборудования, различных форм, маскировка закрытой информации в открытых формах (стенография) и др.) [21].
Имитостойкость информации определяется степенью ее защищенности от внедрения имитирующих уполномоченных (зарегистрированных) массивов, а также является возможностью предотвращения навязывания дезинформации и нарушения нормального функционирования информационной системы [21].
Необходимый уровень конфиденциальности достигается за счет дополнительных преобразований (семантических, криптографических и др.) информации, контроля полномочий программно-аппаратных средств, ресурсов ИС и лиц (операторов, персонала, пользователей и др.) взаимодействие с средствами автоматизации и контроля доступа к ним.
Сохранность информации - свойство информации, характеризующееся степенью готовности отдельных ее элементов к целевому снижению и определяемое способностью обеспечивать постоянное наличие и своевременное их обеспечение, необходимое для автоматизированного решения целевых и функциональных задач системы, т. е. не допускать их разрушения из - за несовершенства носителей, механических повреждений, неправильного функционирования, износа и старения технических средств, ошибок прохождения и несанкционированных регулировок, недостатков в работе ЭВМ и др. Основными показателями безопасности являются целостность и доступность информации [17].
Целостность информации характеризуется степенью достоверности (аутентичности) им в информационной базе и исходных данных (сообщений) и определяется способностью обеспечить ее насколько это возможно, физическим присутствием информации.