ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.06.2021
Просмотров: 516
Скачиваний: 1
6
записанная справа налево вместе с последним частным, и образует двоичный
аналог десятичного числа.
Для кодирования целых чисел от 0 до 255 достаточно иметь 8 разрядов
двоичного кода (8 бит). 16 бит позволяют закодировать целые числа от 0 до
65535, а 24 – уже более 16,5 миллионов различных значений.
Естественная и экспоненциальная запись числа
Для кодирования действительных чисел используют 80-разрядное
кодирование. При этом число предварительно преобразовывают в
нормализованную (экспоненциальную) форму:
0,001 = 0,1 * 10
-3
– запись в 10-ичной СС.
ест. экспон.
A
q
= m * q
n
– число в любой СС в экспоненциальной форме.
m – мантисса числа (дробь, им после запятой цифру 0)
q – основание СС
n - порядок числа.
Первая часть числа называется мантиссой, а вторая – характеристикой.
Большую часть из 80 бит отводят для хранения мантиссы (вместе со знаком)
и некоторое фиксированное количество разрядов отводят для хранения
характеристики.
Кодирование текстовой информации. Компьютерный алфавит состоит
из 256 символа: все символы английского и русского языков, как строчные,
так и прописные, а также знаки препинания, символы основных
арифметических действий и некоторые общепринятые специальные
символы.
Если рассматривать символы как возможные события, то по формуле
(1) 256 = 2
8
, т.е. для кодирования 1 символа требуется 8 бит или 1 байт
информации. Кодирование заключается в том, что каждому символу
компьютерного алфавита ставится в соответствие уникальный десятичные
код от 0 до 255 и соответствующий ему двоичный код от 00000000
2
до
11111111
2.
Для английского языка, захватившего де-факто нишу международного
средства общения, противоречия уже сняты. Институт стандартизации США
ввѐл в действие систему кодирования ASCII (American Standard Code for
Information Interchange – стандартный код информационного обмена США).
В системе ASCII закреплены две таблицы кодирования базовая и
расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а
расширенная относится к символам с номерами от 128 до 255.
Кодировка символов русского языка, известная как кодировка
Windows-1251, была введена ―извне‖ - компанией Microsoft, но, учитывая
широкое распространение операционных систем и других продуктов этой
компании в России, она глубоко закрепилась и нашла широкое
распространение. Другая распространѐнная кодировка носит название КОИ-8
(код обмена информацией, восьмизначный) – еѐ происхождение относится к
временам действия Совета Экономической Взаимопомощи государств
Восточной Европы. Сегодня кодировка КОИ – 8 имеет широкое
7
распространение в компьютерных сетях на территории России и в
российском секторе Интернета.
Международный стандарт, в котором предусмотрена кодировка
символов русского языка, носит названия ISO (International Standard
Organization – Международный институт стандартизации). На практике
данная кодировка используется редко.
Система, основанная на 16-разрядном кодировании символов,
получила название универсальной – UNICODE. Шестнадцать разрядов
позволяют обеспечить уникальные коды для 65 536 различных символов –
этого поля вполне достаточно для размещения в одной таблице символов
большинства языков планеты.
Кодирование графической информации. Графическая информация на
экране монитора представляется в виде растрового изображения, которое
формируется из определенного количества строк, которые, в свою очередь,
содержат определенное количество точек (пикселей).
Поскольку линейные координаты и индивидуальные свойства каждой
точки (яркость) можно выразить с помощью целых чисел, то можно сказать,
что растровое кодирование позволяет использовать двоичный код для
представления графических данных. Общепринятым на сегодняшний день
считается представление чѐрно-белых иллюстраций в виде комбинации точек
с 256 градациями серого цвета, и, таким образом, для кодирования яркости
любой точки обычно достаточно восьмиразрядного двоичного числа.
Для кодирования цветных графических изображений применяется
принцип декомпозиции произвольного цвета на основные составляющие. В
качестве таких составляющих используют три основные цвета: красный
(Red), зелѐный (Green) и синий (Blue). На практике считается, что любой
цвет, видимый человеческим глазом, можно получить механического
смешения этих трѐх цветов. Такая система кодирования получила название
RGB по первым буквам основных цветов.
Кодирование звуковой информации. Метод FM (Frequency Modulation)
основан та том, что теоретически любой сложный звук можно разложить на
последовательность простейших гармонических сигналов разных частот,
каждый из которых представляет собой правильную синусоиду, а,
следовательно, может быть описан числовыми параметрами, т.е. кодом. В
природе звуковые сигналы имеют непрерывный спектр, т.е. являются
аналоговыми. Их разложение в гармонические ряды и представление в виде
дискретных цифровых сигналов выполняют специальный устройства –
аналогово-цифровые преобразователи (АЦП). Обратное преобразование для
воспроизведения звука, закодированного числовым кодом, выполняют
цифро-аналоговые преобразователи (ЦАП).
Метод таблично волнового (Wave-Table) синтеза лучше соответствует
современному уровню развития техники. В заранее подготовленных
таблицах хранятся образцы звуков для множества различных музыкальных
инструментах. В технике такие образцы называют сэмплами. Числовые коды
выражают тип инструмента, номер его модели, высоту тона,
8
продолжительность и интенсивность звука, динамику его изменения,
некоторые параметры среды, в которой происходит звучание, а также прочие
параметры, характеризующие особенности звучания. Поскольку в качестве
образцов исполняются реальные звуки, то его качество получается очень
высоким и приближается к качеству звучания реальных музыкальных
инструментов.
Контрольные вопросы
1
Что называется кодированием?
2
Каким образом кодируются все виды информации?
3
Как называются системы кодирования понятий для выражения
мыслей посредством речи?
4
Как называются системы кодирования компонентов языка с
помощью графических символов?
5
Как кодируются целые числа?
6
Сколько значений можно закодировать 8 разрядами двоичного кода?
16 разрядами? 24 разрядами?
7
Какое количество информации необходимо для кодирования 1
символа компьютерного алфавита в кодировке ASCII?
8
Какое количество символом можно закодировать с помощью
кодировки UNICODE?
9
Как представляется графическая информация на экране монитора?
10
Какой принцип применяется для кодирования цветных
графических изображений?
11
Какая система кодирования получила название RGB?
12
Как определяется качество изображения?
13
Как формируется цветное изображение на экране монитора?
14
На чем основа метод FM (Frequency Modulation)?
15
На чем основа метод таблично волнового (Wave-Table) синтеза?
16
На чем основа метод импульсно-кодовой модуляцией PCM (Pulse
Code Modulation)?
9
Тема 2 Меры и единицы количества и объема информации
Лекция 2
Цель: понятие количества и объѐма информации; классификация мер;
понятие качества
План:
1.
Сигнал, сообщение и данные.
2.
Меры информации. Классификация мер.
3.
Количество информации.
4.
Качество информации.
Список рекомендуемой литературы:
1.
Информатика : Учебник / под ред . Н. В. Макаровой – М. :
Финансы и статистика, 2005. – 768 с.
2.
Симонович С. В. Информатика. Базовый курс : учебник для вузов
/ С. В. Симонович. – СПб : Питер, 2006. 639 с.
3.
Степанова Е .Е. Информационное обеспечение управленческой
деятельности : учеб. пособие / Е. Е Степанова, Н. В. Хмелевская. – М. :
ФОРУМ: ИНФРА – М., 2002. – 154 с.
1 Сигнал, сообщение и данные
Сигнал представляет собой изменяющийся во времени физический
процесс, несущий информацию. Сигнал называется непрерывным или
аналоговым, если его параметр в заданных пределах может принимать любые
промежуточные значения.
Сигнал называется дискретным или импульсным,
если его параметр в заданных пределах может принимать отдельные
фиксированные значения. Сообщение - это информация, представленная в
определенной форме и предназначенная для передачи. Данные - это
информация, представленная в формализованном виде и предназначенная
для обработки ее техническими средствами, например ЭВМ. Данные –
зарегистрированные сигналы.
Основные структуры данных:
Линейные структуры (списки) – упорядоченные структуры, в которых
адрес элемента однозначно определяется его номером.
Табличные структуры (таблицы, матрицы данных) – упорядоченные
структуры, в которых адрес элемента однозначно определяется номером
столбца и номером строки, на пересечении которых находится данный
элемент.
Иерархические структуры (система почтовых адресов – адрес каждого
элемента определяется путем доступа (маршрута), ведущим от вершины
структуры к данному элементу).
10
Передача информации Информация передаѐтся в форме сообщений от
некоторого источника информации к еѐ приѐмнику посредством канала связи
между ними. Источник посылает передаваемое сообщение, которое
кодируется в передаваемый сигнал. Этот сигнал посылается по каналу связи.
В результате в приѐмнике появляется принимаемый сигнал, который
декодируется и становится принимаемым сообщением.
Передача информации по каналам связи часто сопровождается
воздействием помех, вызывающих искажение и потерю информации.
2 Меры информации. Классификация мер
Для измерения информации вводятся два параметра: количество
информации
I
и объем данных
V
Д
.
Каждой форме адекватности соответствует своя мера количества
информации и объема данных.
Синтаксическая мера информации
Эта мера количества информации оперирует с обезличенной
информацией, не выражающей смыслового отношения к объекту.
Объем данных V
Д
в сообщении измеряется количеством символов
(разрядов) в этом сообщении. В различных системах счисления один разряд
имеет различный вес и соответственно меняется единица измерения данных:
в двоичной системе счисления единица измерения - бит
(bit — binary
digit—
двоичный разряд);
в десятичной системе счисления единица измерения - дит (десятичный
разряд).
Семантическая мера информации. Для измерения смыслового
содержания информации, т.е. ее количества на семантическом уровне,
наибольшее признание получила тезаурусная мера, которая связывает
семантические свойства информации со способностью пользователя
принимать поступившее сообщение. Для этого используется понятие
тезаурус пользователя.
Тезаурус - это совокупность сведений, которыми располагает
пользователь или система.
В зависимости от соотношений между смысловым содержанием
информации
S
и тезаурусом пользователя
S
Р
изменяется количество
семантической информации
1
С
,
воспринимаемой пользователем и
включаемой им в дальнейшем в свой тезаурус.
Максимальное количество семантической информации
I
C
потребитель
приобретает при согласовании ее смыслового содержания
S
со своим
тезаурусом
S
Р
(S
Р
=S
Р
opt
),
когда поступающая информация понятна
пользователю и несет ему ранее не известные (отсутствующие в его
тезаурусе) сведения.
Прагматическая мера информации. Эта мера определяет полезность
информации (ценность) для достижения пользователем поставленной цели.
Эта мера также величина относительная, обусловленная особенностями
использования этой информации в той или иной системе. Ценность