Файл: Кудряшова Анастасия Юрьевна Интернеткурс по дисциплине Информационные технологии в.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.01.2024
Просмотров: 583
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
14 десятичного числа 10) до F (эквивалент десятичного числа 15). То есть в шестнадцатиричной системе счисления знаки-цифры — 0, 1, 2, 9, А, В, С, D, E, F. Число в двоичной системе разбивается на группы по четыре двоичных знака.
Одна группа дает 2 4
= 16 комбинаций. Десятичное число 396 в двоичной системе обозначается как 110001100, а в шестнадцатиричной системе как 18С. Соответствие десятичных, двоичных и шестнадцатиричных чисел показано в таблице 1.1.
Шестнадцатиричная система счисления применяется для обозначений адресов ячеек оперативной памяти компьютера, оттенков цвета и дает не такие длинные ряды цифр, как давала бы двоичная система.
Иногда после шестнадцатиричного числа пишут букву h (hexamal). Например, 321h соответствует десятичному 801 = 3 · 16 2
+ 2 · 16 1
+ 1 · 16 0
, a FCh — это десятичное число
252 = 15 · 16 1
+ 12 · 16 0
Таблица 1.1 -Соответствие чисел: десятичные, двоичные, шестнадцатиричные
Десятич- ное число
Двоичное число
Шестнадцати- ричное число
Десятич- ное число
Двоичное число
Шестнадцати- ричное число
0 00000000 0
8 00001000 8
1 00000001 1
9 00001001 9
2 00000010 2
10 00001010
А
3 00000011 3
11 00001011
В
4 00000100 4
12 00001100
С
5 00000101 5
13 00001101
D
6 00000110 6
14 00001110
Е
7 00000111 7
15 00001111
F
16 00010000 10
Вопрос 4. Кодирование информации
Для автоматизации работы с различными данными (числовыми, текстовыми, звуковыми и др.) используется прием кодирования — выражение одного типа данных через данные другого типа. Так, естественный человеческий язык представляет собой систему кодирования понятий для выражения мыслей посредством речи, система кодирования
Брайля используется у слепых. Разные системы кодирования успешно применяются в различных отраслях техники, науки, экономики.
Сигналы в компьютере передаются посредством электрических импульсов. Чтобы различать каждую используемую цифру десятичной системы, понадобилось бы десять различных сигналов.
С технической точки зрения чем меньше видов сигналов, тем лучше. Поэтому для электронного вычислительного устройства эффективнее и удобнее двоичная система кодирования — представление чисел по основанию 2, при котором значения выражаются
15 комбинациями 0 и 1. Простота совершаемых операций и возможность осуществлять автоматическую обработку информации, реализуя только два знака, дают преимущества, существенно превышающие недостаток в виде быстрого роста числа разрядов.
Кодирование чисел.
Числовую информацию компьютер обрабатывает в двоичной системе счисления.
Таким образом, числа в компьютере представлены последовательностью цифр 0 и 1, называемых битами (бит — один разряд двоичного числа).
В начале 1980-х гг. процессоры для персональных компьютеров были 8-разрядными, и за один такт работы процессора компьютер мог обработать 8 бит, т.е. максимально обрабатываемое десятичное число не могло превышать 11111111 2
(или 255 10
).
Последовательность из восьми бит называют байтом, т.е. 1 байт = 8 бит. Затем разрядность процессоров росла, появились 16-, 32- и, наконец, 64-разрядные процессоры для персональных компьютеров, соответственно возросла и величина максимального числа, обрабатываемого за один такт.
Использование двоичной системы для кодирования целых и действительных чисел позволяет с помощью 8 разрядов кодировать целые числа от 0 до 255, 16 бит дает возможность закодировать более 65 тыс. значений.
В ЭВМ применяются две формы представления чисел:
естественная форма, или форма с фиксированной запятой. В этой форме числа изображаются в виде последовательности цифр с постоянным для всех чисел положением запятой, отделяющей целую часть от дробной.
Например, +00456,78800; +00000,00786; –0786,34287. Эта форма неудобна для вычислений и применяется только как вспомогательная для целых чисел.
нормальная форма, или форма с плавающей точкой. В этой форме число выражается с помощью мантиссы и порядка как
N = ±M · P ± r (1.2) где М — мантисса числа (| M | < 1), r — порядок числа (целое число),
Р — основание системы счисления.
Приведенные выше числа в нормальной форме будут представлены как +0,456788 ·
10 3
, +0,786 · 10
–2
, –0,3078634287 · 10 5
. Нормальная форма представления обеспечивает большой диапазон отображения чисел и является основной в современных ЭВМ. Все числа с плавающей запятой хранятся в ЭВМ в нормализованном виде. Нормализованным называют такое число, старший разряд мантиссы которого больше нуля.
В памяти ЭВМ для хранения чисел предусмотрены форматы: слово — длиной 4 байта, полуслово — 2 байта, двойное слово — 8 байт.
Разрядная сетка для чисел с плавающей запятой имеет следующую структуру:
нулевой разряд — это знак числа;
с 1-го по 7-й разряд — записывается порядок в двоичном коде;
с 8-го по 31-й — указывается мантисса.
Кодирование текстовых данных.
Двоичная система позволяет кодировать и текстовую информацию. Восемь двоичных разрядов достаточно для кодирования 256 различных символов.
Первым международным кодом стал стандартный 7-битный код ASCII (American
Standard Code for Information Interchange — американский стандартный код для обмена
16 информацией). Появление данного кода в 1963 г. сыграло значительную роль, поскольку до этого различные компьютеры просто не могли взаимодействовать друг с другом. Каждый производитель по-своему представлял символы алфавита, цифры и управляющие коды.
В одних только аппаратных средствах корпорации IBM использовалось девять различных наборов кодировки символов. Но взаимодействие между компьютерами стало настоятельной необходимостью. В 1961 г. комитет Американского национального института стандартов (ANSI), в котором была представлена большая часть производителей компьютеров, приступил к разработке международного стандарта.
Комитету понадобилось свыше двух лет, чтобы проанализировать позиции всех сторон, найти компромисс и завершить разработку универсального кода. Код ASCII стал общим знаменателем для компьютеров, которые ранее не имели друг с другом ничего общего. Всем буквам, цифрам, знакам препинания и другим символам (управляющим кодам) были поставлены в соответствие стандартные числовые значения. Код ASCII поддерживал 128 символов, включающих заглавные и строчные символы латиницы, цифры, специальные знаки и управляющие коды. Базовая таблица кодировки этого кода, начиная с 32-го кода, приведена в таблице 1.2. Коды 0÷31 использованы в данной таблице как служебные и управляющие.
Затем 7-битный код ASCII был расширен до 256 символов и принят как 8-битный международный стандарт ASCII-2, причем коды с 128 по 256 этого стандарта были задействованы для национальных языков разных стран. Для СССР в этой области была введена национальная кодировка КОИ-8 (код обмена информацией, восьмизначный). Код
ASCII остался одной из немногих технологий, которой удалось успешно пройти сквозь десятилетия и дожить до наших дней. Сегодня на основе кода ASCII выпускается оборудование стоимостью в миллиарды долларов, большинство операционных систем до сих пор совместимо с ASCII.
Существует несколько различных кодовых таблиц для русского алфавита. Так, кодировка Windows-1251 была введена компанией Microsoft и, учитывая широкое распространение операционной системы Windows и других программных продуктов компании в России, она получила широкое распространение и используется в персональных компьютерах (ПК), работающих на этой платформе. Текст, созданный в одной кодировке, совершенно по-другому выглядит и не читается в другой. Например, коду 222 соответствуют разные символы в разных кодировках:
•
КОИ-8 (операционная система UNIX) — ч;
•
Windows-1251 (операционная система Windows) — Ю;
•
ISO (стандарт для русского языка международной организации по стандартизации
ISO) — О.
Последним стандартом в области кодирования текстовой информации считается
16-разрядный универсальный международный код Unicode (UNIversal CODE), позволяющий кодировать 65 536 различных символов. Unicode охватывает 28 тыс. букв, знаков, слогов и иероглифов национальных языков мира, и 30 тыс. мест в нем зарезервировано.
Кодирование графических данных.
Графическое изображение при его увеличении может быть представлено в виде мельчайших точек, которые образуют характерный узор — растр. Таким образом, любое изображение можно закодировать с помощью координат точек, имеющих индивидуальную яркость. Любое черно-белое изображение можно передать с помощью
17 256 градаций серого цвета (от белого до черного), тем самым яркость каждой точки черно-белого изображения можно закодировать 8-разрядным двоичным числом — одним байтом.
Для кодирования цветных графических изображений применяется принцип декомпозиции (разложения) цвета на основные составляющие: красный (Red), зеленый
(Green) и синий (Blue). Этот принцип базируется на том, что любой цвет можно получить путем смешения трех указанных цветов. Система кодирования по первым буквам названий основных смешиваемых цветов называется системой RGB и описывает поведение аддитивной цветовой модели, свойства которой иллюстрируют при помощи цветовых кругов (рисунок 1.1). Если для кодирования яркости каждого составляющего цвета использовать 256 градаций (8-разрядное число), как это принято для черно-белого изображения, то для кодирования цветной точки растра достаточно 24-разрядного двоичного числа.
Такой режим представления цветной графики называется полноцветным (True
Color) и позволяет зафиксировать около 16,5 млн различных цветовых оттенков при помощи 3 байт. Каждому из основных цветов можно поставить в соответствие дополнительный цвет, т.е. цвет, дополняющий основной до белого. К дополнительным цветам относятся: голубой (Cyan), пурпурный (Magenta) и желтый (Yellow).
Принцип декомпозиции применим и для дополнительных цветов, т.е. любой цвет может быть получен путем их смешения. Такой метод кодирования цвета применяется в полиграфии, где используется дополнительно еще и четвертая краска — черная (Вlack).
Эта система кодирования носит название СMYK (черный цвет указан в названии последней буквой своего названия для того, чтобы не путать его в сокращениях и аббревиатурах с синим — Blue). Данный режим представления графики использует 32 разряда и тоже называется полноцветным (True Color). Если уменьшить количество двоичных разрядов, используемых для кодировки каж- дой точки, в два раза, то можно сократить объем данных, но диапазон цветов при этом уменьшится до 65 536 оттенков.
Такое кодирование цветной графики 16-разрядными двоичными числами называется режимом High Color.
Рисунок 1.1 - Система RGB в виде цветовых кругов
При работе с цветной графикой применяется индексный метод кодирования. Здесь код каждой точки растра хранит не цвет, а только его номер (индекс) в некоей справочной таблице, называемой палитрой, которая должна обязательно прикладываться к графическим данным.
Графическая информация на экране дисплея формируется из точек (пикселей).
Пиксел — от picture element, что означает элемент изображения. В современных
18 компьютерах разрешающая способность (количество точек на экране дисплея) зависит от видеоадаптера и может меняться программно.
Цветные изображения могут иметь различные режимы: 16 цветов, 256 цветов, 65 536 цветов (High Color), 16 777 216 цветов (True Color).
Таким образом, например, для режима High Color на один пиксель приходится 16 бит памяти и при разрешающей способности экрана 800 × 600 точек требуемый для хранения его изображения объем видеопамяти составит V = 2 байта · 480000 = 960 000 байт = 937,5 Кбайт. Аналогично рассчитывается объем видеопамяти, необходимый для хранения битовой карты изображения при других видеорежимах. В видеопамяти компьютера хранится битовый план, представляющий собой двоичный код изображения, который считывается в соответствии с частотой кадровой развертки и отображается на экране монитора.
Кодирование звуковой информации.
Звук — непрерывный сигнал. При двоичном кодировании аналогового звукового сигнала непрерывный сигнал дискретизируется, т.е. заменяется серией отдельных выборок с заданной периодичностью. Качество двоичного кодирования зависит от двух параметров: количества распознаваемых дискретных уровней сигнала и количества выборок в секунду. Периодичность выборок определяется частотой дискретизации.
Оцифрованный звуковой сигнал соответствует исходному аналоговому сигналу в том случае, если частота дискретизации не меньше удвоенной частоты наивысшей гармоники этого исходного сигнала. Человек слышит звуки в диапазоне от 20 Гц до 20 кГц, поэтому максимальная частота дискретизации должна быть не менее 40 кГц.
Одновременно с дискретизацией осуществляется квантование отсчетов по амплитуде — измерение мгновенных значений амплитуды и преобразование их в цифровой код. Точность измерения зависит от количества разрядов кодового слова. При длине кодового слова 8 бит количество градаций амплитуды составляет 256, при 16 битах
— 65 536. На рисунке 1.2 показан процесс дискретизации и квантования аналогового сигнала 3-разрядными числами.
Рисунок 1.2 - Дискретизация по времени и квантование по уровню аналогового сигнала
Для стереозвука дискретизация и квантование выполняются отдельно и независимо для левого и правого каналов. Для записи и воспроизведения звука в компьютерах используются звуковые карты, которые обеспечивают 8- или 16-битные выборки.
Качество звука в дискретной форме может быть плохим (качество радиотрансляции) при 8 битах и 5,5 кГц и достаточно высоким при 16 битах и 44 кГц.
Объем аудиофайла с длительностью звучания 1 с при хорошем качестве звука составит V
= 16 бит · 44 000 = 88 Кбайт. Для уменьшения объема хранения аудиоинформации
19 применяют методы компрессии (сжатия), уменьшающие объем без ухудшения качества до 20% первоначального.
При генерировании звучания различных музыкальных инструментов используются синтезаторы, применяющие такие методы, как метод частотной модуляции
(FM-синтез) и таблицы волн (WТ-синтез).
Кодирование видеоинформации.
Видеоинформация формируется в результате организации потокового видео — последовательности «движущихся изображений». Оцифровка видеофрагмента связана с проблемами обеспечения очень больших скорости обмена и объема данных. Проблема повышения скорости обмена решается путем разработки быстродействующих накопителей данных. Для уменьшения объема данных, содержащихся в видеопотоке (до
9 Мб/с), для записи информации в ЭВМ обычно применяют кодирование со сжатием потока данных. Размер файла сжатого дискретного неподвижного изображения зависит от четырех параметров: площади изображения, разрешения, числа битов, необходимых для представления пикселя, и коэффициента сжатия. В видеофильме к этому еще добавляется число образующих его неподвижных изображений. Выбор коэффициента сжатия — компромисс между пропускной способностью системы и качеством восстанавливаемого изображения. Чем выше коэффициент сжатия, тем ниже качество изображения. Поэтому выбор указанных параметров обосновывается технико- экономическим анализом и алгоритмом сжатия.
Существует немало технологий сжатия/восстановления изображений. Наиболее популярная предложена объединенной группой экспертов в области фотографии (Joint
Photographic Experts Group, JPEG) и позволяет сократить размеры графического файла в
10—12 раз. Для сжатия видеоинформации применяют технологию стандарта MPEG
(Motion Picture Expert Group).
Алгоритм MPEG преобразует изображение в поток сжатых данных, учитывая то, что человек, видящий движущийся объект, сосредоточивает внимание на нем, а неподвижный фон воспринимает в меньшей степени. Это позволяет выделять меняющиеся и «замороженные» фрагменты в кадре: актер движется, а декорация не меняется, что позволяет экономить на размере информации, основную картинку оцифровать один раз, а далее фиксировать и передавать только изменения. Видеоформат
MPEG-1, созданный в конце 1980-х гг. и использовавшийся в Video-CD, уступил место более качественному MPEG-2, а новый стандарт MPEG-4, разработанный фирмой
Microsoft в 1999 г., и его модификация DivX позволили размещать видеофильм хорошего качества на обычном компакт-диске.
Мультимедиаинформация — сочетание текстовой, звуковой, графической, видеоинформации, представляемой на экране компьютера или мультимедиапроектора.
Мультимедиа- информация обладает огромными объемами, поэтому сжимается программами сжатия, а перед воспроизведением восстанавливается, как говорят, «на лету» по мере поступления потока данных. Мультимедийные компьютерные программы позволяют формировать параллельные потоки информации: текстовой, визуальной и звуковой.
Вопрос 5. Измерение информации
Измерение информации может рассматриваться как определение ее количества и объема данных. В зависимости от формы адекватности информации эти параметры имеют разную интерпретацию.