Добавлен: 04.04.2023
Просмотров: 98
Скачиваний: 2
Новая научная дисциплина – информатика, ставит своей целью изучение закономерностей информационных процессов, основными из которых являются:
- создание;
- прием;
- комбинирование;
- хранение;
- передача;
- копирование;
- обработка;
- поиск;
- формализация;
- деление на части;
- измерение;
- использование;
- распространение;
- упрощение;
- разрушение;
- запоминание;
- преобразование;
- сбор и т. д.
4. Представление информации
Люди имеют дело с разными видами информации. Прослушав интересную лекцию, можно записать ее в компьютер, чтобы затем воспользоваться ей. В компьютер можно поместить свою фотографию или видеосъемку о том, как вы провели отпуск. Но ввести в компьютер запах любимого парфюма или мягкость домашнего пледа нельзя никак.
Человек воспринимает аналоговую информацию с помощью органов чувств. Он стремится зафиксировать ее таким образом, чтобы она стала понятна другим. При этом одна и та же информация может быть представлена в разных формах.
Любую информацию можно представить в форме, наиболее удобной для восприятия. При этом таких представлений может быть несколько, и все эти формы будут являться различными моделями объектов, процессов или явлений.
Например, одну и ту же функцию можно представить с помощью таблицы, графика, формулы.
Представление информации в различных формах происходит в процессе восприятия окружающей среды живыми организмами и человеком, в процессах обмена информацией между человеком и человеком, человеком и компьютером (ПК), ПК и ПК и т.д. Преобразование информации из одной формы в другую (кодирование) необходимо для того, чтобы живой организм, человек или ПК могли хранить и обрабатывать информацию в удобной для него форме, на понятном для него языке.
Компьютер - это электронная машина, которая работает с сигналами. Компьютер может работать только с такой информацией, которую можно превратить в сигналы. Если бы люди умели превращать в сигналы вкус или запах, то компьютер мог бы работать и с такой информацией. У компьютера очень хорошо получается работать с числами. Он может делать с ними все, что угодно. Все числа в компьютере закодированы "двоичным кодом", то есть, представлены с помощью всего двух символов 1 и 0, которые легко представляются сигналами.
Вся информация, с которой работает компьютер, кодируется числами. Независимо от того, графическая, текстовая или звуковая информация, чтобы ее мог обрабатывать центральный процессор, она должна быть тем или иным образом представлена числами.
Информация графическая и звуковая может быть представлена в аналоговой или дискретной форме.
При аналоговом представлении информации физическая величина может принимать бесконечное множество значений. При дискретном представлении информации физическая величина может принимать конечное множество значений, при этом она изменяется скачкообразно. Примером аналогового и дискретного представления информации можно привести наклонную плоскость и лестницу. Положение тела на наклонной плоскости и на лестнице задается значениями координат X и Y. При движении тела по наклонной плоскости его координаты могут принимать бесконечное множество непрерывно изменяющихся значений из определенного диапазона, а при движении по лестнице - только конечный набор значений, которые изменяются скачкообразно.
Примером аналогового хранения звуковой информации является виниловая пластинка (звуковая дорожка меняет свою форму непрерывно), а дискретного – аудио компакт-диск, звуковая дорожка которого содержит участки с различной отражающей способностью.
Преобразование графической и звуковой информации из аналоговой формы в дискретную производится путем дискретизации, т.е. разбиения непрерывного графического изображения или непрерывного (аналогового) звукового сигнала на отдельные элементы. В процессе дискретизации производится кодирование, т.е. присвоение каждому элементу конкретного значения в форме кода.
4.1. Представление текстовых данных
Любой текст состоит из последовательности символов. Символами могут быть буквы, цифры, знаки препинания, знаки математических действий, круглые и квадратные скобки и т.д. Особо обратим внимание на символ "пробел", использующийся для разделения слов и предложений между собой. Хотя на бумаге или экране дисплея "пробел" - это пустое, свободное место, этот символ ничем не "хуже" любого другого символа. На клавиатуре компьютера или пишущей машинки символу "пробел" соответствует специальная клавиша.
Текстовая информация, как и любая другая, хранится в памяти компьютера в двоичном виде. Для этого каждому символу ставится в соответствие некоторое неотрицательное число, которое называется кодом символа, и это число записывается в память ЭВМ в двоичном виде. Конкретное соответствие между символами и их кодами называется системой кодировки.
В современных ЭВМ, в зависимости от типа операционной системы и конкретных прикладных программ, используются 8-разрядные и 16-разрядные (Windows 95, 98, NT) коды символов. Использование 8-разрядных кодов позволяет закодировать 256 различных знаков, этого вполне достаточно для представления многих символов, используемых на практике. При такой кодировке для кода символа достаточно выделить в памяти один байт. Так и делают: каждый символ представляют своим кодом, который записывают в один байт памяти.
В персональных компьютерах обычно используется система кодировки ASCII (American Standard Code for Information Interchange - американский стандартный код для обмена информации). Он введен в 1963 г. и ставит в соответствие каждому символу семиразрядный двоичный код. Легко определить, что в коде ASCII можно представить 128 символов.
В системе ASCII закреплены две таблицы кодирования базовая и расширенная. Базовая таблица закрепляет значения кодов от 0 до 127, а расширенная относится к символам с номерами от 128 до 255.
Первые 32 кода базовой таблицы, начиная с нулевого, отданы производителям аппаратных средств. В этой области размещаются управляющие коды, которым не соответствуют никакие символы языков. Начиная с 32 по 127 код размещены коды символов английского алфавита, знаков препинания, арифметических действий и некоторых вспомогательных символов.
Кодировка символов русского языка, известная как кодировка Windows-1251, была введена "извне" - компанией Microsoft, но, учитывая широкое распространение операционных систем и других продуктов этой компании в России, она глубоко закрепилась и нашла широкое распространение.
Другая распространённая кодировка носит название КОИ-8 (код обмена информацией, восьмизначный) - её происхождение относится к временам действия Совета Экономической Взаимопомощи государств Восточной Европы. Сегодня кодировка КОИ-8 имеет широкое распространение в компьютерных сетях на территории России и в российском секторе Интернета.
Международный стандарт, в котором предусмотрена кодировка символов русского языка, носит название ISO (International Standard Organization - Международный институт стандартизации). На практике данная кодировка используется редко.
Если проанализировать организационные трудности, связанные с созданием единой системы кодирования текстовых данных, то можно прийти к выводу, что они вызваны ограниченным набором кодов (256). В то же время, очевидно, что если кодировать символы не восьмиразрядными двоичными числами, а числами с большим разрядом, то и диапазон возможных значений кодов станет намного больше. Такая система, основанная на 16-разрядном кодировании символов, получила название универсальной - UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов – этого поля вполне достаточно для размещения в одной таблице символов большинства языков планеты.
Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостатков ресурсов средств вычислительной техники (в системе кодирования UNICODE все текстовые документы становятся автоматически вдвое длиннее).
Во второй половине 90-х годов технические средства достигли необходимого уровня обеспечения ресурсами, и сегодня мы наблюдаем постепенный перевод документов и программных средств на универсальную систему кодирования.
4.2. Представление изображений
Существуют два основных формата представления изображений (как неподвижных, так и движущихся): векторные и растровые.
В векторном формате изображение разделено на примитивы - окружности и сегменты окружностей, многоугольники, прямые линии, параметрические кривые, залитые определенным цветом или шаблоном, связанные области, набранные определенным шрифтом отрывки текста и т.д. Для пересекающихся примитивов задан порядок, в котором один из них перекрывает другой. У некоторых форматов, например, у PostScript, предоставлена возможность создавать собственные примитивы, похожая на то, как в языках программирования можно создавать подпрограммы. В таких форматах часто содержатся условные операторы и переменные, представляющие собой полнофункциональный, но специализированный язык программирования.
У каждого примитива есть свои геометрические координаты. Точность описания в разных форматах отличается, часто применяют числа с плавающей точкой двойной точности или с фиксированной точкой и точностью до 16-го двоичного знака.
Координаты примитивов бывают как двухмерными и трехмерными. Для трехмерных изображений предоставлен широкий выбор примитивов, в который включены также поверхности - сферы, эллипсоиды и их сегменты, параметрические многообразия и др.
Двухмерные векторные форматы хорошо подходят для представления диаграмм, чертежей, шрифта, отдельных букв шрифта и отформатированного текста. Такие изображения легко поддаются редактированию - изображения и их отдельные элементы можно масштабировать и преобразовывать самым различным образом. Примерами двухмерных векторных форматов являются всем известный формат PDF (Portable Document Format, специализированное подмножество PostScript), WMF (Windows MetaFile), PCL (Printer Control Language, система команд принтеров, которая поддерживается большинством современных лазерных и струйных печатных устройств). Пример векторного представления движущихся изображений – MacroMedia Flash. Трехмерные векторные форматы востребованы в использовании среди систем автоматизированного проектирования и генерации гиперреалистичных изображений методами трассировки лучей и т.п.
Стоит отметить, что если преобразовывать реальную сцену (например, сканирование рисунка) в векторный формат, то это представляется сложным и неразрешимым пунктом. Программы для векторизации существуют, но при этом, потребляют слишком много ресурсов, а качество картинки получается низким в большинстве случаев. Самая главная задача – это создание фотореалистичных (имитирующих фотографию) изображений векторного формата, пусть и требующего большого количества сложных примитивов. Гораздо более практичным методом достижения этих целей выступает подход к оцифровке изображений, которым пользуется большинство современных устройств визуализации: растровые дисплеи и многие печатные устройства.
В растровом формате изображение разбито на прямоугольную матрицу элементов, называемых пикселами (PICture ELement - элемент картинки), а матрица называется растром. Для каждого пиксела определена его яркость и цвет (в случае, если изображение цветное). Бывает, что во время оцифровки реальной сцены или преобразования в растровый формат (растеризации) векторных изображений, в один пиксел попадает не один элемент, его яркость и цвет усредняются с учетом занимаемой площади. При оцифровке усреднение выполняется аналоговыми контурами аналого-цифрового преобразователя.
Размер матрицы по-другому называется разрешением растрового изображения. Для устройств печати (и при растеризации изображений, предназначенных для таких устройств) обычно задан неполный размер матрицы, который соответствует всему печатному лист. Количество пикселов, которые приходятся на вертикальный или горизонтальный отрезки длиной 1 дюйм; соответствующая единица так и называется – точки на дюйм (DPI, Dots Per Inch).
Для черно-белой печати обычно достаточно 300 или 600 точек на дюйм. Однако принтеры, в отличие от растровых терминалов, не способны управлять яркостью отдельных точек, поэтому приходится прибегать к имитации изменения яркости, разбивая изображение на квадратные участки и регулируя яркость относительным количеством черных и белых (или цветных и белых при цветной печати) точек в этом участке. Для получения таким способом фотореалистичных изображений приемлемого качества 300 точек на дюйм заведомо недостаточно, и даже бытовым принтерам приходится использовать гораздо более высокие разрешения, вплоть до 2400 точек на дюйм.
Вторым параметром растрового изображения является разрядность одного пиксела, которую по-другому называют цветовой глубиной. Для черно-белых изображений достаточно одного бита на пиксел, для градаций яркости серого или цветовых составляющих изображения необходимо несколько битов. В цветных изображениях пиксел разбивается на три или четыре составляющие, соответствующие разным цветам спектра. В промежуточных данных, используемых при оцифровке и редактировании растровых изображений, цветовая глубина достигает 48 или 64 бит (16 бит на цветовую составляющую). Диапазон яркости современных Мониторов, впрочем, позволяет ограничиться 8-ю битами, т.е.256 градациями, на одну цветовую составляющую: большее количество градаций просто незаметно глазу.