Добавлен: 17.05.2023
Просмотров: 66
Скачиваний: 3
Информатика как прикладная дисциплина занимается:
- изучением закономерностей в информационных процессах (накопление, переработка, распространение);
- созданием информационных моделей коммуникаций в различных областях человеческой деятельности;
- разработкой информационных систем и технологий в конкретных областях и выработкой рекомендаций относительно их жизненного цикла: для этапов проектирования и разработки систем, их производства, функционирования и т.д.
Главная функция информатики заключается в разработке методов и средств преобразования информации и их использовании в организации технологического процесса переработки информации.
Задачи информатики состоят в следующем:
- исследование информационных процессов любой природы;
- разработка информационной техники и создание новейших технологий переработки информации на базе полученных результатов исследования информационных процессов;
- решение научных и инженерных проблем создания, внедрения и обеспечения эффективного использования компьютерной техники и технологии во всех сферах общественной жизни.
МЕТОДЫ И ЕДИНИЦЫ ИЗМЕРЕНИЯ ИНФОРМАЦИИ
Существует множество систем представления данных. В информатике и вычислительной технике это двоичный код. Код, в котором каждый разряд принимает одно из двух возможных значений, обычно обозначаемых цифрами 0 и 1. Наименьшей единицей такого представления является бит. [12] Каждый разряд двоичного числа несет информацию в 1 бит.
Для удобного измерения информации были придуманы другие, более крупные единицы: байт, килобайт, мегабайт, гигабайт, терабайт, петабайт. Байт состоит из 8 бит. 1024 байта образуют килобайт, 1024 килобайта – мегабайт. Таким образом, можно сделать вывод, что число 2^10(1024) выступает множителем для перехода на более высокий разряд измерения информации.
Существует вероятностный подход к определению количества информации. Он подразумевает собой использование законов теории вероятности. Отличным примером будет задача с монеткой, где шанс выпадения «орла» или «решки» при падении одинаков. Обозначим исход броска монеты сигналом, содержащим 0 и 1 соответственно. Зная, что каждый разряд двоичного кода несет 1 бит, можем сделать вывод, что сообщение с информацией о выпадении «орла» или «решки» занимает объем 1 бита. Учитывая, что для сообщения с результатом исхода двух равновероятных событий понадобился 1 бит информации, можно сделать вывод: для сообщения содержащего исход четырёх равновероятных событий понадобится 2 бита.
Из вышесказанного можно вывести формулу для расчёта длины любого сообщения в виде двоичного кода:
2 ͥ = N,
где N – количество возможных исходов;
i – количество бит необходимых для кодирования информации.
Данную формулу изобрёл американский инженер Р. Хартли в 1928 г. в своих попытках создания способов измерения информации.
Второй способ определения информации заключается в алфавитном подходе. Такой подход связывает объем информации с мощностью языка кодирования. Для полного понимания этого способа возьмем в пример алфавит мощностью 256 символов, который часто используется в текстовых редакторах. Представим, что все символы алфавита встречаются равновероятно. Зная описанную выше формулу Хартли, можем вычислить, сколько несет информации один символ:
2 ͥ =N,
2 ͥ =256,
где место N – мощность алфавита, в нашем случае 256 символов;
а i – количество информации в одном символе;
,
таким образом, один символ данного алфавита несёт 8 бит информации.
Если представить, что весь код состоит из Kсимволов, то при таком подходе полный объем информацииI в нем вычисляется по формуле:
I = i * K,
где i – количество информации в одном символе;
а K – количество символов в сообщении.
ОПЕРАЦИИ С ДАННЫМИ
Обработка данных включает в себя множество различных операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе трудозатраты на обработку данных неуклонно возрастают. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, тоже связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки. В структуре возможных операций с данными можно выделить следующие основные:
1)сбор данных — накопление информации с целью обеспечения достаточной полноты для принятия решений;
2) формализация данных — приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;
3) фильтрация данных — отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;
4) сортировка данных — упорядочение данных по заданному признаку с целью удобства использования; повышает доступность информации;
5) архивация данных — организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;
6) защита данных — комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;
7) транспортировка данных — прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя — клиентам;
8) преобразование данных — перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированы только на передачу аналоговых сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства — телефонные модемы.
Приведенный здесь список типовых операций с данными далеко не полон. Миллионы людей во всем мире занимаются созданием, обработкой, преобразованием и транспортировкой данных, и на каждом рабочем месте выполняются свои специфические операции, необходимые для управления социальными, экономическими, промышленными, научными и культурными процессами. Полный список возможных операций составить невозможно, да и не нужно. Сейчас нам важен другой вывод: работа с информацией может иметь огромную трудоемкость, и ее надо автоматизировать. [13]
ПРОЦЕССЫ ПРЕОБРАЗОВАНИЯ ДАННЫХ
В настоящее время большая часть данных проходит через множество информационных систем. В каждой из них информация хранится, передается в другие системы, обрабатывается в разных формах. Процесс преобразования информации из одной формы в другую называется кодированием.
Кодирование – процесс представления информации в виде кода. При кодировании могут ставиться разные цели и соответственно применяться разные методы. Наиболее распространенные цели кодирования - это экономность, повышение скорости передачи или обработки, надежность, сохранность, удобство физической реализации и восприятия. [10] Код–набор условных обозначений для записи или передачи заранее определенных понятий. Соответствие между набором букв и числами называется кодировкой символов. При кодировании группа символов заменяется одним символом или наоборот. Кодирование существует равномерное и неравномерное. В первом случае, все символы кодируются равными отрезками, во втором – разные символы кодируются разной длиной отрезков, что позволяет усложнить декодирование. Коды неравномерной длины в технике не применяются. Длиной кода называют количество знаков используемых при кодировании. Например, в русском языке 33 символа, а длина кода (слова) может составлять один, два символа.
Существует также операция, обратная кодированию, которая называется декодированием и представляет собой процесс восстановления информации из ее представления в закодированном виде к исходному.
В вычислительной технике данные обрабатываются только в числовой форме, поэтому в компьютерных сетях любую полученную информацию кодируют в самый универсальный и распространенный формат – двоичный код, который использует знаки двоичного алфавита.
ТИПЫ КОДИРОВАНИЯ ИНФОРМАЦИИ
Под кодированием в узком смысле понимают отображение дискретных сообщений сигналами в виде определенных сочетаний символов. [6] Представление графической информации в компьютере делится на растровый и векторный форматы, кодируются они разными способами.
Растровый способ кодирования подразумевает, что рисунок разделяется на множество пикселей, где каждому пикселю соответствует определённый код его цвета, информация о котором, хранится в памяти компьютера. Цветная картинка рождается путем смешивания на экране трех основных цветов: красного, зеленого, синего. Эта цветовая модель называется RGBсогласно первым английским буквам названия этих цветов. В этой модели яркость кодируется целым числом от 0 до 255. При этом цвет – это яркость трёх цветов R,G,B. Например, цвет (0;0;0) – чёрный, а (255;255;255) – белый. Одним из недостатков растрового формата считается необходимость иметь большой объем памяти на компьютере. Главное преимущество - универсальность RGB, этой моделью можно закодировать любое изображение.
Векторный способ заключается в сохранении и фиксировании математических параметров, формул, цветов контура и заливки для каждого отдельного геометрического объекта (линии, прямоугольника, окружности и т.д.) в виде цифр. Из этих отдельных простейших фигур и состоит векторное изображение. Как правило, векторные изображения весят меньше чем растровые. Векторная графика, в отличие от растровой, не используется в работе с высококачественными художественными фотографиями, рисунками, картинами.
Акустическое кодирование представляет собой преобразование аналоговой формы звука в цифровой формат. Звук – это волна с непрерывно меняющейся амплитудой и частотой. Чем больше амплитуда сигнала, тем громче звук для человека. Высота тона определяется частотой сигнала. В процессе кодирования продолжительность звуковой волны разбивается на отдельные временные участки и для каждого такого участка устанавливается определенная величина амплитуды, которой присваивается код уровня громкости.
Текстовое кодирование совершается в момент нажатия на клавиши символов на клавиатуре. В оперативную память символы попадают в двоичном коде. Обычно количество информация о символе занимает 1 байт, т.е. 8 бит. Используя двоичную систему можно закодировать 256 символов. Кодирование заключается в том, что каждому символу присваивается отдельный двоичный код от 00000000 до 11111111. Таким образом, человек видит их в привычном виде, а компьютер получает информацию в двоичном коде.
Универсальная система кодирования текстовых данных подразумевает кодировку не восьмиразрядными двоичными числами, а числами с большим количеством разрядов, следовательно, увеличивается диапазон возможных значений кодов. Такая система, основанная на 16-рязрядном кодировании символов, получила название универсальной — UNICODE. Шестнадцать разрядов позволяют обеспечить уникальные коды для 65 536 различных символов — этого поля достаточно для размещения в одной таблице символов большинства языков планеты. Несмотря на тривиальную очевидность такого подхода, простой механический переход на данную систему долгое время сдерживался из-за недостаточных ресурсов средств вычислительной техники (в системе кодирования UNICODE все текстовые документы автоматически становятся вдвое длиннее).
Целые числа кодируются в двоичный код способом деления до тех пор, пока частное не будет равно единице. Множество остатков каждого деления, записанное справа налево вместе с последним частным, и образует двоичный код этого десятичного числа. Для кодирования целых чисел от 0 до 255 достаточно 8 бит. 16 бит позволяют закодировать целые числа от 0 до 65535.