Добавлен: 11.01.2024
Просмотров: 184
Скачиваний: 6
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Министерство образования и науки Республики Тыва
Государственное бюджетное профессиональное образовательное учреждение
Республики Тыва
«Тувинский техникум народных промыслов»
ДИПЛОМНАЯ РАБОТА
на тему
«Методы сжатия цифровой информации»
Выполнил: студентка 1 курса
Хертек А.М.
Специальности: мастер по обработке цифровой
информации
Мастер п.о.: Саая С-Х.В.
Оценка_________________
Кызыл 2020
Содержание
Введение 3
1. Теоретические основы понятия «информация» 5
1.1. Понятие информации и ее свойства 5
1.2. Виды информации и ее кодирование 8
1.Методы сжатия информации 12
2.1. Методы сжатия информации без потерь 12
2.1.1. Кодирование длин сессий 13
2.1.2. Алгоритм LZ78-LZW84 15
2.1.3. Алгоритм LZW 17
2.1.4. Алгоритм FLAC 19
2.1.5. Код Хаффмана 22
2.1.6. Алгоритм PPM 28
2.1.7. Алгоритм BWT 29
2.1.8. Алгоритм арифметического кодирования 30
2.2. Методы сжатия информации с потерями 32
2.2.1. Алгоритм JPEG 33
2.2.2. Алгоритм МРЗ 34
2.2.3. Алгоритмы МРЕG 35
Заключение 36
Список использованных источников 37
Введение
С ростом использования компьютеров в мире бизнеса и персональных компьютеров объём данных, хранящихся в Интернете, значительно вырос. Данное явление привело к необходимости сжатия данных. Передача информации с помощью Интернета имеет решающее значение для всех типов бизнес-структур на всех уровнях. По мере развития технологий скорость передачи данных также может быть достигнута путём улучшения алгоритмов сжатия, через которое передаются данные, или путём изменения формата данных, чтобы данные могли передаваться с низкой стоимостью и максимальной скоростью. Сжатие данных также полезно, поскольку оно помогает снизить потребление дорогостоящих ресурсов, таких как пространство на жёстком диске или пропускная способность передачи данных.
Сжатие данных является очень важной темой для многих приложений. Многие методы сжатия данных были изучены в течение 40 лет. Хотя алгоритмы изменились и улучшились по эффективности, они играют важную роль в повседневной обработке компьютерного бизнеса и в компьютерной науке в целом. Поскольку мы продолжаем использовать компьютеры практически для всех наших задач, потребность в сжатии данных растет с каждым днем. В последние годы компании начали предлагать услуги резервного копирования пользователям персональных компьютеров. Компьютерные данные сжимаются для всего, что мы делаем, от банковских операций до отправки текстовых сообщений. А без технологии сжатия данных все это было бы невозможно. Но поскольку сжатие данных достигло значительных успехов, эта услуга возможна без использования большого пространства на жестком диске.
Объектом данной дипломной работы является методы сжатия информации.
Предмет - анализ и определение основных методов сжатия цифровой информации.
Целью данной дипломной работы является определение и подробное изучение основных методов сжатия цифровой информации.
В соответствии с поставленной целью в работе были выявлены следующие задачи:
— рассмотрение теоретических основ понятия «информация»;
— определение основных типов методов сжатия информации;
— исследование методов сжатия без потерь и с потерями.
Работа состоит из введения, двух глав, заключения и списка литературы.
1. Теоретические основы понятия «информация»
1.1. Понятие информации и ее свойства
Ключевым понятием информатики является понятие информации, с которым мы сталкиваемся ежедневно, однако единого се определения до сих пор не существует. Поэтому вместо определения обычно используют понятие об информации. Первоначально под информацией (от дат. infbrmatio — разъяснение. изложение, сообщение, осведомление) понимались сведения, передаваемые людьми различными способами: устно, с помощью сигналов или технических средств.
Мы часто слышим и используем термин «информация», но редко задумываемся, что же это такое на самом деле.В науке есть такое понятие, как энтропия — мера неопределенности. Фактически информация уменьшает энтропию, так как увеличивает объем наших знаний. Для того чтобы это уяснить, введем понятие сообщения. Вот два сообщения:
1. В данный момент вы читаете учебник.
2. Основным запоминающим элементом компьютера является релаксационная электронная схема, называемая триггером.
Первое сообщение не несет какой-либо новизны, не сообщает ничего нового. Во втором случае сообщение содержит новизну, так как раньше вы этого не знали. А если второе сообщение передать инженеру по компьютерной технике, будет ли оно содержать для него новизну? Конечно, нет. Для разных приемников сообщений одно и то же сообщение может содержать, а может и не содержать элемент новизны.
Федеральный закон от 27.07.2006 № 149-ФЗ «Об информации, информатизации, информационных технологиях и о защите информации» определяет информацию следующим образом.
Информация — сведения (сообщения, данные) независимо от формы их представления [2].
Информатизация — организационный социально-экономический и научно-технический процесс создания оптимальных условий для удовлетворения информационных потребностей и реализации прав граждан, органов государственной власти, органов местного самоуправления, организаций, общественных объединений на основе формирования и использования информационных ресурсов.
Основные понятия, определения и термины информатики также определяются ГОСТ 15971—90 «Системы обработки информации.
Термины и определения», согласно которому, информация — это сведения о фактах, концепциях, объектах, событиях и идеях, которые в данном контексте имеют вполне определенное значение. Отметим, что информация — это не просто сведения, а сведения нужные, имеющие значение для лица, обладающего ими. В этих определениях информации отражены основные важные свойства понятия информации.
Во-первых, информация не является материальным объектом, ее передают от одного человека к другому, при этом первый ее не утрачивает. В результате передачи оба эти человека будут владеть переданной информацией. Информация — единственный ресурс, который при передаче не уменьшается, а только увеличивается.
Во-вторых, для передачи информация должна быть представлена на каком-нибудь материальном носителе.
В-третьих, содержание информации должно быть неизменным при ее переносе с одного носителя информации на другой.
Сообщение от источника к приемнику передается в материально-энергетической форме (электрический, световой, в виде звуковых сигналов и т.д.). В зависимости от вида сигнала, определяемого свойствами передающего устройства, различают непрерывную (аналоговую) и дискретную (цифровую) информацию.
Источником аналоговой информации обычно являются различные природные объекты (например, температура, давление и влажность воздуха), объекты технологических производственных процессов (например, нейтронный поток в активной зоне, давление и температура теплоносителя в контурах ядерного реактора) и др.
Информационные сообщения, используемые человеком, имеют характер дискретных сообщений, например сигналы тревоги, передаваемые посредством световых сообщений, телеграфные сигналы, языковые сообщения, передаваемые в письменном виде или с помощью звуковых сигналов и др.
Человек воспринимает сообщения при помощи органов чувств, и, как правило, в основном это непрерывная информация, а вот логическое мышление человека имеет, скорее, дискретный характер.
войства информации. При работе с информацией и разработке информационных систем и технологий важно оценить свойства поступающей, хранимой и передаваемой информации
Сформулируем следующие определения свойств информации.
Адекватность— свойство информации однозначно соответствовать отображаемому объекту или явлению.
Достоверность — свойство информации не иметь скрытых ошибок.
Полнота — свойство информации исчерпывающе характеризовать отображаемый объект или процесс. ^
Доступность — свойство информации, характеризующее возможность се получения данным пользователем.
Релевантность — способность информации соответствовать запросам пользователя.
Качество информации — обобщенная положительная характеристика информации, отражающая степень ее полезности.
Актуальность информации — степень соответствия информации текущему моменту времени. Нередко с актуальностью, как и с полнотой, связывают коммерческую ценность информации,
Существуют еще и другие, менее существенные свойства информации.
Краткость и четкость информации — отсутствие в информации ненужных сведении.
Ценность — степень важности информации для решения задачи.
Понятность — выражение информации на языке, понятном чем, кому она предназначена.
Своевременность — актуальность информации и наличие в ней сведений, необходимых в данный момент для понимания и принятия решения [5].
1.2. Виды информации и ее кодирование
Виды информации. Обычно для классификации объектов одной природы используется то или иное свойство либо набор свойств объектов. Нас интересует классификация информации в плане автоматизации основных информационных процессов.
Первоначально вычислительные машины применялись только для обработки числовой информации, однако довольно быстро выяснилось, что их возможности не ограничиваются только работой с числами.
Далеко не вся информация окружающего нас мира может быть обработала компьютером, ведь пока не придумали такого компьютера, который мог бы чувствовать или наслаждаться произведениями искусства. Поэтому, говоря об информации, необходимо выделить тс се вилы, которые компьютер воспримет и позволит человеку использовать свои ресурсы для обработки, хранения и передачи такой информации.
Компьютер может работать с текстовой, числовой, табличной, графической информацией, а также со звуковой, анимационной и видеоинформацией. Также компьютер воспринимает специальную двоичную информацию.
В настоящее время практически все компьютерные технологии ограничиваются обработкой перечисленных видов информации. С развитием компьютерной техники увеличиваются объемы перерабатываемой информации. И хотя современные компьютеры могут делать очень много, все же их возможности не безграничны. Наибольший эффект от применения компьютера будет там, где оправдано его применение.
Кодирование информации — это преобразование одной последовательности сигналов в другую. Под кодированием данных понимается выражение данных одного типа через данные другого типа. Для автоматизации работы с данными, относящимися к различным типам, очень важно унифицировать их форму представления, поэтому обычно используется прием кодирования [7].
Человеческий язык — это система кодирования понятий для выражения мыслей посредством речи. Азбуки — системы кодирования компонентов языка с помощью графических символов.
Своя системы существует и в вычислительной технике. Она называется двоичным кодированием и основана на представлении данных последовательностью всего двух цифр: 0 и 1.