Файл: Диалектическое единство данных и методов в информационном процессе (Основные понятия информации).pdf
Добавлен: 29.03.2023
Просмотров: 104
Скачиваний: 2
Введение
Согласно доклада аналитической фирмы IDC «Эра данных 2025» количество данных на планете будет, как минимум, удваиваться каждые два года вплоть до 2020 года. К 2025 году объем всех данных во всем мире году составит 163 зеттабайт (ЗБ) [1]. Это в 10 раз больше, чем общий объем данных по состоянию на 2016 год.
Так как 1 зеттабайт равен 1021 байтов, то общий объем информации, которые человечество накопит уже меньше чем через 5 лет, составит 163*1021 байтов.
Данные непрерывно накапливаются практически в любой сфере человеческой жизни. Сюда входит любая отрасль, связанная либо с человеческими взаимодействиями, либо с вычислениями. Это и социальные медиа, и медицина, и банковская сфера, а также системы устройств, получающие многочисленные результаты ежедневных вычислений. Например, астрономические наблюдения, метеорологические сведения и информация с устройств зондирования Земли.
Информация со всевозможных систем слежения в режиме реального времени также поступает на сервера той или иной компании. Телевидение и радиовещание, базы звонков операторов сотовой связи – взаимодействие каждого конкретного человека с ними минимально, но в совокупности вся эта информация становится большими данными.
Подсчитано, что 90% всех данных в мире было создано за последние несколько лет. Такая захватывающая перспектива ошеломляет и даже страшно представить, что будет дальше.
Тридцать пять лет назад, еще в 1983 году, самые большие жесткие диски хранили около 10 МБ данных. Сегодня этого едва хватит, чтобы хранить две или три mp3-песни
Технологии и методы обработки данных стали неотъемлемыми от научно-исследовательской деятельности и коммерции. Более того, они начинают захватывать и сферу государственного управления – и везде требуется внедрение все более эффективных систем хранения и манипулирования информацией.
В данной работе мы рассмотрим проявление диалектического единства данных и методов. Это разнонаправленные тенденции, поэтому между ними неизбежно возникают противоречия, но они взаимно предполагают друг друга:
- тенденция изменчивости технологий и методов обработки данных при отсутствии тенденции упорядоченности приводит к новым требованиям к данным, уровню компетенции специалистов по работе с данными. Современные тенденции развития технологий и проблемы их внедрения будут рассмотрены в разделе «Изменение технологий вследствие изменения объема и характера данных»;
- тенденция статичности технологий и методов обработки данных при отсутствии тенденции динамичности приводит к стагнации, устареванию технологий и замедлению экономического развития- эта проблема будет подробно рассмотрена в разделе «Проблема устаревания информационных систем».
Начнем же с основных общих понятий об информации и данных.
1. Основные понятия
1.1 Основные понятия информации
Термин «информация» происходит от латинского слова «informatio», означающего «сведения, разъяснения, изложение». Несмотря на широкое распространение этого термина, не существует однозначного точного определения, что такое информация. Разные учетные определяют данное понятие по-своему, одно остается неизменным – они считают, что понятие информации сопоставимо с понятием множества в математике.
На протяжении более двух тысячелетий понимание информации определялось как передача сведений. А с развитием технических средств массовой коммуникации (телеграф, телефон, радио, телевидение и т.д.), в особенности с ростом объема передаваемых сведений, появилась необходимость количественного измерения информации [2].
Уже в 20-х годах ХХ века делались попытки измерения информации и формализовались идеи, которые далее в дальнейшем были использованы в вероятностно-статистической теории информации. Но только в 1948 году, в статье К.Э Шеннона «Математическая теория связи» было дано вероятностно-статистическое определение понятия количества информации, предложена абстрактная схема связи, сформулированы теоремы о пропускной способности, помехоустойчивости, кодировании и т.д, что позволило сформировать вероятностно-статистическую теорию информации. Данная теория является одной из наиболее развитых среди прочих теорий информации [2].
Еще несколько определений информации [3]:
Информация – это сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний (Н.В.Макарова);
Информация – это отрицание энтропии (Леон Бриллюэн);
Информация – это мера сложности структур (Моль);
Информация – это отраженное разнообразие (Урсул);
Информация - это содержание процесса отражения (Тузов);
Информация – это вероятность выбора (Яглом).
В настоящее время наука пытается найти общие свойства и закономерности, присущие многогранному понятию информация, но пока это понятие во многом остается интуитивным и получает различные смысл в различных отраслях человеческой деятельности:
1. в быту информацией называют любые данные, сведения, знания, которые кого-либо интересуют. Например, сообщение о каких-либо событиях, о чьей-либо деятельности и т.п.;
2. в технике под информацией понимают сообщения, передаваемые в форме знаков или сигналов (в этом случае есть источник сообщений, получатель (приемник) сообщений, канал связи);
4. в теории информации под информацией понимают сведения об объектах и явлениях окружающей среды, их параметрах, свойствах и состоянии, которые уменьшают имеющуюся о них степень неопределенности, неполноты знаний.
3. в кибернетике под информацией понимают ту часть знаний, которая используется для ориентирования, активного действия, управления, т.е. в целях сохранения, совершенствования, развития системы;
В 1948 американский математик Норберт Винер, "отец" современной кибернетики, в работе "Кибернетика, или Управление и связь в животном и машине", предложил такое определение:
информация - это обозначение содержания, полученного из внешнего мира в процессе нашего приспособления к нему и приспособления к нему наших чувств.
Люди обмениваются между собой информацией в виде речи, текстов, жестов, взглядов, изображений, цифровых данных – в виде информационных сообщений. Одно и то же сообщение может содержать субъективно разное количество информации для разных людей в зависимости от опыта участников диалога, от их интереса к обсуждаемой теме, и от уровня понимания содержания сообщения. Сообщение на иностранном языке понятно только для тех, кто владеет данным языком, для остальных данное сообщение окажется не несущим никакой новой информации. Также не несет никакой новой информации и сообщение, если его содержание непонятно или уже известно. Таким образом, информационная ценность какого-либо сообщения заключается в тех новых сведениях, которые в нем содержатся, в уменьшении незнания.
В компьютерной обработке данных под информацией понимают последовательность символических обозначений (букв, цифр, закодированных графических образов и звуков и т.п.), которая несет смысловую нагрузку и представлена в виде, который компьютер может обрабатывать. Каждый новый символ такой последовательности увеличивает информационный объем сообщения [3].
1.2 Свойства информации и ее носители
Рассмотрим, какими свойствами обладает информация [3]
1. полнота — свойство информации исчерпывающе, для данного потребителя, характеризовать отображаемый объект или процесс. Информация является полной, если ее достаточно для приятия решения. Принятие решения затягивается или является ошибочным. Если информация неполная, или даже избыточная;
2. актуальность— способность информации соответствовать нуждам потребителя в нужный момент времени. Своевременно полученная информация может принести пользу. Не менее нежелательно и преждевременное получение информации, так как она может быть не воспринята в необходимом объеме;
3. достоверность — свойство информации не иметь скрытых ошибок. Достоверная информация может иметь тенденцию со временем становиться недостоверной, если она устареет и перестанет отражать истинное положение дел;
4. доступность — свойство информации, характеризующее возможность ее получения данным потребителем. Информация должна преподноситься в доступной форме, поэтому одни и те же вопросы по-разному преподносятся в литературе различных изданий;
5. релевантность — способность информации соответствовать нуждам и запросам получателя информации;
6. защищенность — свойство, характеризующее невозможность несанкционированного использования или изменения информации;
7. эргономичность — свойство, характеризующее удобство формы или объема информации с точки зрения данного потребителя.
Информация – это особый вид ресурса. При этом под «ресурсом» понимается запас некоторых знаний о материальных предметах, о характеристиках предмета. Но в отличие от ресурсов, связанных непосредственно с материальными предметами, информационные ресурсы являются неистощимыми и предполагают совершенно другие методы воспроизведения и актуализации, чем материальные ресурсы.
С этой точки зрения можно рассмотреть такие особые свойства информации, как
1. запоминаемость;
2. передаваемость;
3. воспроизводимость;
4. преобразуемость;
5. стираемость.
Запоминаемость — одно из самых важных свойств информации. Запоминаемую информацию будем называть макроскопической (имея в виду пространственные масштабы запоминающей ячейки и время запоминания). Именно с макроскопической информацией мы имеем дело в реальной практике.
Передаваемость информации с помощью каналов связи, в том числе с помехами, достаточно рассмотрена в рамках теории информации К.Шеннона. В этом случае имеется способность информации к копированию, то есть имеется в виду, что информация может быть “запомнена” другой макроскопической системой и при этом остается тождественной самой себе. При копировании количество информации остается прежним.
Воспроизводимость информации тесно связана с ее свойством передаваемости и не является независимым базовым свойством. Если передаваемость означает, что пространственные отношения между частями системы, между которыми передается информация, не следует считать существенными, то воспроизводимость характеризует неиссякаемость и неистощимость информации, т.е. что при копировании информация остается тождественной самой себе.
Преобразуемость – это фундаментальное свойство информации, означающее, что информация может менять способ и форму своего существования. Копируемость - это разновидность свойства преобразования информации, при котором количество информации остается прежним. В процессах преобразования в общем случае количество информации может уменьшаться или сохраняться прежним.
Стираемость – это свойство информации, которое также не является независимым базовым свойством. Стираемость информации связана с таким преобразованием информации (передачей), при котором ее количество уменьшается и становится равным нулю.
Для выражения вышеперечисленных свойств информации, информация всегда связана с материальным носителем. При этом носителем информации могут быть:
- любой материальный предмет (бумага, камень и т.д. – тексты, рисунки, чертежи, фотографии, магнитные записи);
волны различной природы: акустическая (звук), электромагнитная (свет, радиоволна); хромосомы, посредством которых предаются по наследству признаки и свойства организмов;
2) вещество в различном состоянии: концентрация молекул в жидком растворе, температура и т.д.; запахи и вкусовые ощущения.
Подводя итоги данного раздела приведем примеры получения информации:
1) динамик компьютера издает специфический звук, хорошо знакомый пользователю. Пользователь расшифровывает данный сигнал, что пришло новое сообщение в электронной почте;
2) с вертолета пожарной охраны в глубине леса замечен густой дым — обнаружен новый лесной пожар;
3) сложный комплекс датчиков, расположенный в сейсмологически неустойчивом районе, фиксирует изменение обстановки, характерное для приближающегося землетрясения, аналогичные системы используются для своевременно реагирования на лавины в горных местностях.
В следующем разделе перейдем к рассмотрению второго базового понятия, использующегося в информатике - «данные». Так как данные – это то самое «сырье» для получения информации. Именно на основании первичных данных пользователь информационной системы извлекает для себя важную информацию.