Файл: Операции, производимые с данными (данные и сообщения).pdf
Добавлен: 22.04.2023
Просмотров: 111
Скачиваний: 1
СОДЕРЖАНИЕ
Введение.
Данные – составная часть информации, представляющая собой зарегистрированные сигналы. При этом физический метод регистрации может быть любым: механическое перемещение физических тел, изменение электрических, магнитных, оптических характеристик, химического состава и (или) характера химических связей, изменение состояния системы и многое другое.
В соответствии с методом регистрации данные могут храниться и транспортироваться на носителях различных видов. Ранее самым распространенным носителем данных являлась бумага. На бумаге данные регистрируются путем изменения оптических характеристик ее поверхности. Регистрация данных путем изменения химического состава поверхностных веществ носителя широко используется в фотографии. На биохимическом уровне происходит накопление и передача данных в живой природе. Изменение оптических свойств (изменение коэффициента отражения поверхности в определенном диапазоне длин волн) используется также в устройствах, осуществляющих запись лазерным лучом на пластмассовых носителях с отражающим покрытием (CD-ROM). В качестве носителей, использующих изменение магнитных свойств, можно назвать накопители на жестких магнитных дисках. В настоящее время наиболее распространена регистрация данных путем изменения электрического состояния объекта (Flash-накопители).
В обыденной жизни информацию отождествляют с понятиями сообщение, сведения, данные, знания.
Следовательно, данные или сообщения содержат нечто такое, от чего зависит их сравнительная ценность, ради чего они собираются, передаются и обрабатываются. Именно поэтому под термином "информация" чаще всего понимают содержательный аспект данных, проводя, таким образом, различие между информацией и данными. Термин "данные" происходит от латинского слова data – факт, а термин "информация" – от латинского "informatio", что означает разъяснение, изложение.
Информация не существует сама по себе, так как она подразумевает наличие объекта (источника), отражающего информацию, и субъекта (приемника, потребителя), воспринимающего ее. Всякое событие, всякое явление служит источником информации.
2. Структуры данных.
Можно показать не один случай, где у информации видна явная структура. Наглядным примером служат книги самого разного содержания. Они разбиты на страницы, параграфы и главы, имеют, как правило, оглавление, то есть интерфейс пользования ими. В широком смысле, структурой обладает всякое живое существо, без нее органика не смогла бы существовать.
Нам приходилось сталкиваться со структурами данных непосредственно в информатике, например, с теми, что встроены в язык программирования. Часто они именуются типами данных. К таковым относятся: массивы, числа, строки, файлы и т. д.
Работа с большими наборами данных автоматизируется проще, когда данные упорядочены, то есть образуют заданную структуру. Существует три основных типа структур данных: линейная, иерархическая и табличная.
Основные структуры данных:
Линейные структуры – это хорошо знакомые нам списки. Список – это простейшая структура данных, отличающаяся тем, что адрес каждого элемента данных однозначно определяется его номером. Проставляя на отдельных страницах рассыпанной книги, мы создаем структуру списка, поскольку все студенты группы зарегистрированы в нем под своими уникальными номерами. Мы называем номера уникальными потому, что в одной группе не могут быть зарегистрированы два студента с одним и тем же номером.
Линейные структуры данных (списки) – это упорядоченные структуры, в которых адрес элемента однозначно определяется его номером.
С таблицами данных мы тоже хорошо знакомы, достаточно вспомнить всем известную таблицу умножения. Табличные структуры отличаются от списочных тем, что элементы данных определяются адресом ячейки, который состоит не из одного параметра, как в списках, а из нескольких. Для таблицы умножения, например, адрес ячейки определяется номерами строки и столбца. Нужная ячейка находится на их пересечении, а элемент выбирается из ячейки.
Табличные структуры данных (матрицы) – это упорядоченные структуры, в которых адрес элемента определяется номером строки и номером столбца, на пересечении которых находится ячейка, содержащая искомый элемент.
Нерегулярные данные, которые трудно представить в виде списка или таблицы, часто представляют в виде иерархических структур. С подобными структурами мы очень хорошо знакомы по обыденной жизни. Иерархическую структуру имеет система почтовых адресов. Подобные структуры также широко применяются в научных систематизациях и всевозможных классификациях. В иерархической структуре адрес элемента определяется путем доступа (маршрутом), ведущим от вершины структуры к данному элементу.
3. Операции с данными
В ходе информационного процесса данные очень часто преобразуются из одного вида в другой с помощью различных методов. Обработка данных включает в себя большое множество различных операций. По мере развития НТП и общего усложнения связей в обществе затраты на обработку данных постоянно растут. Во-первых, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, который также вызывает общее увеличение объемов обрабатываемых данных – это быстрые темпы появления и внедрения новых носителей данных, средств хранения и доставки данных.
В структуре возможных операций с данными можно выделить основные операции. Рассмотрим их.
3.1. Сбор данных.
Сбор данных – накопление данных с целью обеспечения достаточной полноты информации для принятия решения.
Рассмотрим систему сбора данных. (ССД; Data acquisition, DAS, DAQ) — комплекс средств, предназначенный для работы совместно с персональным компьютером, либо специализированной ЭВМ и осуществляющий автоматизированный сбор информации о значениях физических параметров в заданных точках объекта исследования с аналоговых и/или цифровых источников сигнала, а также первичную обработку, накопление и передачу данных.
Совместно с персональной ЭВМ, оснащенной специализированным программным обеспечением, система сбора данных образует информационно-измерительную систему (ИИС). ИИС — это многоканальный измерительный прибор с широкими возможностями обработки и анализа данных. На основе ИИС могут быть построены различные автоматизированные системы управления (АСУ), среди которых: информационно-логические комплексы (их называют АСУ технологическими процессами — АСУ ТП), информационно-вычислительные комплексы (автоматизированная система научных исследований — АСНИ), информационно-диагностические комплексы и информационно-контролирующие системы.
По способу сопряжения с компьютером системы сбора данных можно разделить на:
• ССД на основе встраиваемых плат сбора данных со стандартным системным интерфейсом (наиболее распространен интерфейс PCI).
• ССД на основе модулей сбора данных с внешним интерфейсом (RS-232, RS-485, USB).
• ССД, выполненные в виде крейтов (магистрально-модульные ССД — КАМАК, VXI).
• Группы цифровых измерительных приборов (ЦИП) или интеллектуальных датчиков. Для их организации применяются интерфейсы: GPIB (IEEE-488), 1-wire, CAN, HART.
По способу получения информации ССД делятся на:
• сканирующие,
• мультиплексные (мультиплексорные, иногда говорят «многоточечные»),
• параллельные,
• мультиплицированные.
Последний тип ССД практически не используется в силу своего исключительно низкого быстродействия. Единственное достоинство ССД этого типа — относительная простота — полностью нивелируется современными технологиями изготовления интегральных схем.
Типовая система сбора данных является мультиплексной и содержит в себе следующие узлы: датчики, аналоговый коммутатор, измерительный усилитель, аналого-цифровой преобразователь, контроллер сбора данных, модуль интерфейса. Также ССД часто оснащаются цифровыми линиями ввода-вывода и цифро-аналоговым преобразователем (ЦАП).
В качестве примера можно привести систему радиоэлектронного оборудования автомобиля с интерфейсом CAN.
3.2. Формализация данных
Формализация данных – приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности.
Лингвистика любого современного языка абсолютно не совпадает с выражением логических форм или природой мышления. Таким образом, логика сама по себе вынуждена использовать некие понятия, чтобы описать то или иное явление. Так и возникает относительное понятие формальности происходящего.
Суть формализации сводится к тому, чтобы описать или предопределить некие свойства объекта или процесса (даже не существующего на данный момент) и спрогнозировать его применение в случае появления в реальном мире. Для начала рассмотрим как данное понятие применяется в компьютерных технологиях.
Метод формализации такого типа является обработкой начально заданных условий, которые позволяют с достаточно высокой степенью точности определить дальнейшее поведение объекта или процесса.
По такому принципу работают практически все метеослужбы. Имея компьютерную модель циклона, можно спрогнозировать его цикл и мощность над сушей или над водным пространством.
Основные методы формализации – это прогнозирование и моделирование. Применяются такие технологии исключительно для получения конечных данных об объектах или процессах, которые не известны, но их можно предположить и с высокой точностью рассчитать.
Результатом формализации является получение анализа действительного предсказуемого события, которое последует после того, как исследуемая технология будет применена на практике или определенный природный процесс войдет в стадию реального проявления.
Примером можно назвать тестирование новых машин, проводимое автомобильными концернами, либо разработка новых конструкций самолетов. Основной метод формализации в данном случае заключается в том, что сначала все они проходят виртуальный тест, и лишь после получения положительных результатов опытные образцы запускаются в производство для тестирования в реальных условиях.
3.3. Фильтрация данных
Фильтрация данных – отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать.
С помощью фильтров пользователь может в удобной для себя форме выводить или удалять (скрывать) записи списка. В отличие от сортировки данные при фильтрации не переупорядочиваются, а лишь скрываются те записи, которые не отвечают заданным критериям выборки. Отобранные записи можно форматировать или удалять, копировать в отдельную область таблицы, распечатывать, а также использовать для последующих вычислений или построения диаграмм.
В качестве примеров можно привести работу с такими программными продуктами как MS Excel, 1С-Предприятие.
3.4. Сортировка данных
Сортировка данных [data sorting, ordering] — один из этапов обработки данных, упорядочение элементарных данных в последовательности, определяемой значениями некоторых признаков, называемых ключами сортировки. Например, расположение записей сортируемого массива данных по возрастанию или уменьшению значений величин, содержащихся в массиве. Сортировка массивов данных существенно ускоряет их дальнейшую обработку.
Обычно она производится так: сначала множество строк сортируется по первому символу каждой строки, затем каждое подмножество строк, имеющих одинаковый первый символ, сортируется по второму символу, и так до тех пор, пока все строки не будут упорядочены.
В MS Excel и MS Access данную операцию можно проводить очень быстро, а также возможно одновременное использование нескольких ключей.
Также существуют алгоритмические способы сортировки.
Алгоритм сортировки — это алгоритм для упорядочивания элементов в списке. В случае, когда элемент списка имеет несколько полей, поле, служащее критерием порядка, называется ключом сортировки. На практике в качестве ключа часто выступает число, а в остальных полях хранятся какие-либо данные, никак не влияющие на работу алгоритма. Наиболее известный алгоритмический способ сортировки – «сортировка пузырьком».
3.5. Группировка данных
Группировка данных – объединение данных по заданному признаку с целью повышения удобства использования; повышает доступность информации. С помощью группировки можно выявить влияние отдельных единиц на средние итоговые показатели.
В зависимости от степени сложности массового явления и задач анализа - группировки могут производиться по одному или нескольким признакам: