Файл: Способы представления данных в информационных системах (Классификация информации в информационных системах).pdf
Добавлен: 30.06.2023
Просмотров: 136
Скачиваний: 3
СОДЕРЖАНИЕ
Глава 1. О СИСТЕМАХ БАЗ ДАННЫХ
1.1. Классификация информации в информационных системах
1.2. Модели представления данных в информационных системах
глава 2. О СПОСОБАХ ПРЕДСТАВЛЕНИЯ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ
2.1. Способы представления данных в БД Access
2.2. Способы представления данных в БД Excel
2.3. Представление данных с использованием многомерной модели представления данных
2.4. Объектно-ориентированный способ представления данных в информационных системах
ГЛАВА 3. О ПРАКТИЧЕСКОМ ПРИМЕНЕНИИ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ
3.1. Технология практического применения данных в Access
3.2. Технология практического применения данных в Excel
Количество значений, которые может принимать такое значение, бесконечно велико. Отсюда и название - непрерывное количество и непрерывная информация. Непрерывность слова четко подчеркивает основное свойство таких величин - отсутствие пробелов, пробелов между значениями, которые может принимать эта аналоговая величина.
Вторая форма представления информации называется дискретной (используется серия напряжений, каждая из которых соответствует одной из цифр представленного значения). Эти величины, принимающие не все возможные, а только достаточно определенные значения, называются дискретными (прерывистыми). В отличие от непрерывного количества, число значений дискретного количества всегда будет закончено.
Сравнивая непрерывную и дискретную формы представления информации, легко увидеть, что использование непрерывной формы для создания компьютера требует меньше устройств (каждое значение представлено одним, а не несколькими сигналами), но эти устройства будут более сложными (они должны различать значительно большее количество состояний сигнала).
Непрерывная форма представления используется в аналоговых вычислительных машинах (АВМ). Эти машины в основном предназначены для решения задач, описываемых системами дифференциальных уравнений: изучения поведения движущихся объектов, процессов и систем моделирования, решения задач параметрической оптимизации и оптимального управления. Устройства непрерывной обработки сигналов имеют более высокую скорость, они могут интегрировать сигнал, выполнять любое функциональное преобразование и так далее [8].
Однако из-за сложности технической реализации устройств выполнения логических операций с непрерывными сигналами, длительного хранения таких сигналов, их точного измерения АВМ не могут эффективно решать задачи, связанные с хранением и обработкой больших объёмов информации, которые легко решаются при использовании цифровой (дискретной) формы представления информации, реализуемой цифровыми электронными вычислительными машинами (ЭВМ).
1.2. Модели представления данных в информационных системах
Модель представления данных или модель данных - это набор допустимых типов данных и отношений между ними, ограничений и действий в отношении этих типов данных и отношений. Многие важные типы данных и отношения называются структурами данных. Модель данных является ядром базы данных [10].
Наиболее популярными являются три модели данных: иерархическая, сетевая и реляционная.
Иерархическая модель дает возможность строить БД с иерархической структурой в виде дерева.
Дерево — это связный неориентированный граф, который не содержит циклов. Обычно при работе с деревом выделяют какую-то конкретную вершину, определяют ее как корень дерева и рассматривают особо — в эту вершину не заходит ни одно ребро. В этом случае дерево становится ориентированным. Ориентация определяется от корня. Конечные вершины, то есть вершины, из которых не выходит ни одной дуги, называются листьями дерева [0].
Иерархическая модель является самой простой, поэтому исторически она появилась первой. Преимущества иерархической модели включают в себя довольно эффективное использование памяти и хорошие показатели производительности времени для операций с данными. Недостатками являются довольно сложные логические связи, определенная сложность в обработке данных и сложность включения новых объектов в заданное структурное «дерево».
Сетевая модель данных
На разработку этого стандарта большое влияние оказал американский ученый Ч. Бахман. Основные принципы модели данных сети были разработаны в середине 1960-х годов, эталонная версия модели данных сети описана в отчетах рабочей группы по языкам баз данных (COnference on DAta SYstem Languages) CODASYL (1971 г.). Сетевая модель - это структура, в которой любой элемент может быть связан с любым другим элементом. Организация данных в сетевой модели соответствует структурированию данных по версии CODASYL. В соответствии с ней описание схемы БД осуществляется на языке COBOL, а манипулирование данными — с помощью включающего языка программирования высокого уровня [6].
В каждой вершине графа хранятся экземпляры сущностей (записей) и информация о групповых отношениях с сущностями других типов. Каждая запись может хранить произвольное количество значений атрибутов (элементов данных и агрегатов), соответствующих экземпляру объекта.
Основным преимуществом сетевой модели данных является ее высокая эффективность и экономичность использования памяти. К недостаткам относится сложность понимания базовой схемы, а также сложность понимания, программирования и контроля целостности из-за допустимости установления произвольных отношений.
Реляционная модель данных была предложена математиком Э.Ф. Коддом в1970 г. Это наиболее широко используемая модель данных и единственная из трех основных моделей данных, для которых была разработана теоретическая основа с использованием теории множеств.
Информация об объектах определенного типа хранится в таблице, каждое поле (столбец таблицы), содержащее значения определенного признака объектов, и запись (строка таблицы) представляют собой описание отдельного объекта. Даже при запросе информации из одной или нескольких таблиц результат запроса представляется в виде таблицы.
При построении реляционных моделей применяется строгая математическая теория отношений. В этом случае термин отношения связан с концом таблицы [5].
Атрибут, значение которого уникально идентифицирует кортежи, называется ключом (или просто ключом). В нашем случае ключом является атрибут «Номер персонала», поскольку его значение уникально для каждого сотрудника компании. Если ключ состоит из нескольких атрибутов, он называется составным. Там может быть больше ключей; Первичный ключ является первичным ключом; его значения не могут быть обновлены.
Кроме первичного ключа в таблице могут быть вторичные ключи, называемые еще внешними ключами, или индексами.
Индекс — это поле или совокупность полей, чьи значения имеются в нескольких таблицах и которое является первичным ключом в одной из них. Значения индекса могут повторяться в некоторой таблице [6].
По первичному ключу всегда отыскивается только одна строка, а по вторичному — может отыскиваться группа строк с одинаковыми значениями первичного ключа. Ключи нужны для однозначной идентификации и упорядочения записей таблицы, а индексы для упорядочения и ускорения поиска.
Связь устанавливается посредством связи ключей, содержащих общую информацию для обоих отношений. Связь существует трех основных типов:
- один-к-одному (1:1);
- один-ко-многим (1:М);
- многие-к-одному (М:1).
глава 2. О СПОСОБАХ ПРЕДСТАВЛЕНИЯ ДАННЫХ В ИНФОРМАЦИОННЫХ СИСТЕМАХ
2.1. Способы представления данных в БД Access
При рассмотрении концепции информационного обеспечения в контексте обработки информации важна концепция данных. Данные отличаются от информации в конкретной форме представления и являются подмножеством, определяемым целями и задачами сбора и обработки информации.
Например, данные о сотрудниках организации в виде формализованных учетных карточек отдела кадров содержат только определенный перечень необходимой информации (имя, год рождения, образование, семейное положение, должность и т. д.), В отличие от огромного количества информации, которая характеризует каждого конкретного человека.
Поэтому мы определяем данные как информацию, которая отражает конкретное состояние конкретной тематической области в конкретной форме представления и содержит только наиболее значимые элементы изображения отраженного фрагмента реальности с точки зрения целей и задач сбора и обработки информации [4].
Структура данных связана с концепцией представления информации и определяется (функциональной, логической, технологической и т. д.
Структурой предметной области, сведения о которой содержат данные. В то же время данные могут быть представлены в неструктурированной форме, определяющей технологические особенности их накопления и обработки. Таким образом, можно выделить неструктурированную и структурированную форму представления данных.
В качестве примера неструктурированной формы можно привести:
-
- связный текст (т. е. документ на естественном языке, на литературном, официально-деловом и т. д.);
- графические данные в виде фотографий, картинок и прочих неструктурированных изображений.
Примерами структурированной формы данных являются:
-
- анкеты;
- таблицы;
- графические данные в виде чертежей, схем, диаграмм.
С точки зрения управления информацией в процессах создания (генерации), сбора, доставки и потребления важна концепция документированной информации или просто документа [3].
Можно сказать, что в большом количестве случаев информация появляется и появляется в образе документа, исключая ту часть информационных процессов, которые работают исключительно с данными, как, например, в автоматизированных системах управления процессами - АСУТП, где информация порождается в виде показаний датчиков (входные данные), обрабатывается, выдается и потребляется в виде управляющих сигналов (выходные данные) на технологическое оборудование [5].
Типы данных в ИС могут быть разными.
Текстовые данные
Значение каждого текстового (символьного) данного представлено совокупностью произвольных алфавитно-цифровых символов, длина которой не превышает 255 (например, 5, 40, 140).
Текстовыми данными в ИС представляют:
а) фамилии и должности людей, названия фирм, продуктов;
б) данные состоящие из совокупностей текста и чисел, например, адрес;
в) числа, не требующие вычислений, например, номер телефона, инвентарный номер, почтовый индекс [8].
Поэтому для текстового поля обязательно нужно указать минимально достаточное число знаков: 1 или 2, или 3, ..., или 20, ..., или 40, ... и т.д. до 255. В конкретном случае значением текстовых данных может быть имя файла, содержащего неструктурированную информацию.
Фактически это структурированная ссылка, позволяющая значительно расширить содержание табличной информации [7].
Данные типа МЕМО вводится в виде длинный текст или числа, например, примечания или описания: длиной до 64 000 символов
Числовое данное
Этот тип данных часто используется для представления атрибутов со значениями, из которых могут быть выполнены арифметические операции. Числовые данные, как правило, имеют дополнительные характеристики, например: 2-байтовое целое число, число с плавающей запятой (4 байта) в фиксированном формате и т. д.
- байт (информационный объем 1 байт) – допускает ввод чисел от 0 до 255;
- целое (информационный объем до 2 байта) - допускает ввод чисел от -32768 до 32767;
- длинное целое (инф. объем до 4 байта) - допускает ввод чисел от -2147483648 до 2147483647;
- одинарное с плавающей точкой (инф. объем до 4 байта) – десятичное число простой точности от -3,402823Е-38 до 3,402823Е38, т.е. число мантисса которого содержит не более семи цифр затем ставится знак Е и целое число, представляющее степень десяти;
- двойное с плавающей точкой (инф. объем до 8 байта) – десятичное число двойной точности от -1,79769313486231Е-308 до 1,79769313486231Е-308, т.е. число мантисса которого содержит не более пятнадцати цифр затем ставится знак Е и целое число, представляющее степень десяти.
- код репликации – допускает ввод чисел с информационным объемом до 16 байт;
- действительное – значения данных не должны быть мнимыми [8].
Данные типа даты или времени.
Данное типа даты задается в известном машине формате, например, ДД.ММ.ТТТТ (день, месяц, год). Кажется, что данный тип даты является частным случаем данного текста. Использование специального типа данных для информационных систем имеет следующие преимущества:
- Система способна проводить жесткий контроль, например, значение месяца может быть дискретным в диапазоне от 01 до 12.
- Существует возможность автоматического отображения формата даты в зависимости от традиций страны.
- Арифметические операции с датами значительно упрощены.