Файл: Операции, производимые с данными (Понятия информации, данных и сообщения в современной науке, технике и теории информации).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 01.04.2023

Просмотров: 128

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Полнота - количественная мера содержания в массиве всех пертинентных документов (информации), существующих на данный момент времени с точки зрения всех пользователей системы.

Пертинентность - соответствие содержания документа (информации) информационным потребностям пользователей.

Точность - количественная мера содержания в информационном массиве (системе) только пертинентных документов (информации). Этот показатель характеризует внутреннее состояние процесса сбора, его способность удовлетворять информационные запросы независимо от времени на поиски информации.

Оперативность - способность процесса сбора выполнить задачу в минимально возможное время.

Стоимость - способность процесса сбора минимизировать затраты ресурса на единицу массива информации.

Трудоемкость - способность процесса сбора минимизировать трудозатраты на единицу массива информации.

В рамках процесса сбора осуществляется структуризация информации, информационных потребностей объекта (пользователя) и выбор источника информации. Задача структуризации информации представляет системную классификацию информации по показателям удобства ее использования человеком в процессе решения практических задач и удобства обработки и хранения с использованием современных средств и методов. Такая классификация была рассмотрена при исследовании видов информации. Решение задачи структуризации информационных потребностей субъекта (пользователя) связано с формированием информационного кадастра, представляющего организованную совокупность всех данных, необходимых и достаточных для целенаправленного информационного обеспечения деятельности современного объекта.

Передача информации в широком смысле рассматривается как процесс и методы формирования и циркуляции информационного потока, который в общем, виде представляет движение структурированной информации в некоторой среде данных. Вопросы структурирования и представления информации рассмотрены в предыдущих параграфах, поэтому рассмотрим вопросы формирования среды циркуляции информационных потоков. Информационные потоки на объекте делятся на входные, внутренние и выходные. В канале телекоммуникации они могут быть разделены на односторонние и двухсторонние. Циркуляцией информационных потоков называется факт регулярного их движения между различными объектами или между различными элементами одного и того же объекта.

В существующих информационных системах различных классов в зависимости от видов используемых носителей информации и средств обработки можно выделить: устную передачу при непосредственном общении; передачу бумажных носителей с помощью фельдъегерско-почтовой связи; передачу машиночитаемых носителей (магнитных карт, перфокарт, перфолент, магнитных дисков и лент); передачу в виде различных электрических сигналов по каналам телекоммуникаций, в том числе по автоматизированным каналам связи.


Хранение информации (information storage) это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования. Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени. Основное содержание процесса хранения (holding storage) и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных.

В результате реализации такого алгоритма, документ, независимо от формы представления, поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где он помещается на соответствующую «полку» в зависимости от принятой системы хранения. Результаты обработки передаются в каталог. Этап хранения информации может быть представлен на следующих уровнях: внешнем, концептуальном, (логическом), внутреннем, физическом.

Внешний уровень отражает содержательность информации и предлагает способы (виды) представления данных пользователю входе реализации их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Дня этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней. Эти методы применяются для работы с файлами, графическими базами данных и т.д.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Массив (англ. array) — упорядоченное множество данных.

Информационный массив — система хранения информации, включающая представление данных и связей между ними, т.е. принципы их организации.

С учетом этого рассматриваются линейные и многомерные структуры организации информационных массивов. В свою очередь линейная структура данных может быть представлена в виде: строк, одномерных массивов; стеков, очередей, деков и др.


Строка - представление данных в виде элементов, располагающихся по признаку непосредственного следования, т.е. по мере поступления данных в ЭВМ.

Одномерный массив - представление данных, отдельные элементы которых имеют индексы, т.е. поставленные им в соответствие целые числа, рассматриваемые как номер элемента массива.

Индекс обеспечивает поиск и идентификацию элементов, а, следовательно, и доступ к заданному элементу, что облегчает его поиск по сравнению с поиском в строке.

Идентификация - процесс отождествления объекта с одним из известных.

Стек - структура данных, учитывающая динамику процесса ввода и вывода информации, использующая линейный принцип организации, реализующий процедуру обслуживания «последним пришел - первым ушел». В стеке первым удаляется последний поступивший элемент.

Очередь - структура организации данных, при которой для обработки информации выбирается элемент, поступивший ранее всех других.

Дека - структура организации данных, одновременно сочетающая рассмотренные виды.

Нелинейные структуры хранения данных – структуры, использующие многомерные конструкции (многомерные массивы) следующих видов: деревья, графы, сети.

На физическом уровне любые записи информационного поля представляются в виде двоичных символов. Обращение к памяти большого объема требует и большой длины адреса. Если память имеет емкость 2n слов, то требуются для поиска этих слов n-разрядные адреса.

Хранение информации осуществляется на специальных носителях. Исторически наиболее распространенным носителем информации была бумага, которая, однако, непригодна в обычных (не специальных) условиях для длительного хранения информации. На бумагу оказывают вредное воздействие температурные условия: либо разбухает, либо ломается, способна к возгоранию.

2. Базы данных. Основные понятия и определения

2.1 Понятие баз данных. СУБД

Появление и относительно широкое распространение в начале 60-х годов XX века запоминающих устройств достаточно большой емкости с возможностью доступа к произвольным участкам памяти - магнитных дисков, - открыло широкие возможности для создания сложных структур долговременно хранимых данных. Высокая скорость обновления небольших объемов данных (доли секунды) создала условия для создания приложений, способных функционировать в режиме оперативной работы (on-line). В отличие от систем предшествующих поколений, время ответа стало измеряться не сутками, а секундами или долями секунды.


Эти возможности, однако, привели к существенному усложнению кода приложений и, как следствие, к удорожанию их разработки и снижению надежности. В связи с этим появилась идея централизации функций управления данными, которая привела к появлению систем, предоставляющих приложениям услуги по обработке данных. Такие системы получили название систем управления базами данных (СУБД).

Совокупность данных, хранимых под управлением СУБД, называется базой данных. В оригинальном английском варианте словосочетание data base означает «основание, состоящее из данных». Этот смысл несколько искажается в русском словосочетании «база данных». На самом деле это — фундамент, на котором строятся приложения и который состоит из данных. Действительно, данные (а, следовательно, база данных) являются очень существенной частью практически любой информационной системы.

Система управления базами данных (СУБД) — это программный комплекс, обеспечивающий централизованное хранение данных и предоставляющий приложениям услуги по обработке данных.

Система управления базами данных, находящаяся в фазе выполнения, связанная с некоторой конкретной базой данных и готовая выполнять запросы на обработку этой базы данных, называется экземпляром (instance) или сервером базы данных.

Основные требования к системам управления базами данных были сформулированы в документе, опубликованном в 1971 году комитетом по системам и языкам обработки данных (CODASYL)[1], русский перевод которого издан в 1975 году[2]. Основой для этих требований послужил анализ систем, применявшихся в период подготовки отчета, и особенностей прикладных областей, в которых эти системы использовались.

В дальнейшем круг областей применения СУБД непрерывно расширялся, появлялись новые системы и уходили старые, однако многие из этих требований остались актуальными и сегодня, и большинство современных СУБД в той или иной форме реализует значительную часть этих требований. Однако далеко не все классы приложений, в которых используются современные системы, предъявляют те же требования к обработке данных, поэтому и системы реализуются иначе.

Приложения, относящиеся к классу оперативной обработки (OLTP), характеризуются тем, что:

  • каждое выполнение приложения занимает мало времени (в идеале — не больше долей секунды);
  • данные используются совместно многими приложениями;
  • при каждом выполнении приложение использует ничтожную долю общего объема хранимых данных, и обычно количество используемых данных не зависит от общего объема базы.

Важно также отметить, что процессы обработки данных и структуры данных в тех областях, в которых использовались ранние СУБД, фактически были формализованы задолго до появления электронных вычислительных систем. Так, правила бухгалтерского учета в основном сложились в XIV веке и мало изменились в последующем. Возможно, это привело к тому, что СУБД, как правило, ориентированы на обработку структурированных данных.

Перечислим основные требования к системам управления базами данных.

  1. Разделение программ и данных. Описание структуры данных должно быть отделено от кода приложений, и система должна допускать независимое изменение структуры данных и кода приложения.
  2. Высокоуровневый язык запросов. Система должна предоставлять средства для обработки данных, не включенные в какое-либо приложение.
  3. Целостность. Система должна предотвращать запись данных, нарушающих заранее специфицированные ограничения.
  4. Согласованность. Система должна предотвращать появление некорректностей в данных вследствие параллельной или псевдопараллельной работы нескольких приложений.
  5. Отказоустойчивость. СУБД не должна допускать потери данных даже в случае отказов оборудования.
  6. Защита и разграничение доступа. Система должна предотвращать несанкционированный доступ к данным и предоставлять каждому пользователю (или приложению) доступ только к части данных в соответствии с правами этого пользователя.

2.2 Архитектура «клиент-сервер»

Путь от однопользовательских централизованных до много­пользовательских распределенных с параллельным доступом СУБД прошли еще на больших ЭВМ. Так, в 1970-е гг. на IBM 370 эксплуатировалось семейство многозадачных операционных систем MVT и MVS, позволявших запускать с удаленных терминалов одновременно несколько приложений, получавших свой независимый виртуальный ресурс. Распространение персональных ЭВМ нена­долго вернуло однопользовательскую централизованную архитектуру баз данных. Многие информационные системы 80-х - начала 90-х гг. создавались для персональной работы одного пользователя. Однако с ростом масштабов систем (от локальных персональных до интегрированных на уровне предприятия) потребовалось обеспечить единое информационное пространство, т.е. единую базу данных для всех пользователей системы.