Файл: Операции, производимые с данными (Единицы представления и хранения данных).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 01.04.2023

Просмотров: 75

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ВВЕДЕНИЕ

Данные – могут рассматриваться как признаки или записанные наблюдения, которые пока не используются, а только хранятся. Если есть возможность использовать их для уменьшения неопределённости чего-либо, данные становятся информацией. Компьютер работает с данными, а пользователь с информацией. Информация бывает: текстовая, звуковая, числовая, графическая, видео. Измерение данных основано на способе кодирования данных – при обработке их на компьютере в двоичной системе счисления.

Мир данных постоянно меняется и развивается каждую секунду. Это, в свою очередь, создало совершенно новое измерение роста и проблем для компаний по всему миру. Точно записывая данные, сохраняя, обновляя и отслеживая их на эффективной и регулярной основе, компании могут решать свои задачи, с одной стороны, и использовать огромные возможности, предлагаемые этим сектором, с другой стороны.

Собирая каждые малый или большой объём данных, компании используют указанную информацию для достижения своих целей на систематической основе, и наделяют свой бизнес стратегическим способом развития, который позволяет автоматизировать многие процессы, привлекать новых клиентов, а соответственно увеличить прибыль. В этом и заключается актуальность данной работы.

Объектом исследования являются данные. Предметом исследования операции, производимые над данными.

Целью данной работы является анализ операций, производимых над данными. Для выполнения поставленной цели требуется выполнить ряд задач:

  • раскрыть понятие «данные»;
  • изучить единицы представления и хранения данных;
  • рассмотреть специфические операции, производимые над данными;
  • проанализировать работу с данными на конкретном примере.

Методами проектного исследования данной работы являются теоретический анализ, изучение соответствующей литературы, сравнение.

Практическая значимость работы заключается в изучении вопросов использования операций над данными, поскольку любое взаимодействие с информацией, со сбором, хранением и другими видами, подразумевает под собой работу с данными.

В ходе работы использовался большой объем литературы, полный список которой представлен в конце этой работы.

1. ИССЛЕДОВАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ


1.1 Понятие «данные»

Над любыми структурами данных могут выполняться четыре общие операции: создание, уничтожение, выбор (доступ), обновление.

Операция создания заключается в выделении памяти для структуры данных. Память может выделяться в процессе выполнения программы или на этапе компиляции. В ряде языков (например, в С) для структурированных данных, конструируемых программистом, операция создания включает в себя также установку начальных значений параметров, создаваемой структуры.

Для структур данных, объявленных в программе, память выделяется автоматически средствами систем программирования либо на этапе компиляции, либо при активизации процедурного блока, в котором объявляются соответствующие переменные. Программист может и сам выделять память для структур данных, используя имеющиеся в системе программирования процедуры, функции выделения, освобождения памяти. В объектно-ориентированных языках программирования при разработке нового объекта для него должны быть определены процедуры создания и уничтожения [26].

Главное заключается в том, что независимо от используемого языка программирования, имеющиеся в программе структуры данных, не появляются «из ничего», а явно или неявно объявляются операторами создания структур. В результате этого всем экземплярам структур в программе выделяется память для их размещения.

Операция уничтожения структур данных противоположна по своему действию операции создания. Операция уничтожения помогает эффективно использовать память.

Операция выбора используется программистами для доступа к данным внутри самой структуры. Форма операции доступа зависит от типа структуры данных, к которой осуществляется обращение. Метод доступа — один из наиболее важных свойств структур, особенно в связи с тем, что это свойство имеет непосредственное отношение к выбору конкретной структуры данных.

Операция обновления позволяет изменить значения данных в структуре данных. Примером операции обновления является операция присваивания, или, более сложная форма — передача параметров [26].

Вышеуказанные четыре операции обязательны для всех структур и типов данных. Помимо этих общих операций для каждой структуры данных могут быть определены операции специфические, работающие только с данными данного типа (данной структуры). Специфические операции рассматриваются при рассмотрении каждой конкретной структуры данных.


1.2 Единицы представления и хранения данных

Данные — это отдельные факты, характеризующие объекты, процессы и явления в предметной области, а также их свойства. Единицы измерения информации.

В качестве единицы информации условились принять один бит. Бит– количество информации необходимое для различения двух равновероятных сообщений. Бит – слишком малая единица измерения. На практике чаще применяется более крупная единица – байт, равная восьми битам. Именно 8 битов требуется для того, чтобы закодировать любой из 256 символов алфавита клавиатуры компьютера [24].

Совокупность двоичных разрядов, выражающих числовые или иные данные, образует некий битовый рисунок. Практика показывает, что с битовым представлением удобнее работать, если этот рисунок имеет регулярную форму. В настоящее время в качестве таких форм используются группы из восьми битов, которые называются байтами. Группа из 16 взаимосвязанных бит (двух взаимосвязанных байтов) в информатике называется словом. Соответственно, группы из четырех взаимосвязанных байтов (32 разряда) называются удвоенным словом, а группы из восьми байтов (64 разряда) — учетверенным словом.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл — это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла. Таким образом, файл – программа с именем на диске. Каталог – место, где регистрируются файлы.

Проще всего представить себе файл в виде безразмерного канцелярского досье, в которое можно по желанию добавлять содержимое или извлекать его оттуда.

Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит.

Под файлом понимают логически связанную совокупность однотипных данных или программ, для размещения которой во внешней памяти выделяется именованная область [12, 22].

Файловая система обеспечивает возможность доступа к конкретному файлу и позволяет найти свободное место при записи нового файла. Она определяет схему записи информации, содержащейся в файлах, на физический диск.


Файлы на диске записываются в свободные кластеры, поэтому фрагменты одного и того же файла могут находиться в разных местах диска. Относительно производительности системы наиболее предпочтительным является такой вариант размещения файла, когда его фрагменты занимают подряд идущие кластеры. Windows9х использует файловые системы FAT16 и FAT32, WindowsNT – файловую систему NTFS. Каждый файл имеет имя и расширение. Расширение указывает на тип файла.

Имя файла в Windows (полное, с указанием директорий, его содержащих) может иметь до 255 символов. Расширение отделяется от имени точкой. В Windows каждому типу файла ставится в соответствие свой значок.

Система управления базами данных хранит, организует и управляет большим объемом информации в одном программном приложении. Использование этой системы повышает эффективность бизнес-операций и снижает общие затраты. База данных представляет собой набор информации, которая организована таким образом, что её можно легко извлечь, управлять ею и обновлять.

Данные упорядочены по строкам, столбцам и таблицам и индексируются для облегчения поиска релевантной информации. Данные обновляются, расширяются и удаляются по мере добавления новой информации. Базы данных обрабатывают рабочие нагрузки для создания и обновления самих себя, запроса данных, которые они содержат, и запуска приложений.

Компьютерные базы данных обычно содержат агрегирование записей или файлов данных, таких как транзакции продаж, каталоги продуктов и запасы, а также профили клиентов.

Как правило, диспетчер баз данных предоставляет пользователям возможность контролировать доступ для чтения и записи, определять создание отчетов и анализировать его использование. Некоторые базы данных обеспечивают соответствие “ACID” (атомарность, согласованность, изоляцию и долговечность), чтобы гарантировать совместимость данных и завершение транзакций [5, 8, 19].

Вот лишь некоторые из действий, которые можно выполнять благодаря базам данных, которые трудно, если не невозможно, выполнить в электронной таблице:

  • извлечь все записи, соответствующие определенным критериям;
  • обновлять все записи сразу;
  • перекрестные ссылки в разных таблицах;
  • выполнять сложные совокупные вычисления.

База данных состоит из нескольких таблиц. Также, как таблицы Excel, таблицы базы данных состоят из столбцов и строк. Каждый столбец соответствует атрибуту, и каждая строка соответствует одной записи. Каждая таблица должна иметь уникальное имя в базе данных.


Важным аспектом таблицы является то, что каждый должен иметь столбец первичного ключа, чтобы каждая строка (или запись) иметь уникальное поле для ее идентификации.

Базы данных распространены в крупных системах мейнфреймов, но также присутствуют в небольших распределенных рабочих станциях и системах среднего уровня, таких как AS и 400 IBM и персональные компьютеры.

Базы данных развивались с момента их создания в 1960-х годах, начинали с иерархических и сетевых баз данных, в 1980-х годах с объектно-ориентированных баз данных и развились до сегодняшних современных реляционных баз данных и NoSQL, а также до облачных баз данных [11].

В одном представлении базы данных можно классифицировать в соответствии с типом контента: библиографическим, текстовым, цифровым и так далее. При вычислении, базы данных иногда классифицируются в соответствии с их организационным подходом. Существует множество различных типов баз данных, начиная от наиболее распространенного подхода, реляционной базы данных до распределенной базы данных, облачной базы данных или базы данных NoSQL [14].

Система управления базами данных (СУБД) — это системное программное обеспечение для создания и управления базами данных. СУБД предоставляет пользователям и программистам систематический способ создания, извлечения, обновления и управления данными.

СУБД позволяет конечным пользователям создавать, считывать, обновлять и удалять данные в базе данных. СУБД по существу служит интерфейсом между базой данных и конечными пользователями или прикладными программами, гарантируя, что данные последовательно организованы и остаются легкодоступными.

СУБД управляет тремя важными вещами: данными, механизмом базы данных, который позволяет осуществлять доступ к данным, блокировкой и изменением, а также схемой базы данных, которая определяет логическую структуру базы данных. Эти три основных элемента помогают обеспечить параллелизм, безопасность, целостность данных и единообразные процедуры администрирования. Типичные задачи администрирования базы данных, поддерживаемые СУБД, включают управление изменениями, контроль и настройку производительности, а также резервное копирование и восстановление. Многие системы управления базами данных также несут ответственность за автоматические откаты, перезагрузки и восстановление, а также регистрацию и аудит деятельности [15, 17].

СУБД наиболее полезно для обеспечения централизованного представления данных, к которым могут обращаться несколько пользователей, из нескольких мест, контролируемым образом. СУБД может ограничить данные, которые видит конечный пользователь, а также то, как этот конечный пользователь может просматривать данные, предоставляя множество представлений о единой схеме базы данных. Конечным пользователям и программным программам не нужно понимать, где находятся данные физически, или на каком носителе данных он находится, поскольку СУБД обрабатывает все запросы.