Файл: Операции, производимые с данными (данные и сообщения).pdf
Добавлен: 22.04.2023
Просмотров: 106
Скачиваний: 1
СОДЕРЖАНИЕ
- Если производится группировка только по одному признаку, то она называется простой.
- Если по двум и более признакам, то такая группировка называется сложной или комбинационной.
В зависимости от решаемых задач различают типологические, структурные и аналитические группировки:
- Типологическая группировка — представляет собой разделение исследуемой совокупности на однородные группы. (группировка предприятий по формам собственности)
- Структурная группировка — группировка, в которой происходит разделение однородной совокупности на группы, характеризующие ее структуру по какому-то варьирующему признаку (группировка населения по уровню дохода). Анализ статистических данных структурных группировок, взятых за ряд периодов, показывает изменение структуры изучаемых явлений, то есть структурные сдвиги.
- Аналитическая (факторная) группировка — позволяет выявить взаимосвязи между изучаемыми явлениями и их признаками (группировка банков по сумме уставного капитала, величине активов и балансовой прибыли).
Технически процесс группирования статистических данных состоит из следующих этапов:
1. Выбор признака группировки;
2. Ранжирование совокупности по признаку группировки;
3. Определение числа групп;
4. Определение величины интервала;
5. Распределение единиц совокупности по образованным группам.
Сложные группировки могут быть комбинационными и многомерными.
Технически построение комбинационной группировки заключается в последовательном распределении на группы по одному признаку, затем каждой группы на подгруппы по другому признаку и т.д.
Многомерная группировка строится не последовательно, а одновременно по большому числу признаков с целью формирования качественно однородных групп на основе определенной процедуры оценки близости объектов.
Например, группировка студентов по результатам экзаменационной сессии может быть произведена по двум группам, если задача исследования – выявление успевающих и не успевающих по какому-то предмету; по трем группам, если задача состоит в выявлении неуспевающих, получивших «удовлетворительно» и успевающих на «хорошо» и «отлично» и т.д.
3.6. Архивация данных
Архивация данных – организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат на хранение данных и повышает общую надежность информационного процесса в целом.
Архивация - это сжатие одного или более файлов с целью экономии памяти и размещение сжатых данных в одном архивном файле. Архивация данных - это уменьшение физических размеров файлов, в которых хранятся данные, без значительных информационных потерь.
Архивация производится в случае:
- необходимости создания резервных копий наиболее важных файлов;
- необходимости освобождения места на диске;
- необходимости передачи файлов по E-mail.
Архивный файл представляет собой набор из нескольких файлов (одного файла), помещенных в сжатом виде в единый файл, из которого их можно при необходимости извлечь в первоначальном виде. Архивный файл содержит оглавление, позволяющее узнать, какие файлы содержатся в архиве.
В оглавлении архива для каждого содержащегося в нем файла содержится информация о:
- имени файла;
- размере файла на диске и в архиве;
- о расположении файла на диске;
- дате и времени последней модификации файла;
- коде циклического контроля для файла, используемом для проверки целостности архива;
- степени сжатия.
Любой архив имеет собственную шкалу степени сжатия. Наиболее часто встречается следующая градация методов сжатия:
- без сжатия (соответствует обычному копированию файлов в архив без сжатия);
- скоростной;
- быстрый (характеризуется самым быстрым, но наименее плотным сжатием);
- обычный;
- хороший;
- максимальный (максимально возможное сжатие является одновременно и самым медленным методом сжатия).
Степень сжатия зависит от:
- используемого архиватора;
- метода сжатия;
- типа исходного файла.
Файлы различных типов сжимаются по-разному. Например, коэффициент сжатия текстовых документов значительно выше, чем графических.
Для сжатия файлов используются программы архиваторы.
Архиваторы - это программы (комплекс программ) выполняющие сжатие и восстановление сжатых файлов в первоначальном виде.
Процесс сжатия файлов называется архивированием. Процесс восстановления сжатых файлов - разархивированием.
Современные архиваторы отличаются используемыми алгоритмами, скоростью работы, степенью сжатия (WinZip, WinAce, PowerArchiver, 7Zip, WinRAR).
3.7. Защита данных
Защита данных (data protection) – меры, обеспечивающие доступ к конфиденциальной, особенно компьютерной, информации, только тем, кто имеет на это право. При этом преследуются две цели: обеспечивается конфиденциальность личной и деловой информации, а также гарантируется точность хранимой информации.
Термин защита данных означает предупреждение случайного или несанкционированного доступа к данным, их изменения или разрушения со стороны пользователей или при сбоях аппаратуры.
Защита включает в себя две основные функции:
· обеспечение безопасности данных,
· обеспечение секретности данных.
В данной работе я рассмотрю только обеспечение безопасности данных (обеспечение физической защиты).
Под функцией безопасности данных подразумевается предотвращение разрушения или искажения данных при случайном доступе или в результате аппаратного сбоя. Обеспечение безопасности является внутренней задачей БД, поскольку связано с её нормальным функционированием, и решается на уровне СУБД. Цель восстановления БД после сбоя – обеспечить, чтобы результаты всех подтверждённых транзакций были отражены в восстановленной базе данных, и вернуться к нормальному продолжению работы как можно быстрее, в то же время изолируя пользователей от проблем, вызванных сбоем.
Наиболее типичными сбоями являются следующие:
1. Пользовательские ошибки.
Ошибки пользователей могут потребовать восстановления базы данных в состояние на момент возникновения ошибки. Например, пользователь может случайно удалить таблицу.
2. Сбой предложения.
Сбой происходит при логической ошибке предложения во время его обработки (например, предложение нарушает ограничение целостности таблицы). Когда возникает сбой предложения, результаты этого предложения (если они есть) должны автоматически отменяться СУБД, а управление – возвращаться пользователю.
3. Сбой процесса.
Это ошибка в пользовательском процессе, обращающемся к БД, например, аварийное разъединение или прекращение процесса. Сбившийся процесс пользователя не может продолжать работу, тогда как СУБД и процессы других пользователей могут. Система должна откатить неподтверждённые транзакции сбившегося пользовательского процесса и освободить все ресурсы, занятые этим процессом.
4. Сбой экземпляра базы данных (сервера).
Этот сбой происходит при возникновении проблемы, препятствующей продолжению работы сервера. Сбой может быть вызван аппаратной проблемой, такой как отказ питания, или программной проблемой, такой как сбой операционной системы. Восстановление после такого сбоя может потребовать перезагрузки БД с откатом всех незавершённых транзакций.
5. Сбой носителя (диска).
Эта ошибка может возникнуть при попытке записи или чтения файла, требуемого для работы базы данных. Типичным примером является отказ дисковой головки, который приводит к потере всех файлов на данном устройстве. Этот тип сбоя может касаться различных типов файлов, поддерживаемых СУБД. Кроме того, поскольку сервер не может продолжать работу, данные из буферов оперативной памяти не могут быть записаны в файлы данных.
3.8. Транспортировка данных
Транспортировка данных – прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя – клиентом.
Сеть Интернет, являющаяся сетью сетей и объединяющая громадное количество различных локальных, региональных и корпоративных сетей, функционирует и развивается благодаря использованию единого принципа маршрутизации и транспортировки данных.
Маршрутизация данных.
Маршрутизация данных обеспечивает передачу информации между компьютерами сети. Рассмотрим принцип маршрутизации данных по аналогии с передачей информации с помощью обычной почты. Для того чтобы письмо дошло по назначению, на конверте указывается адрес получателя (кому письмо) и адрес отправителя (от кого письмо).
Точно так же, передаваемая по сети информация "упаковывается в конверт", на котором "пишутся" Интернет-адреса компьютеров получателя и отправителя, например: "Кому - 123.178.113.100", "От кого - 195.132.58.133".
Отправленная информация на компьютерном языке называется Интернет-пакетом и представляет из себя набор байтов.
Интернет-пакеты на пути к компьютеру-получателю также проходят через многочисленные промежуточные серверы Интернета, на которых производится операция маршрутизации. В результате маршрутизации Интернет-пакеты направляются от одного сервера Интернета к другому, постепенно приближаясь к компьютеру-получателю.
Теперь представим себе, что нужно переслать по почте многостраничный научный труд, а почта принимает только конверты. Выход прост: если всё не помещается в обычный почтовый конверт, его надо разобрать на листы и пересылать их несколькими конвертами. При этом листы работы необходимо обязательно пронумеровать, чтобы получатель знал, в какой последовательности потом эти листы собрать.
Транспортировка данных
В Интернете часто случается аналогичная ситуация, когда компьютеры обмениваются большими по объему файлами. Если послать такой файл весь сразу, то он может надолго "забить" канал связи и, в результате, мы не сможем ничего отправить в это время.
Для того чтобы этого не происходило, на компьютере, который отправляет, необходимо разделить исходный файл на мелкие части, пронумеровать их и транспортировать в виде отдельных Интернет-пакетов до компьютера, который должен получить информацию.
Затем необходимо собрать полученный файл из отдельных частей в правильном порядке, поэтому файл не может быть собран до тех пор, пока не будут получены все Интернет-пакеты.
Время, которое требуется для транспортировки отдельных Интернет-пакетов между отправителем и получателем можно узнать с помощью специальных программ.
Маршрутизация и транспортировка данных в сети Интернет производится на основе протокола TCP/IP, который является основным протоколом Интернета.
В термине TCP/IP включено название двух протоколов передачи данных:
- TCP (Transmission Control Protocol - транспортный протокол);
- IP (Internet Protocol - протокол маршрутизации).
3.9. Преобразование данных
Преобразование данных – перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку.
Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что в начале 21-века для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированы только на передачу аналоговых сигналов в узком диапазоне частот) было необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимались специальные устройства – телефонные модемы.
В сфере компьютерных технологий есть множество вариантов представления данных. Точно так же операционная система утверждена по определенным стандартам касательно обработки файлов и данных. Кроме того, каждая компьютерная программа обрабатывает данные по-своему. Каждый раз, когда любая из этих переменных изменена, данные должны быть некоторым образом преобразованы, прежде чем они смогут быть пригодны для использования другим компьютером, операционной системой или программой. Даже различные версии этих элементов обычно включают различные структуры данных.
Процесс преобразования данных также называется конвертацией. Конвертация может потребовать использование специальной конвертирующей программы или может включать сложный процесс прохождения промежуточных стадий или вовлечения сложных "экспортирующих" и "импортирующих" процессов перехода от одного формата к другому.