Файл: Операции, производимые с данными (Теоретические аспекты исследования данных).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 28.03.2023

Просмотров: 120

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

По времени её использования в информационных системах разделяют на постоянную и переменную информацию.

Постоянная информация – это стабильная форма информации в виде норм, нормативов, стандартов, численности служащих.

Переменная информация отражает меняющиеся обстоятельства, например, изменение результатов управления, числа объектов и задач и т.п.

По отношению к системе (объекту деятельности) информация делится на входную и выходную.

Входная – характеризует потоки информации, поступающие в данную систему, выходная – определяет продукт её деятельности и результаты решаемых задач.

По возможности использования, информацию различают на полезную, шумы, избыточную, лживую и ложную.

Шум – это посторонние помехи в канале связи, мешающие правильному восприятию информации. Эти помехи могут быть случайными и целенаправленными.

Помимо действительно полезной информации может восприниматься избыточная информация, являющаяся достоверной, но не несущая ничего нового, излишне детализирующая известные сведения – эта информация мусор, она только отвлекает ресурсы от анализа полезной информации.

Лживая информация (дезинформация) носит сознательный искажающий характер, что является её коренным отличием от ложной.

В качестве ложной информации зачастую воспринимаются слабые сигналы (сигналы, количественное значение которых меньше значения большинства других входных сигналов) о возможных изменениях во внутренних и внешних факторах, если они не согласуются с привычным ходом информационного процесса.

Использование информации в управлении требует тщательной подготовки, которая предполагает устранение из неё информационного шума - той информации, которая не имеет прямого отношения к процессам управления, при этом эффективность влияния информации на получателя зависит от соответствия характеристик информации возможностям и потребностям получателя.

Обмен информацией осуществляется только между объектами, представляющими собой систему с минимумом организованности. Обмен информации, обеспечивающий процесс управления, представляет собой потоки информации, отражающие результаты финансово-хозяйственной деятельности предприятий, организаций, отраслей народного хозяйства, общественной и экономической деятельности страны.

В экономике к информационным потокам предъявляются требования:

-полнота и достаточность информации для оценки организации в социуме;

-достоверность и возможность для оценки расходов государственных средств и конкуренции (технологичности, рационализации);


-объективность, позволяющая предоставлять истинную и подробную информацию о поставщиках и потребителях;

-разносторонность, включающая сферы финансов, производства, научных исследований, социальной, экономической, бюджетной и налоговой политики;

-возможность организации удобного доступа и поиска больших объёмов разнообразной информации;

-многократность использования информации для проведения планирования, прогноза и анализа динамики результатов

-прозрачность и документальность, обеспечивающие высокое качество контроля и отчётности;

-создание информационных моделей, позволяющих разработку эффективных автоматизированных информационных систем (АИС).

1.4 Показатели, реквизиты, коды и документы

Информационный поток экономической информации формируется из документов, представляемых в бумажном или электронном виде, документ состоит из показателей.

Показатель – это определение величины, позволяющей качественно либо количественно оценить отображаемый объект, процесс или явление, а также их простые и сложные характеристики. Такие экономические показатели, как объём товаров, объём услуг в размерах выручки от их реализации представляют показатели экономической деятельности предприятия, средний доход на семью в денежном эквиваленте – показатель благосостояния в обществе. Показатели состоят из реквизитов.

Реквизит – (носитель информации) логически неделимый информационный элемент, описывающий определенное свойство объекта, процесса, явления и т.п.

Синонимами к слову реквизит в информационных технологиях являются: слово, атрибут и элемент.

Реквизиты подразделяются на реквизиты – признаки (характеризующие качественные свойства отображаемой сущности) и реквизиты – основания (характеризующие количественную сущность показателя).

Показатель может иметь множество реквизитов – признаков и один реквизит – основание. Так в унифицированной отчётности статистической форме № П - 4 “Cведения о финансовом состоянии организации” заполняется показатель объёма прибыли (убытка) отчитывающегося предприятия, то он состоит из одного реквизита-основания (суммы – прибыли в рублях) и нескольких реквизитов – признаков: код предприятия и коды всех признаков предприятия (ОКАТО, ОКОНХ и др. классификаторов), даты отчётного периода и т.д. В информационных технологиях реквизиты – основания используются для вычислений и сравнений при расчётах количественного характера, а реквизиты – признаки – для поиска, идентификации и выбора показателя в базах данных. Обработка реквизитов – оснований осуществляется арифметическими операцямии, а реквизитов-признаков – логическими. Указанные реквизиты, взятые раздельно, не имеют экономического смысла и могут применяться лишь в сочетании. Из них формируются более сложные информационные компоненты – составные единицы информации. (СЕИ).


Показатель характеризует количественную и качественную стороны объекта, поэтому, обладая информативностью, он способен самостоятельно формировать документ и давать оценку объекту. Данная оценка играет важную роль при организации хранения информации и её обработке.

Набор показателей образует массив, из которого строится подсистема, которая входит в состав информационной базы. Количество реквизитов в документе характеризует уровень его информативности, что позволяет рассчитать объём информации в документе.

Документ (документированная информация) – зафиксированная на материальном носителе информация с реквизитами, позволяющими её идентифицировать. Документу должно быть присвоено название, отвечающее его содержанию, а также указано ответственное за содержание в этом документе лицо.

ГЛАВА 2. Анализ практических аспектов операций проводимых с данными

2.1 Операции с данными

В ходе информационного процесса данные преобразуются из одного вида в другой с помощью различных методов. Обработка данных включает в себя множество операций. По мере развития научно-технического прогресса и общего усложнения связей в человеческом обществе возрастают неуклонно трудозатраты на обработку данных. Прежде всего, это связано с постоянным усложнением условий управления производством и обществом. Второй фактор, также вызывающий общее увеличение объемов обрабатываемых данных, связан с научно-техническим прогрессом, а именно с быстрыми темпами появления и внедрения новых носителей данных, средств их хранения и доставки.

В структуре возможных операций с данными можно выделить следующие:

• сбор - накопление информации с целью обеспечения достаточной полноты для принятия решений;

• формализация - приведение данных, поступающих из разных источников, к одинаковой форме, чтобы сделать их сопоставимыми между собой, то есть повысить их уровень доступности;

• фильтрация - отсеивание «лишних» данных, в которых нет необходимости для принятия решений; при этом должен уменьшаться уровень «шума», а достоверность и адекватность данных должны возрастать;


• сортировка - упорядочение данных по заданному признаку с целью удобства использования; эта процедура повышает доступность информации;

• архивация - организация хранения данных в удобной и легкодоступной форме; служит для снижения экономических затрат по хранению данных и повышает общую надежность информационного процесса в целом;

• защита - комплекс мер, направленных на предотвращение утраты, воспроизведения и модификации данных;

• транспортировка - прием и передача (доставка и поставка) данных между удаленными участниками информационного процесса; при этом источник данных в информатике принято называть сервером, а потребителя - клиентом;  • преобразование данных - перевод данных из одной формы в другую или из одной структуры в другую. Преобразование данных часто связано с изменением типа носителя, например книги можно хранить в обычной бумажной форме, но можно использовать для этого и электронную форму, и микрофотопленку. Необходимость в многократном преобразовании данных возникает также при их транспортировке, особенно если она осуществляется средствами, не предназначенными для транспортировки данного вида данных. В качестве примера можно упомянуть, что для транспортировки цифровых потоков данных по каналам телефонных сетей (которые изначально были ориентированы только на передачу аналоговых сигналов в узком диапазоне частот) необходимо преобразование цифровых данных в некое подобие звуковых сигналов, чем и занимаются специальные устройства - телефонные модемы.

Приведенный здесь список типовых операций с данными далеко не полон. Миллионы людей во всем мире занимаются созданием, обработкой, преобразованием и транспортировкой данных, и на каждом рабочем месте выполняются свои специфические операции, необходимые для управления социальными, экономическими, промышленными, научными и культурными процессами. Полный список возможных операций составить невозможно, да и не нужно. Сейчас нам важен другой вывод: работа с информацией может иметь огромную трудоемкость, и ее надо автоматизировать.

Процедура доступа к данным может быть инициирована как самим компьютером (для решения каких-либо своих технических задач), так и конечным пользователем. В последнем случае пользователь формирует запрос, куда включает, в частности, обозначение требуемого вида доступа или действия и указание на то, над какими данными это действие надо выполнить. Как отмечалось ранее, идентификация данных осуществляется с помощью ключей. В качестве же требуемого действия может производиться одно из следующих: добавление, удаление, изменение,  просмотр элемента или обработка данных из элемента.


При добавлении элемента информационный массив пополняется новыми данными в виде записи файла или файла в целом, соответственно, для структурированных и неструктурированных данных. В запросе в этом случае, помимо указанной выше информации, приводится и сам новый элемент. При этом объем информационного массива увеличивается.

Удаление, наоборот, является обратным действием, вызывающим исключение упомянутых данных. Это действие приводит к уменьшению объема информационного массива.

Изменение относится не к элементу, а к его составляющим – полям записи файла или тексту, хранящемуся в файле, и означает, в свою очередь,  удаление прежних значений полей или строк текста и/или добавление новых. В запрос включается дополнительная информация, указывающая на требуемые составляющие изменяемого элемента, а также сами новые значения этих составляющих. Объем информационного массива при этом не меняется для структурированных данных и, возможно, меняется для неструктурированных;

Просмотр связан с предоставлением данных пользователю на устройстве вывода компьютера, как правило, на дисплее. В запросе в этом случае дополнительно указывается, какие составляющие элемента требуется просмотреть (по умолчанию просматривается весь элемент).

Обработка предусматривает выполнение некоторых арифметических операций над данными элемента, например, накопление суммы и т.д., и относится только к структурированным данным, а потому далее не рассматривается.

Чтобы выполнить любое их указанных выше действий, нужный элемент должен быть предварительно найден в информационном массиве, для чего выполняется его поиск (для добавления нового элемента тоже делается попытка его поиска, которая заканчивается неудачно, и тогда элемент добавляется). Под поиском элемента понимается определение его местонахождения в информационном массиве. Таким образом, любой доступ включает поиск, что делает эту фазу доступа наиболее значимой.

Технологии доступа при выполнении действий изменения элемента показана на рис. 2.1.

Здесь и далее сплошные линии означают управляющие связи, пунктирные - информационные связи.

Рисунок 2.1 - Технологии доступа при выполнении действий изменения элемента

Технологии доступа при выполнении действий добавления элемента показаны на рис. 2.2: