Файл: Источники данных и хранение информации на предприятии.docx
Добавлен: 25.10.2023
Просмотров: 120
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Для поддержания различных аспектов своей каждодневной деятельности организации обычно используют разные OLTPсистемы. Одна система предназначена для обработки заказов, другая – для ведения бухучета, третья – для обслуживания потребностей производства, четвертая – для управления персоналом. К числу транзакционных систем относятся ERP-системы, автоматизированные банковские системы (АБС), биллинговые системы, учетные системы и некоторые другие.
Данные в OLTP-системы поступают в основном из внутренних источников, причем это текущие данные за период от нескольких месяцев до одного года. Объемы хранимых данных могут составлять сотни мегабайт, гигабайты. Частота обновления данных высокая, обновления происходят маленькими порциями. Основное их назначение – фиксация данных, оперативный поиск и преобразование данных. В основе таких систем лежат оперативные базы данных.
По определению Уильяма Инмона, основоположника хранилищ данных, «Хранилище данных – это предметно-ориентированное, привязанное ко времени и неизменяемое собрание данных для под держки процесса принятия управляющих решений». Задача хранилища – предоставить лицу, принимающему решения, информацию для анализа в одном месте и в простой, понятной для восприятия структуре.
Данные в хранилище попадают из оперативных систем (OLTPсистем), которые предназначены для автоматизации бизнеспроцессов, и других внутренних источников информации. Хранилище также может пополняться за счет внешних источников информации, например статистических отчетов и т.п.
Концепция хранилищ данных – это концепция подготовки данных для анализа. Она предполагает реализацию единого интегрированного источника данных. Объединяя в себе всю информацию, необходимую для эффективного функционирования организации, хранилища являются основой единого информационного пространства организации, используемого для проведения аналитической работы и подготовки данных для принятия решений.
Единое информационное хранилище обеспечивает:
-
Объединение данных и приведение их к единой структуре; -
Повышение производительности получения данных; -
Проведение эффективного анализа данных.
Хранилищу данных свойственна малая частота изменений, изменения производятся большими порциями и обычно по расписанию. Хранилище объединяет внутренние и внешние данные
, в составе этих данных – текущие данные и исторические за период до нескольких десятков лет. Объемы хранимых данных – гигабайты и терабайты. Основное назначение хранилищ данных – это хранение детализированных и агрегированных исторических данных, аналитическая обработка, прогнозирование и моделирование.
Можно выделить два типа хранилищ данных: корпоративные хранилища данных (enterprise data warehouses) и витрины, или киоски, данных (data marts).
Корпоративные хранилища данных содержат информацию, относящуюся к деятельности всей корпорации и собранную из множества оперативных источников данных. Такие хранилища обычно консолидируют информацию по всем аспектам деятельности корпорации и используются для принятия как стратегических, так и тактических решений.
Корпоративное хранилище содержит обобщающую и детальную информацию; его объем может достигать от десятков гигабайт до одного или нескольких терабайт.
Витрины данных (небольшие хранилища данных) содержат подмножество корпоративных данных и создаются для определенной группы пользователей, отделов или подразделений внутри организации. Они охватывают конкретный аспект, интересующий сотрудников данного отдела. Витрина данных может получать данные из корпоративного хранилища (зависимая), или данные могут поступать непосредственно из оперативных источников (независимая витрина).
Заключение
Увеличение общего объёма электронных данных, хранящихся во всём мире, ставит перед нами задачу в увеличении эффективности действий, направленных на организацию хранения, обработки и анализа данных. Для этого создаются концепции хранилищ данных, инструменты обработки больших данных и принципы работы с этими инструментами. Эффективность предпринимаемых действий возможно оценить с помощью примеров тестирования сортировки данных.
Список использованных источников и литературы
-
Информационно аналитические системы. основы проектирования и применения // URL: https://ipi1.ru/images/PDF/2017/87/PMSE-5-87.pdf#page=26&zoom=100,90,160 (дата обращения: 18.06.2023). -
Информационные системы в экономике: практикум // Воронежский государственный технический университет URL: https://cchgeu.ru/upload/iblock/942/lv0q4bx2r9e2gssw2uwlp9n27982kk1s/Infomatsionnye-sistemy-v-ekonomike-Praktikum.pdf (дата обращения: 18.06.2023). -
Кэмпбелл Лейн, Черити Мейджорс Базы данных. Инжиниринг надежности. - СПб.: Питер, 2020. - 304 с. -
Научно-методический журнал «Проблемы современной науки и образования» URL: https://ipi1.ru/ (дата обращения: 18.06.2023). -
Проектирование и реализация хранилища данных для анализа бизнес деятельности компании // Репозиторий тольяттинского государственного университета URL: https://dspace.tltsu.ru/bitstream/123456789/4135/1/Павлов%20В.В._ПИбд-1202а.pdf (дата обращения: 18.06.2023).
1 Научно-методический журнал «Проблемы современной науки и образования» URL: https://ipi1.ru/ (дата обращения: 18.06.2023)
2 «Информационные системы в экономике: практикум»: [электронный ресурс]. URL: https://cchgeu.ru/upload/iblock/942/lv0q4bx2r9e2gssw2uwlp9n27982kk1s/Infomatsionnye-sistemy-v-ekonomike-Praktikum.pdf