Файл: «24. Распределенная технология обработки информации.pdf
Добавлен: 27.06.2023
Просмотров: 100
Скачиваний: 3
СОДЕРЖАНИЕ
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОБРАБОТКИ ИНФОРМАЦИИ
1.1.Понятие информации и ее обработки информации
1.2 Распределительная система управления
1.3 Характеристика распределительной обработки информации
ГЛАВА 2. РАЗНОВИДНОСТИ ОБРАБОТКИ ИНФОРМАЦИИ
2.1 Технология обработки текстовой информации
2.2 Технология обработки числовой информации в профильных курсах информатики
2.3 Преимущества и недостатки распределительной обработки данных
1. физико-математический;
2. социально-экономический;
3. информационно-технологический;
4. социально-гуманитарный;
5. естественно-научный (биология и географии). При изучении темы «Обработка числовой информации» для физико-математического профиля на практических занятиях целесообразно предложить задачи следующих типов: − построение графиков функций; − использование встроенных функций MSExcel; − моделирование физических экспериментов; − выполнение сложных расчетов с использованием макросов
Примеры: 1. Используя математические функции ОСТАТОК, ОТБР, получить сумму цифр числа от 0 до 999. 2. На отдельном листе рабочей книги построить график функции у=-4 х2+3 для всех целых х ∈ [-10, 10]. Для социально-экономического профиля на практических занятиях целесообразно предложить задачи следующих типов:
− выполнить финансовые вычисления в MS Excel;
− использовать финансовые функции для экономических расчетов;
− осуществлять сортировку, фильтрацию, консолидацию, подведение итоговисводные отчеты в базах данных, организованных на основе списков в MS Excel;
Примеры задач: 1. Рассчитать размер комиссии каждого продавца в зависимости от объема его продаж.
2. Рассчитать общий объѐм продаж, количество месяцев продаж и средний объѐм выручки в месяц для каждого товара, используя функции СУММ, СЧЁТ и СРЗНАЧ. Для информационно-технологического профиля на практических занятиях целесообразно предложить задачи следующих типов:
– работа в MSExcel с применением макросов;
– работа с БД;
– осуществлять сортировку, фильтрацию, консолидацию, подведение итоговисводные отчеты в базах данных, организованных на основе списков в MS Excel;
Примеры: 1. Создать макрос для преобразования всех букв в тексте в указанном диапазоне ячеек в прописные;
2. Отфильтровать данные в списке.
3. Объединить таблицы, которые находятся в разных книгах: Для социально-гуманитарного профиля на практических занятиях целесообразно предложить задачи следующих типов: – просматривать, дополнять и обновлять данные с помощью электронных форм; – находить и извлекать только лишь необходимые сведения с помощью запросов; – анализировать либо печатать данные в установленном макете с помощью отчетов.
Пример:
1. Используя функции категории "Текстовые" (СЦЕПИТЬ, ДЛСТР, ПСТР), выполнить задание. В ячейке A2 ввести своѐ имя, в ячейке A3 должно появится приветствие "Здравствуйте, Имя!".
2. Разработать таблицу, содержащую следующие сведения об абитуриентах: фамилия, оценки за экзамены по математике, русскому и иностранному языкам, сумма баллов за три экзамена и информацию о зачислении: если сумма баллов больше или равна проходному баллу и оценка за экзамен по математике — 4 или 5, то абитуриент зачислен в учебное заведение, в противном случае — нет.
Для естественно-научного профиля на практических занятиях целесообразно предложить задачи следующих типов: – построение графиков, диаграмм и гистограмм функций; – использование встроенных функций MSExcel; – использование пакета анализа данных;
Пример:
1. С помощью биномиального распределения определить, какова вероятность того, что 7 из 10 бригадиров, сдающих тест на технику безопасности, его пройдут, если вероятность успеха для каждого из бригадиров равна ½ (т. е. каждый бригадир знает половину материала). 2. С помощью инструментов пакета анализа данных сгенерировать массив случайных чисел, построить интервальный вариационный ряд, вычислить частоты и построить графики их распределения. Таким образом, подобранные с учетом профиля практические задания по обработке числовой информации с помощью MSExcel будут способствовать формированию не только информационной компетенции учащихся, но и начальному погружению их специфику будущей профессии
2.3 Преимущества и недостатки распределительной обработки данных
Проблемы распределенных баз данных
Исходя из определения Дэйта, распределенную базу данных в общем случае можно рассматривать как слабосвязанную сетевую структуру, узлы которой представляют собой локальные базы данных. Локальные базы данных автономны, независимы и самоопределены; доступ к ним обеспечивается от различных поставщиков. Связи между узлами — это потоки тиражируемых данных. Топология DDB варьируется в широком диапазоне: возможны варианты иерархии, структур типа звезда и т. д. В целом топология DDB определяется географией информационной системы и направленностью потоков тиражирования данных.
Рассмотрим теперь проблемы реальных распределенных баз данных. Проблемы централизованных СУБД существуют и здесь, однако децентрализация добавляет новые:
а) Какова общая модель данных распределенной системы? Мы должны иметь единую концептуальную схему всей сети. Это обеспечит логическую прозрачность данных для пользователя, в результате чего он сможет формировать запрос ко всей базе, находясь за отдельным терминалом (т. е. как бы работая с централизованной базой данных).
б) Необходима схема, определяющая местонахождение данных в сети. Это обеспечит прозрачность размещения данных, благодаря которой пользователь может не указывать, куда переслать запрос, чтобы получить требуемые данные.
в) Распределенные базы данных могут быть однородными или неоднородными по аппаратным и программным средствам. Проблему неоднородности сравнительно легко решить, если распределенная база является неоднородной по аппаратным средствам, но однородной по программным средствам (одинаковые СУБД в узлах). Если же в узлах распределенной системы используются разные СУБД, необходимы средства преобразования структур данных и языков. Это должно обеспечить прозрачность преобразования в узлах распределенной базы данных.
г) Управление словарями. Для обеспечения всех видов прозрачности в распределенной базе данных нужны программы, управляющие многочисленными справочниками или словарями.
д) Методы выполнения запросов в распределенной базе данных отличаются от аналогичных методов централизованных СУБД, так как отдельные части запроса нужно выполнять в месторасположении соответствующих данных и передавать частичные результаты на другие узлы; при этом должна быть обеспечена координация всех процессов.
е) В распределенной базе данных нужен сложный механизм управления одновременной обработкой, который, в частности, должен обеспечивать синхронизацию при обновлениях информации, это гарантирует непротиворечивость данных.
ж) Развитая методология распределения и размещения данных, включая разбиение, является одним из основных требований к распределенной базе данных.
База данных физически распределяется по узлам компьютерной информационной системы при помощи фрагментации и репликации (тиражирования) данных. [7]
4 Особенности распределенных баз данных
В сегодняшнем быстро меняющемся компьютерном мире сосуществуют по крайней мере три основные идеологии: клиент - сервер, Web и распределенные объекты (DCOM, CORBA). Внутри каждого направления также существует большое количество решений и стандартов от разных производителей. Сегодняшняя ситуация вызывает очень большую озабоченность независимых разработчиков и потребителей: Какую технологию выбрать и что будет со мной и моим бизнесом, если я приму неправильное решение? При этом очевидно, что цена ошибки будет весьма высока, кроме того большие средства уже вложены в разработку и эксплуатацию уже существующих систем.
Клиент-сервер
Термин "клиент-сервер" означает такую архитектуру программного комплекса, в которой его функциональные части взаимодействуют по схеме "запрос-ответ". Если рассмотреть две взаимодействующие части этого комплекса, то одна из них (клиент) выполняет активную функцию, т. е. инициирует запросы, а другая (сервер) пассивно на них отвечает. По мере развития системы роли могут меняться, например некоторый программный блок будет одновременно выполнять функции сервера по отношению к одному блоку и клиента по отношению к другому.
Любая информационная система должна иметь минимум три основные функциональные части - модули хранения данных, модули обработки и модули интерфейса с пользователем. Каждая из этих частей может быть реализована независимо от двух других. Например, не изменяя программ, используемых для хранения и обработки данных, можно изменить интерфейс с пользователем таким образом, что одни и те же данные будут отображаться в виде таблиц, графиков или гистограмм. Не меняя программ представления данных и их хранения, можно изменить программы обработки, например изменив алгоритм полнотекстового поиска. И наконец, не меняя программ представления и обработки данных, можно изменить программное обеспечение для хранения данных, перейдя, например, на другую файловую систему.
В классической архитектуре клиент-сервер приходится распределять три основные части приложения по двум физическим модулям. Обычно ПО хранения данных располагается на сервере (например, сервере базы данных), интерфейс с пользователем - на стороне клиента, а вот обработку данных приходится распределять между клиентской и серверной частями. В этом-то и заключается основной недостаток двухуровневой архитектуры, из которого следуют несколько неприятных особенностей, сильно усложняющих разработку клиент-серверных систем.
При разбиении алгоритмов обработки данных необходимо синхронизировать поведение обеих частей системы. Все разработчики должны иметь полную информацию о последних изменениях, внесенных в систему, и понимать эти изменения.
Это создает большие сложности при разработке клиент-серверных систем, их установке и сопровождении, поскольку необходимо тратить значительные усилия на координацию действий разных групп специалистов. В действиях разработчиков часто возникают противоречия, а это тормозит развитие системы и вынуждает изменять уже готовые и проверенные элементы.
Технология клиент-сервер по праву считается одним из "китов", на которых держится современный мир компьютерных сетей. Но те задачи, для решения которых она была разработана, постепенно уходят в прошлое, и на сцену выходят новые задачи и технологии, требующие переосмысления принципов клиент-серверных систем.
ГЛАВА 3.ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ОБРАБОТКИ ОТКРЫТОЙ ИНФОРМАЦИИ В УСЛОВИЯХ АКТИВНОГО РАЗВИТИЯ ИНФОРМАЦИОННО-КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ
По данным исследовательской компания Digital Universe, что в 2011 году мировой объем цифровой информации вырос до 1.8 зеттабайт (1.8 триллионов гигабайт). Через 5 лет, в 2016 году, данный показатель увеличится в 9 раз, а через 10 лет – уже в 50 раз. К 2020 году мировое сообщество произведет количество информации, которое будет превышать 35 зеттабайт. Резко увеличится, приблизительно в 75 раз, количество форматов данных, так называемых "контейнеров", а штат IT-специалистов, управляющих аппаратными и информационными средствами, оперирующими данными, увеличится всего в 1.5 раза [3].
Изменения, вызванные стремительным развитием ИКТ, способствующие более оперативному и полному доступу к большим объёмам открытой информации и сделали актуальными вопросы повышения эффективности поиска и обработки требуемой информации. В целях получения требуемой информации, для принятия рационального управленческого решения, задача поиска в информационном пространстве представляется перебором многомерного потока информации. В данных условиях простой перебор информации является неэффективным, так как, с достаточной вероятностью достоверности его еще необходимо своевременно и полно обработать.
В соответствии с теорией управления начальным и необходимым этапом принятия решения является оценка обстановки (текущей и перспективной). Чем сложнее является система, тем большего количества параметров текущей обстановки следует проанализировать. Для своевременного принятия решения и повышения эффективности работы руководителя необходимым является создание органов обработки информации (ООИ), призванных анализировать требуемые параметры в интересах принятия управленческого решения руководителем. По мере увеличения объёма информации, циркулирующего через ИКТ, выходные документы средств накопления и обработки информации постоянно усложняются и увеличиваются в объёме.
Однако возможности человека имеют свои ограничения, в частности средняя скорость чтения современного человека составляет 400 – 600 знаков в минуту при условии 100 % усвоения материала. Следовательно, в данных условиях традиционные задачи, такие как поиск и анализ растущего потока информации, требуют новых решений. С целью повышения эффективности работы организации применяется автоматизация трудоёмких процессов, в том числе и такого этапа деятельности организаций как обработка информации.