Файл: «24. Распределенная технология обработки информации.pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 27.06.2023

Просмотров: 99

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

1. физико-математический;

2. социально-экономический;

3. информационно-технологический;

4. социально-гуманитарный;

5. естественно-научный (биология и географии). При изучении темы «Обработка числовой информации» для физико-математического профиля на практических занятиях целесообразно предложить задачи следующих типов: − построение графиков функций; − использование встроенных функций MSExcel; − моделирование физических экспериментов; − выполнение сложных расчетов с использованием макросов

Примеры: 1. Используя математические функции ОСТАТОК, ОТБР, получить сумму цифр числа от 0 до 999. 2. На отдельном листе рабочей книги построить график функции у=-4 х2+3 для всех целых х ∈ [-10, 10]. Для социально-экономического профиля на практических занятиях целесообразно предложить задачи следующих типов:

− выполнить финансовые вычисления в MS Excel;

− использовать финансовые функции для экономических расчетов;

− осуществлять сортировку, фильтрацию, консолидацию, подведение итоговисводные отчеты в базах данных, организованных на основе списков в MS Excel;

Примеры задач: 1. Рассчитать размер комиссии каждого продавца в зависимости от объема его продаж.

2. Рассчитать общий объѐм продаж, количество месяцев продаж и средний объѐм выручки в месяц для каждого товара, используя функции СУММ, СЧЁТ и СРЗНАЧ. Для информационно-технологического профиля на практических занятиях целесообразно предложить задачи следующих типов:

– работа в MSExcel с применением макросов;

– работа с БД;

– осуществлять сортировку, фильтрацию, консолидацию, подведение итоговисводные отчеты в базах данных, организованных на основе списков в MS Excel;

Примеры: 1. Создать макрос для преобразования всех букв в тексте в указанном диапазоне ячеек в прописные;

2. Отфильтровать данные в списке.

3. Объединить таблицы, которые находятся в разных книгах: Для социально-гуманитарного профиля на практических занятиях целесообразно предложить задачи следующих типов: – просматривать, дополнять и обновлять данные с помощью электронных форм; – находить и извлекать только лишь необходимые сведения с помощью запросов; – анализировать либо печатать данные в установленном макете с помощью отчетов.

Пример:

1. Используя функции категории "Текстовые" (СЦЕПИТЬ, ДЛСТР, ПСТР), выполнить задание. В ячейке A2 ввести своѐ имя, в ячейке A3 должно появится приветствие "Здравствуйте, Имя!".

2. Разработать таблицу, содержащую следующие сведения об абитуриентах: фамилия, оценки за экзамены по математике, русскому и иностранному языкам, сумма баллов за три экзамена и информацию о зачислении: если сумма баллов больше или равна проходному баллу и оценка за экзамен по математике — 4 или 5, то абитуриент зачислен в учебное заведение, в противном случае — нет.


Для естественно-научного профиля на практических занятиях целесообразно предложить задачи следующих типов: – построение графиков, диаграмм и гистограмм функций; – использование встроенных функций MSExcel; – использование пакета анализа данных;

Пример:

1. С помощью биномиального распределения определить, какова вероятность того, что 7 из 10 бригадиров, сдающих тест на технику безопасности, его пройдут, если вероятность успеха для каждого из бригадиров равна ½ (т. е. каждый бригадир знает половину материала). 2. С помощью инструментов пакета анализа данных сгенерировать массив случайных чисел, построить интервальный вариационный ряд, вычислить частоты и построить графики их распределения. Таким образом, подобранные с учетом профиля практические задания по обработке числовой информации с помощью MSExcel будут способствовать формированию не только информационной компетенции учащихся, но и начальному погружению их специфику будущей профессии

2.3 Преимущества и недостатки распределительной обработки данных

Проблемы распределенных баз данных

Исходя из определения Дэйта, распределенную базу данных в общем случае можно рассматривать как слабосвязанную сетевую структуру, узлы которой представляют собой локальные базы данных. Локальные базы данных автономны, независимы и самоопределены; доступ к ним обеспечивается от различных поставщиков. Связи между узлами — это потоки тиражируемых данных. Топология DDB варьируется в широком диапазоне: возможны варианты иерархии, структур типа звезда и т. д. В целом топология DDB определяется географией информационной системы и направленностью потоков тиражирования данных.

Рассмотрим теперь проблемы реальных распределенных баз данных. Проблемы централизованных СУБД существуют и здесь, однако децентрализация добавляет новые:

а) Какова общая модель данных распределенной системы? Мы должны иметь единую концептуальную схему всей сети. Это обеспечит логическую прозрачность данных для пользователя, в результате чего он сможет формировать запрос ко всей базе, находясь за отдельным терминалом (т. е. как бы работая с централизованной базой данных).

б) Необходима схема, определяющая местонахождение данных в сети. Это обеспечит прозрачность размещения данных, благодаря которой пользователь может не указывать, куда переслать запрос, чтобы получить требуемые данные.


в) Распределенные базы данных могут быть однородными или неоднородными по аппаратным и программным средствам. Проблему неоднородности сравнительно легко решить, если распределенная база является неоднородной по аппаратным средствам, но однородной по программным средствам (одинаковые СУБД в узлах). Если же в узлах распределенной системы используются разные СУБД, необходимы средства преобразования структур данных и языков. Это должно обеспечить прозрачность преобразования в узлах распределенной базы данных.

г) Управление словарями. Для обеспечения всех видов прозрачности в распределенной базе данных нужны программы, управляющие многочисленными справочниками или словарями.

д) Методы выполнения запросов в распределенной базе данных отличаются от аналогичных методов централизованных СУБД, так как отдельные части запроса нужно выполнять в месторасположении соответствующих данных и передавать частичные результаты на другие узлы; при этом должна быть обеспечена координация всех процессов.

е) В распределенной базе данных нужен сложный механизм управления одновременной обработкой, который, в частности, должен обеспечивать синхронизацию при обновлениях информации, это гарантирует непротиворечивость данных.

ж) Развитая методология распределения и размещения данных, включая разбиение, является одним из основных требований к распределенной базе данных.

База данных физически распределяется по узлам компьютерной информационной системы при помощи фрагментации и репликации (тиражирования) данных. [7]

4 Особенности распределенных баз данных

В сегодняшнем быстро меняющемся компьютерном мире сосуществуют по крайней мере три основные идеологии: клиент - сервер, Web и распределенные объекты (DCOM, CORBA). Внутри каждого направления также существует большое количество решений и стандартов от разных производителей. Сегодняшняя ситуация вызывает очень большую озабоченность независимых разработчиков и потребителей: Какую технологию выбрать и что будет со мной и моим бизнесом, если я приму неправильное решение? При этом очевидно, что цена ошибки будет весьма высока, кроме того большие средства уже вложены в разработку и эксплуатацию уже существующих систем.

Клиент-сервер

Термин "клиент-сервер" означает такую архитектуру программного комплекса, в которой его функциональные части взаимодействуют по схеме "запрос-ответ". Если рассмотреть две взаимодействующие части этого комплекса, то одна из них (клиент) выполняет активную функцию, т. е. инициирует запросы, а другая (сервер) пассивно на них отвечает. По мере развития системы роли могут меняться, например некоторый программный блок будет одновременно выполнять функции сервера по отношению к одному блоку и клиента по отношению к другому.


Любая информационная система должна иметь минимум три основные функциональные части - модули хранения данных, модули обработки и модули интерфейса с пользователем. Каждая из этих частей может быть реализована независимо от двух других. Например, не изменяя программ, используемых для хранения и обработки данных, можно изменить интерфейс с пользователем таким образом, что одни и те же данные будут отображаться в виде таблиц, графиков или гистограмм. Не меняя программ представления данных и их хранения, можно изменить программы обработки, например изменив алгоритм полнотекстового поиска. И наконец, не меняя программ представления и обработки данных, можно изменить программное обеспечение для хранения данных, перейдя, например, на другую файловую систему.

В классической архитектуре клиент-сервер приходится распределять три основные части приложения по двум физическим модулям. Обычно ПО хранения данных располагается на сервере (например, сервере базы данных), интерфейс с пользователем - на стороне клиента, а вот обработку данных приходится распределять между клиентской и серверной частями. В этом-то и заключается основной недостаток двухуровневой архитектуры, из которого следуют несколько неприятных особенностей, сильно усложняющих разработку клиент-серверных систем.

При разбиении алгоритмов обработки данных необходимо синхронизировать поведение обеих частей системы. Все разработчики должны иметь полную информацию о последних изменениях, внесенных в систему, и понимать эти изменения.

Это создает большие сложности при разработке клиент-серверных систем, их установке и сопровождении, поскольку необходимо тратить значительные усилия на координацию действий разных групп специалистов. В действиях разработчиков часто возникают противоречия, а это тормозит развитие системы и вынуждает изменять уже готовые и проверенные элементы.

Технология клиент-сервер по праву считается одним из "китов", на которых держится современный мир компьютерных сетей. Но те задачи, для решения которых она была разработана, постепенно уходят в прошлое, и на сцену выходят новые задачи и технологии, требующие переосмысления принципов клиент-серверных систем.


ГЛАВА 3.ПОВЫШЕНИЕ ЭФФЕКТИВНОСТИ ОБРАБОТКИ ОТКРЫТОЙ ИНФОРМАЦИИ В УСЛОВИЯХ АКТИВНОГО РАЗВИТИЯ ИНФОРМАЦИОННО-КОММУНИКАЦИОННЫХ ТЕХНОЛОГИЙ

По данным исследовательской компания Digital Universe, что в 2011 году мировой объем цифровой информации вырос до 1.8 зеттабайт (1.8 триллионов гигабайт). Через 5 лет, в 2016 году, данный показатель увеличится в 9 раз, а через 10 лет – уже в 50 раз. К 2020 году мировое сообщество произведет количество информации, которое будет превышать 35 зеттабайт. Резко увеличится, приблизительно в 75 раз, количество форматов данных, так называемых "контейнеров", а штат IT-специалистов, управляющих аппаратными и информационными средствами, оперирующими данными, увеличится всего в 1.5 раза [3].

Изменения, вызванные стремительным развитием ИКТ, способствующие более оперативному и полному доступу к большим объёмам открытой информации и сделали актуальными вопросы повышения эффективности поиска и обработки требуемой информации. В целях получения требуемой информации, для принятия рационального управленческого решения, задача поиска в информационном пространстве представляется перебором многомерного потока информации. В данных условиях простой перебор информации является неэффективным, так как, с достаточной вероятностью достоверности его еще необходимо своевременно и полно обработать.

В соответствии с теорией управления начальным и необходимым этапом принятия решения является оценка обстановки (текущей и перспективной). Чем сложнее является система, тем большего количества параметров текущей обстановки следует проанализировать. Для своевременного принятия решения и повышения эффективности работы руководителя необходимым является создание органов обработки информации (ООИ), призванных анализировать требуемые параметры в интересах принятия управленческого решения руководителем. По мере увеличения объёма информации, циркулирующего через ИКТ, выходные документы средств накопления и обработки информации постоянно усложняются и увеличиваются в объёме.

Однако возможности человека имеют свои ограничения, в частности средняя скорость чтения современного человека составляет 400 – 600 знаков в минуту при условии 100 % усвоения материала. Следовательно, в данных условиях традиционные задачи, такие как поиск и анализ растущего потока информации, требуют новых решений. С целью повышения эффективности работы организации применяется автоматизация трудоёмких процессов, в том числе и такого этапа деятельности организаций как обработка информации.