Файл: Распределенная технология обработки информации (Архитектурное построение систем распределенной обработки информации).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 04.04.2023

Просмотров: 209

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Введение

Распределенная обработка информации является одним из важнейших направлений интеграции сетевых технологий, позволяющая повысить результативность удовлетворения информационной потребности пользователя и обеспечить гибкость и оперативность принимаемых им решений.

Под распределенной обработкой информации понимается комплекс операций с информацией (обычно используется термин «обработка информации»), проводимый на независимых, но связанных между собой вычислительных машинах, предназначенных для выполнения общих задач.

Системы распределенной обработки информации (либо распределенные вычислительные системы) в виде многомашинных вычислительных комплексов и компьютерных сетей являются одной из наиболее прогрессивных и стремительно развивающихся форм организации средств вычислительной техники.

Появление и широкое распространение систем распределенной обработки информации обусловлено, с одной стороны, ускоренным развитием электронных технологий, снижением стоимости вычислительных средств, увеличением их производительности при уменьшении габаритов, а с другой стороны – повышением требований к производительности, надежности и эффективности вычислительных систем, предъявляемых сферами их применения.

Необходимо отметить, что распределение (или разделение) не идентично параллелизму. Распределение видов обработки информации состоит в том, чтобы поручить их вычислительным машинам, наилучшим образом приспособленным к этому. Параллелизм же подразумевает понятие одновременности обработки информации. При этом распределение позволяет в ряде ситуаций проводить эффективную параллельную обработку информации при выполнении больших объемов параллельных вычислений. Таким образом, в общем случае распределение не подразумевает параллелизма, но возможность «распараллелить» распределенную обработку информации существует.

Возможность взаимодействия вычислительных систем при реализации распределенной обработки информации определяют, как их способность к совместному использованию данных, так и к совместной работе с использованием стандартных интерфейсов. Взаимодействие подразумевает понятие «открытых систем», то есть систем, способных к коммуникации в неоднородной среде. Взаимодействие между программами с точки зрения хронологии последовательно приобретало следующие формы:

– обмен, когда программы различных систем посылают друг другу сообщения, как правило, файлы;


– разделение, когда имеется непосредственный доступ к ресурсам нескольких машин, например, совместное использование файлов;

– совместная работа, когда машины играют в реализацию программы взаимодополнения ролей.

Целью распределенной обработки информации считается оптимизация использования ресурсов и упрощение работы пользователя.

Под термином «ресурс» в данном случае имеется в виду следующее: производительность обработки (производительность машин и систем), емкость запоминающих устройств, наличие периферийных устройств ввода и вывода информации. Эти ресурсы не обязательно должны быть сконцентрированы в одной вычислительной машине или системе. В соответствии с принципами совместной работы различных машин и систем при реализации распределенной обработки информации могут быть использованы ресурсы каждой из систем или машин.

К достоинствам распределенной обработки информации можно отнести:

– возможность увеличения числа удаленных взаимодействующих пользователей, выполняющих функции сбора, обработки, хранения и передачи информации;

– снятие пиковых нагрузок с централизованной базы путем распределения обработки и хранения локальных баз на разных персональных компьютерах;

– обеспечение доступа пользователей к вычислительным ресурсам локальной вычислительной сети;

– обеспечение обмена данными между удаленными пользователями.

При распределенной обработке производится работа с базой данных. При этом работа с ней на логическом уровне производится на компьютере клиента, а поддержание базы в актуальном состоянии - на сервере.

К недостаткам реализации распределенной обработки информации относятся:

– проблемы безопасности;

– программа не сможет работать, если сеть повреждена;

– уменьшение эффективности перегруженной сети; при этом время реакции систем увеличивается;

– зависимость от характеристик и доступности сети.

Цель данного курсового проекта: изучение технологий и методов распределенной обработки информации, а также разобрать их архитектуру и свойства.

Для того, чтобы достичь цели курсового проекта, необходимо выполнить ряд задач:

  1. Понять, что такое распределенная система обработки информации.
  2. Разобрать виды и особенности систем с распределенной обработкой информации (данных).


Глава 1. Принципы организации распределенной обработки информации

1.1 Требования, предъявляемые к свойствам систем распределенной обработки информации

Для достижения реальных целей и эффективной распределенной обработки информации, вычислительные системы должны обладать рядом важнейших свойств (атрибутов), основными из которых являются открытость, прозрачность, и масштабируемость.

Для более наглядного и понятного представления рассмотрим данные свойства распределенной системы обработки информации более подробно.

1.1.1 Свойства Прозрачности

Распределенная система должна скрывать разницу в способах представления данных и в способах доступа к ресурсам. Такое свойство распределенных систем называется прозрачностью доступа к данным.

Распределенная система должна обеспечивать прозрачность местоположения ресурса, то есть скрывать его физическое расположение. Важно, чтобы ресурсы имели только логические имена. Примером такого имени является универсальный указатель ресурса URL, в котором нет никакой информации о том, где находится файл, который ищется в Интернете.

Ресурс может время от времени менять свое расположение, и при следующем вызове может быть обнаружен в другом месте (но по тому же логическому адресу). Распределенная система, позволяющая ресурсам менять свое расположение от вызова к вызову, обладает свойством прозрачности смены местоположения ресурса (пример – система ICQ).

Порой ресурсу было позволено менять свое положение непосредственно во время его использования (пример такого ресурса – мобильные пользователи с беспроводной связью, неотключающиеся от сети при переходе в другую зону обслуживания). Это более сильное свойство называется прозрачностью динамической смены местоположения ресурса.

Для балансировки использования ресурсов они могут быть реплицированы, то есть, размножены по нескольким физическим адресам. Прозрачность репликации скрывает это. Из наличия этого свойства сразу следует и прозрачность местоположения.


Часто совместное использование ресурсов достигается за счет совместной работы и тесного взаимодействия пользователей системы. Однако пользователь распределенной системы не должен знать, что он считается не единственным ее пользователем. Например, при работе с системой управления базой данных (СУБД) пославший запрос пользователь не должен знать, что одновременно СУБД получает и обрабатывает запросы многих других пользователей. Такое прозрачное параллельное использование должно быть непротиворечивым, для чего составляются специальные правила блокировок, когда пользователи поочередно получают исключительные права на ресурс.

В распределенной системе должны быть приняты меры, чтобы часть аппаратуры брала на себя выполнение работы в случае выхода из строя другой части системы. Основная трудность достижения прозрачности поломки в том, чтобы отличить по-настоящему сломанные части от медленно работающих фрагментов системы.

Данные могут размещаться на различных физических носителях, в том числе таких, которые могут сохранять их значения в период выключения системы. Действия системы, обладающей свойством прозрачности сохранности данных, при обработке таких объектов должны быть скрыты от пользователя. Сохранность важна для любых информационных систем, не только распределенных.

Существуют ситуации, когда полностью скрыть распределенность (то есть достичь абсолютной прозрачности) не удается. При сильной удаленности узлов системы друга от друга возникают заметные задержки передачи информации. Существует проблема часовых поясов. Существует связь между прозрачностью и производительностью распределенной системы. Необходимо соблюдать баланс этих системных свойств.

1.1.2 Свойства Открытости

Открытость – это использование синтаксических и семантических правил, основанных на стандартах. Для распределенной системы – это использование формализованных протоколов. Службы, входящие в распределенную систему, определяются через интерфейсы, которые часто описываются при помощи языков описания интерфейсов IDL. Языки IDL касаются почти исключительно синтаксиса (имена доступных функций, типы параметров, возвращаемых значений, исключительные ситуации). Семантика чаще задается неформально, на естественном языке.

Если интерфейс описан правильно, возникает возможность правильной совместной работы одного произвольного процесса, нуждающегося в интерфейсе, с другим произвольным процессом, представляющим интерфейс. Один и тот же интерфейс может быть реализован в разных распределенных системах (независимо друг от друга), но работать обе системы будут одинаково. Для обеспечения переносимости и способности к взаимодействию в интерфейсе должно быть все, что нужно для его реализации, но он не должен определять внешний вид реализации. Переносимость характеризует, насколько приложение, сделанное для одной распределенной системы, может работать в составе другой системы, а способность к взаимодействию показывает, насколько две реализации систем либо компонентов, выполненных разными людьми, в состоянии работать совместно.


Открытые системы обладают очень важной характеристикой – гибкостью. Гибкость – это легкость конфигурирования системы, состоящей из различных компонентов. Достижения необходимого уровня гибкости приводит к тому, что открытая распределенная система становится расширяемой.

1.1.3 Свойство Масштабируемости

Распределенные системы программного обеспечения обладают свойством масштабируемости или расширяемости, которая может проявляться по отношению к размеру, географическому положению и административному устройству систем.

Достижение масштабируемости связано с решением проблем, возникающих из-за наличия узких мест по обслуживанию (один сервер для множества клиентов), данным (множественный доступ к одному файлу данных), и алгоритмам (перегрузка коммуникаций из-за использования централизованных алгоритмов).

Требование масштабируемости часто считается препятствием распространения систем, реализованных для локальных сетей, на уровень глобальных сетей (корпоративных или Интернета). В глобальных сетях время получения ответа может значительно превышать локальные задержки, поэтому там чаще используется асинхронная связь. Кроме того, в локальных сетях службы часто распределены по компьютерам фиксировано, а в глобальных сетях местоположение необходимой службы заранее неизвестно.

Еще одно следствие масштабируемости: аппаратные решения для распределенных систем могут быть гетерогенными. В отличие от гомогенных систем, построенных на единой технологии, гетерогенные системы могут состоять из частей, построенных на разных физических принципах, и обладающих разными свойствами и характеристиками.

Разнородность в сочетании с независимостью приводят к важнейшему свойству распределенных систем: сами системы могут существовать продолжительное время, но отдельные их части имеют свойство время от времени отключаться. При этом пользователи и приложения не должны уведомляться о том, что эти части вновь подключены, что добавлены новые части для поддержки дополнительных пользователей либо приложений.

1.2 Логические слои прикладного программного обеспечения вычислительных систем