Файл: WWW (World Wide Web) - глобальный механизм обмена информацией.pdf

ВУЗ: Не указан

Категория: Реферат

Дисциплина: Не указана

Добавлен: 05.07.2023

Просмотров: 237

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ВВЕДЕНИЕ

гипертекстовый интернет сеть

Когда говорят о работе в сети Интернет или об ее использовании, то на самом деле речь идет не об Интернете в целом, а только об одной или нескольких из его многочисленных служб - World Wide Web.

Актуальность данной темы объясняется тем, что с каждым годом количество пользователей Всемирной паутины неуклонно растёт, а данная система предоставляет массу возможностей своему клиенту. Интернет состоит из взаимосвязанных сетей, эксплуатируемых университетами, государственными учреждениями, военными, корпорациями и организациями, а также физическими лицами. Эти сети связаны друг с другом различными видами оборудования. «Всемирная паутина» спроектирована для использования со всеми сетевыми службами.

Объект исследования: система World Wide Web.

Предмет исследования: развитие системы World Wide Web в сети Интернет.

Цель исследования: изучение развития системы World Wide Web в сети Интернет.

Исходя из поставленной цели, определим задачи курсовой работы:

1. изучить понятие World Wide Web и её развитие в функционировании сети Интернет;

. охарактеризовать архитектуру и основные компоненты Всемирной паутины;

. выявить структуру и принципы World Wide Web;

. разобрать применение гипертекстовых технологий;

. проанализировать перспективы развития Всемирной паутины.

Гипотеза: если полностью изучить систему World Wide Web, то пользователь сможет использовать ресурсы Всемирной паутины во всех её видах. Методы исследования: теоретические - анализ, синтез, сравнение.

1. НАЗНАЧЕНИЕ И ОСОБЕННОСТИ СИСТЕМЫ WORLD WIDE WEB

1.1 Возникновение World Wide Web

В отличие от самой сети интернет, возникшей в 1983 году, World Wide Web имеет весьма непродолжительную историю. В 1989 году группа исследователей в Женеве из CERN (Европейская лаборатория физики элементарных частиц) поставила перед собой задачу создать систему, которая предоставила бы научным группам, работающим в разных городах и странах, легкий и удобный способ доступа к совместно используемой информации. Во главе этой работы стоял Тим Бернерс-Ли, - человек, положивший начало World Wide Web, и перевернувший тем самым мир. В конце восьмидесятых годов он, работая в CERN, выбрал идею гипертекста для построения будущей информационной среды. Лаборатория CERN была поистине уникальным местом, одним из наиболее важных центров тогдашней сети Интернет [12].


В исследованиях CERN участвовали коллективы, работающие в различных научных центрах и заинтересованные в постоянном обмене информацией. Однако при использовании традиционных средств Интернет выполнение такого, простого на первый взгляд, действия, как просмотр текста или графического изображения, часто требовало поиска местонахождения нужного документа, установления соединения с удаленным компьютером, где он содержится, и перемещения документа на локальный компьютер. Кроме того, для выполнения этих действий нужно было работать с несколькими различными программами, такими как Telnet (сетевой протокол для реализации текстового интерфейса по сети), FTP (стандартный протокол, предназначенный для передачи файлов по TCP-сетям (например, Интернет)) и с программами просмотра графических изображений. Поэтому возникла задача разработки системы, которая предоставляла бы единообразный способ доступа ко всем видам информации и не требовала выполнения многих промежуточных шагов для достижения конечной цели.

В течение года были определены основные концепции проекта, и работа началась. К концу 1990 года исследователи CERN располагали программой просмотра, работающей в текстовом режиме. В 1991 году система WWW стала широко использоваться в CERN. Первоначально пользователям предоставлялся доступ только к гипертекстовым документам и к статьям телеконференций UseNet (глобальная система дискуссий, организованная подобно рекламным объявлениям, которые мы обычно видим на последних страницах газет). По мере развития проекта добавился интерфейс к другим видам сервиса Интернет.

В 1992 году лаборатория CERN начала широко распространять информацию о проекте WWW. Осознание мировым сообществом Интернет больших возможностей этой системы привело к созданию многочисленных WWW-серверов, предоставляющих доступ к самой разнообразной информации. Несмотря на то, что концепция функционирования сервера WWW уже существовала, практическое применение этого сервиса пользователями Интернет было невозможно вплоть до февраля 1993года, когда в Суперкомпьютерном центре Иллинойского университета была создана альфа-версия NCSA Mosaic - самой первой программы просмотра документов на серверах WWW. Именно с этого момента начался лавинообразный рост Интернет [3].

Таким образом, на создание системы WWW и её распространение ушло практически 5 лет. А это совсем незначительное время для разработки такого мощного проекта.

1.2 Архитектура и основные компоненты World Wide Web систем


Перейдем к архитектуре взаимодействия программного обеспечения в системе World Wide Web. WWW построена по схеме «клиент-сервер». На рисунке 1 показано, как работает такая система.

Рис.1. - Работа системы «клиент-сервер»

Программа-клиент выполняет функции интерфейса пользователя и обеспечивает доступ практически ко всем информационным ресурсам Интернет. В этом смысле она выходит за обычные рамки работы клиента только с сервером определенного протокола. На рисунке 2 показано, как разделены функции в этой схеме.

Рис.2. - Разделение функций в схеме «клиент-сервер»

Отчасти, довольно широко распространенное мнение, что Mosaic безусловно является WWW - клиентом, это просто графический интерфейс в сети Интернет является отчасти верным. Однако, как уже было отмечено, базовые компоненты WWW -технологии (HTML и URL) играют при доступе к другим ресурсам Mosaic не последнюю роль, и поэтому мульти протокольные клиенты должны быть отнесены именно к World Wide Web, а не к другим информационным технологиям.

Фактически, клиент - это программа, выполняющая подробную обработку (анализ) HTML. И как типичный интерпретатор, клиент в зависимости от команд выполняет различные функции. В круг этих функций входит не только размещение текста на экране, но и обмен информацией с сервером по мере анализа полученного HTML-текста, что наиболее наглядно происходит при отображении встроенных в текст графических образов. При анализе URL-спецификации или по командам сервера клиент запускает дополнительные внешние программы для работы с документами в форматах, отличных от HTML, например GIF, JPEG, MPEG и т.п. Вообще, для запуска клиентом программ независимо от типа документа была разработана программа Luncher. Эта программа отвечает за внешний вид интерфейса, за рабочие столы, меню приложений, иконки приложений, экран блокировки, виджеты и дополнительные функции самой программы. Но в последнее время гораздо большее распространение получил механизм согласования запускаемых программ через MIME-типы (Multipurpose Internet Mail Extensions - многоцелевые расширения интернет-почты).

Другую часть программного комплекса WWW составляют сервер протокола HTTP, базы данных документов в формате HTML, управляемые сервером, и программное обеспечение, разработанное в стандарте спецификации CGI. До самого последнего времени реально использовалось два HTTP-сервера: сервер CERN и сервер NCSA. Но в настоящее время число базовых серверов расширилось. Два последних можно выделить из соображений доступности использования. Сервер для Windows - это shareware, т.е. условно-бесплатное программное обеспечение, но без встроенного самоликвидатора. Такое программное обеспечение дает возможность попробовать, что же такое Интернет. Второй сервер - это ответ на угрозу коммерциализации. Был разработан Apachie (свободный веб - сервер), который, по словам его авторов будет freeware. Freeware не предполагает никакой платы разработчику и соответственно, никаких дополнительных услуг, таких как улучшенные версии, за эту плату не предполагается. Он реализует новые дополнения к протоколу HTTP, связанные с защитой от несанкционированного доступа, которые предложены группой по разработке этого протокола и реализуются практически во всех коммерческих серверах [6].


База данных HTML-документов - это часть файловой системы, которая содержит текстовые файлы в формате HTML и связанные с ними графику и другие ресурсы. Особое внимание хотелось бы обратить на документы, содержащие элементы экранных форм. Эти документы реально обеспечивают доступ к внешнему программному обеспечению.

Прикладное программное обеспечение, работающее с сервером, можно разделить на программы-шлюзы и прочие программы. Шлюзы - это программы, обеспечивающие взаимодействие сервера с серверами других протоколов или с распределенными на сети серверами Oracle. Прочие программы - это программы, принимающие данные от сервера и выполняющие какие-либо действия: получение текущей даты, реализацию графических ссылок, доступ к локальным базам данных или расчеты [16].

Компоненты WWW существуют практически для всех типов компьютерных платформ и свободно доступны в сети. Любой, кто имеет доступ в Интернет, может создать свой WWW-сервер, или, по крайней мере, посмотреть информацию с других серверов.

К 1989 году гипертекст представлял новую, многообещающую технологию, которая имела относительно большое число реализаций с одной стороны, а с другой стороны делались попытки построить формальные модели гипертекстовых систем, которые носили скорее описательный характер и были навеяны успехом реляционного подхода описания данных. Идея Т. Бернерс-Ли заключалась в том, чтобы применить гипертекстовую модель к информационным ресурсам, распределенным в сети, и сделать это максимально простым способом. Он заложил три краеугольных камня системы из четырех существующих ныне, разработав:

 язык гипертекстовой разметки документов HTML (Hyper Text Markup Language);

 универсальный способ адресации ресурсов в сети URL (Universal Resource Locator);

 протокол обмена гипертекстовой информацией HTTP (Hyper Text Transfer Protocol).

Позже команда NCSA добавила к этим трем компонентам четвертый:

 универсальный интерфейс шлюзов CGI (Common Gateway Interface).

Идея HTML - пример чрезвычайно удачного решения проблемы построения гипертекстовой системы при помощи специального средства управления отображением. На разработку языка гипертекстовой разметки существенное влияние оказали два фактора: исследования в области интерфейсов гипертекстовых систем и желание обеспечить простой и быстрый способ создания гипертекстовой базы данных, распределенной на сети [13].

В 1989 году активно обсуждалась проблема интерфейса гипертекстовых систем, т.е. способов отображения гипертекстовой информации и навигации в гипертекстовой сети. Значение гипертекстовой технологии сравнивали со значением книгопечатания. Утверждалось, что лист бумаги и компьютерные средства отображения/воспроизведения серьезно отличаются друг от друга, и поэтому форма представления информации тоже должна отличаться. Наиболее эффективной формой организации гипертекста были признаны контекстные гипертекстовые ссылки, а кроме того было признано деление на ссылки, ассоциированные со всем документом в целом и отдельными его частями [4].


Самым простым способом создания любого документа является его набивка в текстовом редакторе. Опыт создания хорошо размеченных для последующего отображения документов в CERN-е был - трудно найти физика, который не пользовался бы системой TeX или LaTeX. Кроме того к тому времени существовал стандарт языка разметки - Standard Generalised Markup Language (SGML).

Следует также принять во внимание, что согласно своим предложениям Тим Бернерс-Ли предполагал объединить в единую систему имеющиеся информационные ресурсы CERN, и первыми демонстрационными системами должны были стать системы для NeXT и VAX/VMS.

Обычно гипертекстовые системы имеют специальные программные средства построения гипертекстовых связей. Сами гипертекстовые ссылки хранятся в специальных форматах или даже составляют специальные файлы. Такой подход хорош для локальной системы, но не для распределенной на множестве различных компьютерных платформ. В HTML гипертекстовые ссылки встроены в тело документа и хранятся как его часть. Часто в системах применяют специальные форматы хранения данных для повышения эффективности доступа. В WWW документы - это обычные ASCII-файлы, которые можно подготовить в любом текстовом редакторе. Таким образом, проблема создания гипертекстовой базы данных была решена чрезвычайно просто.

В качестве базы для разработки языка гипертекстовой разметки был выбран SGML. Следуя академическим традициям, Бернерс-Ли описал HTML в терминах SGML. Естественно, что в HTML были реализованы все разметки, связанные с выделением параграфов, шрифтов, стилей и т. п., так как реализация для NeXT подразумевала графический интерфейс. Важным компонентом языка стало описание встроенных и ассоциированных гипертекстовых ссылок, встроенной графики и обеспечение возможности поиска по ключевым словам.

С момента разработки первой версии языка (HTML 1.0) прошло уже двадцать лет. За это время произошло довольно серьезное развитие языка. Почти вдвое увеличилось число элементов разметки, оформление документов все больше приближается к оформлению качественных печатных изданий, развиваются средства описания не текстовых информационных ресурсов и способы взаимодействия с прикладным программным обеспечением. Совершенствуется механизм разработки типовых стилей. Фактически, в настоящее время HTML развивается в сторону создания стандартного языка разработки интерфейсов как локальных, так и распределенных систем.

Вторым краеугольным камнем WWW стала универсальная форма адресации информационных ресурсов. Universal Resource Identification (URI) представляет собой довольно стройную систему. Но реально из всего, что описано в URI, для организации баз данных в WWW требуется только Universal Resource Locator (URL). Без наличия этой спецификации вся мощь HTML оказалась бы бесполезной. URL используется в гипертекстовых ссылках и обеспечивает доступ к распределенным ресурсам сети. В URL можно адресовать как другие гипертекстовые документы формата HTML, так и ресурсы e -mail и telnet, например. Различные интерфейсные программы по-разному осуществляют доступ к этим ресурсам. Одни сами способны поддерживать взаимодействие по протоколам, отличным от протокола HTTP, базового для WWW, другие вызывают для этой цели внешние программы. Однако, даже в первом случае, базовой формой представления отображаемой информации является HTML, а ссылки на другие ресурсы имеют форму URL. Следует отметить, что программы обработки электронной почты в формате MIME также имеют возможность отображать документы, представленные в формате HTML. Для этой цели в MIME зарезервирован тип «text/html».