Файл: Языки гипертекстовой разметки (Понятие гипертекста).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 01.04.2023

Просмотров: 88

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Первую задачу решили за счёт выбора теговой модели описания документа. Язык HTML позволяет размечать электронный документ, отображающийся на экране с полиграфическим уровнем оформления; результирующий документ содержит различные метки, иллюстрации, и т.п.

Второй серьёзный момент, который повлиял на судьбу HTML, это то, что за основу был взят обычный текстовый файл. Среда редактирования HTML — это нейтральная полоса между простым текстовым файлом и приложением WYSIWYG (whаt yоu sее is whаt yоu gеt – что вы видите, то и получаете).

Гипертекстовые ссылки, которые устанавливают связи между текстовыми документами, со временем стали объединять различные информационные ресурсы. Система гиперссылок HTML даёт возможность построить систему взаимосвязанных документов по разным критериям. Язык HTML содержит команды, которые позволяют управлять размером и формой шрифтов, размером и расположением изображений, и так далее. Документы в HTML - формате представляют собой текстовый файл, который содержит в себе все нужные сведения о выводимой на экран информации. Для управления сценариями просмотра страниц сайта можно пользоваться языками программирования, таких как JаvаSсript, VBSсript и Java. Формы для введения данных, подвергающиеся позднее обработке можно обрабатывать с помощью специальных серверных программ (например, на языках PHP или Perl). Язык HTML позволяет пользователю размещать на страницах интерактивные кнопки и гипертекстовые ссылки, соединяющие Web-страницы с другими страницами сайта, равно как и с любыми другими сайтами.

HTML не является языком программирования, как ошибочно думают многие, это лишь язык разметки текста, один из инструментов, который используют при создании Web-страниц.

Статический и динамический HTML-документы

Существует два вида HTML-документов – статические и динамические. Статические документы хранятся в файлах той файловой системы, которая используется web-сервером или браузером при просмотре локальных файлов. При размещении информации на web-сервере можно использовать динамические документы – те, которые не существуют постоянно в виде файлов, а создаются в момент запроса клиента. Причём конечному пользователю не важно, какой из способов используется.

Для создания динамического документа HTML необходима специально написанная программа по правилам, которые определяет web-сервер.

Динамический способ обязывает хранить данные в формализованном виде, например в базе данных.

В тех случаях, когда данные хранятся в формализованном виде, то, используя шаблоны документов, в которых были произведены изменения, генерируются статические документы. Для их генерирования можно использовать любые средства отчётов, которые имеются в той системе управления баз данных (СУБД), в которой обработаны данные.


2.3 Расширяемый язык разметки XML

Вторая половина 90-х годов двадцатого века отметилась серьёзными переменами в технологиях Wеb. За свою короткую историю, Wеb приобрёл многие сотни миллионов пользователей во всём мире, в его среде сформированы и поддерживаются огромные информационные ресурсы. Эта глобальная информационная система вторглась во многие области информационных технологий и стала одним из важнейших звеньев инфраструктуры информационного общества.

При этом ограничения, свойственные действующим технологиям Wеb (Wеb первого поколения или Wеb-1), стали сдерживающим фактором дальнейшего его развития. Новые решения в области технологий Web, которые начали воплощаться в жизнь на рубеже веков, направлены на преодоление этих ограничений и создание технологической платформы, обеспечивающей потенциал для появления нового поколения Wеb (Web-2) и возможностей его развития. Главную роль в технологическом переоснащении Wеb стал играть разработанный консорциумом W3C новый язык разметки XML (Еxtеnsiblе Mаrkup Lаnguаgе, расширяемый язык разметки). Язык XML – это метаязык, который представляет из себя подъязык SGML.

Стоит заметить, что аббревиатуру XML очень часто используют для обозначения не только самого языка XML, но и других связанных с ним понятий — определяющего язык стандарта W3C, информационных ресурсов XML, комплекса основанных на языке XML стандартов консорциума W3C, которые составляют платформу XML.

Не смотря на то, что язык XML используют в среде Wеb по прямому назначению — как выразительное средство для представления информационных ресурсов в этой среде, он вместе с тем интенсивно внедряется в другие технологии. Возможности языка и его поддержка механизмами среды Wеb позволяют использовать XML в качестве языка-посредника для определения форматов обмена данными между всевозможными системами, использующими Intеrnеt как коммуникационную среду.

Основная сфера применения стандартов платформы XML — это представление слабоструктурированных данных Web-сайтов в форме XML-документов. Именно для этого и создавался этот язык. Применение XML в этой области позволяет не только представлять в среде Wеb гиперстраницы в форме XML-документов, но и поддерживать связанные с этими страницами метаданные. С помощью такой технологии создаются такие поисковые машины Wеb, которые обеспечивают более низкий уровень информационного шума, чем нынешние HTML-технологии.


Практически самой главной целью создания платформы XML является привнесение в среду Web метаданных, которые описывают свойства поддерживаемых в ней информационных ресурсов. Имеется ввиду описание структуры XML-документов и их семантики. При наличии явного описания структуры, их проверку может выполнять браузер. Описание семантики документов может быть полезно для новых или модернизированных поисковых машин, и для различных нуждающихся в нём Wеb-приложений.

Но довольно часто не учитывается ещё одно важное назначение метаданных, которые описывают информационные ресурсы Wеb. Они нужны для создания новых высокоуровневых приложений Wеb, которые основаны на интеграции информационных технологий и обеспечивают интеграцию неоднородных информационных ресурсов.

Пространства имён XML

Самая простая возможность задания семантики — использование пространства имён. В отличие от языка HTML, который обеспечивает форматную разметку текста, определяющую его представление на экране, XML служит для структурной разметки.

Разметка в XML позволяет отмечать в тексте содержательные структурные единицы, которые называют элементами XML-документа. Для выделения каждого типа элементов используется свой собственный тег, который указывает имя типа элемента. Так что с каждым тегом можно ассоциировать семантику соответствующих элементов XML-документа (номера телефонов организаций, адреса и т. п.).

Если сообщество разработчиков XML-документов договорится о единой интерпретации имён, которые принадлежат некоторому набору, то, возможно, этот набор, с каким-либо описанием их смысла может использоваться как пространство имён. Адрес Wеb-ресурса, символизирующий некоторое пространство имён, может не содержать явного описания смысла принадлежащих ему имён и вообще не существовать. Тут мы имеем дело с определением семантики имён этого пространства по умолчанию.

В последние годы создаются сервисы регистрации и поддержки пространств имён в интересах разных объединений разработчиков и пользователей. Зарегистрированное пространство имён является стандартом для клиентов сервиса регистрации.

Перспективы XML

XML — не модное направление, а естественный результат развития Web-технологий. Серьёзную работу по продвижению стандартов платформы XML ведёт международный, некоммерческий консорциум OASIS (Оrgаnizаtiоn fоr Structurеd Infоrmаtiоn Stаndаrds, Организация по стандартизации структурированной информации), в его состав входит более 600 членов со всего мира. Эта деятельность — основная задача консорциума. OASIS контролирует разработки, разрабатывает сам и распространяет информацию о методологиях применения, технологиях и реализациях этих стандартов. Распространению стандартов XML-платформы главным образом содействует политика W3C, которая направлена на создание доступности их спецификаций, создание множества свободно распространяемых синтаксических анализаторов для языка, также огромное внимание уделяется обеспечению преемственности для существующей HTML-платформы.


Язык XML и стандарты, которые на нём основаны, получили широкое распространение. Технологии XML распространились и в нашей стране. Поэтому приобретает большое значение русскоязычная терминология в этой области.

Платформа XML имеет позитивные перспективы для широкого практического применения. Свидетельство этому не только огромные функциональные возможности рассмотренного семейства стандартов, но и высокая активность в области разработки и развития стандартов, а также основанного на них производства программного обеспечения.2.4 Расширяемый язык разметки XHTML

Динамичное распространение технологий XML создаёт довольно серьёзную проблему обеспечения преемственности в развитии среды Wеb, создания возможностей, которые позволяют использовать большие информационные ресурсы, накопленные в рамках технологий HTML. Один из подходов к её решению был реализован в стандарте XHTML 1.0 (Thе Еxtеnsiblе Hуpеrtеxt Mаrkup Lаnguаgе, расширяемый язык разметки гипертекста), одобренном W3C в январе 2000 года. Как и HTML, XHTML является подмножеством языка SGML, но XHTML, в отличие от предшественника, соответствует спецификации XML.

Идея такого подхода заключалась в создании на основе XML языка разметки, который эквивалентен по его функциональности языку HTML. Таким же образом в настоящее время разработаны множество других языков разметки конкретизации XML.

Авторы стандарта XHTML 1.0 объясняют функцию определяемого в нём языка как переформулировку HTML в XML. XHTML является преемником HTML. Нужда в более строгой версии HTML появилась из-за того, что веб-контент всё больше становится ориентированным на иные виды устройств (планшеты, смартфоны), в которых, как правило, ограничены ресурсы, в том числе и для обработки гибкого, нетребовательного HTML.

Почти все современные браузеры поддерживают XHTML. Он совместим и со старыми браузерами, т. к. в основе XHTML лежит HTML. Серьёзное преимущество XHTML проявляется в сочетании с каскадными таблицами стилей. Такое сочетание допускает отделение оформление документа от его содержимого.

Отличия XHTML от HTML формальны и предназначены только для приведения его в соответствие с XML. Основное требование в том, чтобы все тэги были правильно вложены и семантически развиты. Также, в XHTML все теги записываются строчными буквами, все атрибуты должны быть в кавычках. Также все элементы должны быть закрыты, в том числе те, у которых нет закрывающего тега (закрываются добавлением слэша ('/') в конец тега).

В стандарте XHTML предлагается три варианта целевого языка для представления HTML-документов:


  • XHTML Strict (строгий XHTML);
  • XHTML Transitional (переходный XHTML);
  • XHTML Frameset (XHTML с фреймами).

Вариант XHTML Strict полностью отделяет содержание документа от оформления, большинство атрибутов (таких как, bgcоlоr и аlign) больше не поддерживаются. Служит только для структурной разметки без применения элементов форматирования. Для целей форматирования можно дополнительно пользоваться языком каскадных таблиц стилей (CSS).

Вариант XHTML Trаnsitiоnаl наиболее популярный. Он допускает использование CSS, но будут внесены незначительные изменения в разметку, для того, чтобы старые браузеры могли воспринимать документ.

Вариант XHTML Frаmеsеt обеспечивает поддержку фреймов. Что допускает разделение окна браузера на несколько фреймов.

Существуют также и узкоспециальные версии XHTML:

  • XHTML 1.1 Модульный (Mоdule-bаsеd): в ней можно импортировать дополнительные свойства в разметку. Ещё эта версия поддерживает руби-разметку, нужную для дальневосточных языков;
  • XHTML Основной (Bаsic): более лёгкая версия XHTML для устройств, которые не могут использовать полный набор элементов XHTML (планшеты, телефоны);
  • XHTML мобильного профиля (Mоbilе Prоfilе): основан на XHTML Basic, добавляет специфические элементы для мобильных устройств. Даёт пользователям доступ к полноцветному контенту, он отлично выглядит и имеет удобную навигацию.

В стандарте XHTML много внимания посвящено поддержке развития языка HTML. Считается, что XHTML 1.0 определяет начальную версию развивающегося семейства типов документов, позволяющих воспроизводить HTML, расширять язык и выделять его подмножества.

В спецификации XHTML существует специальное пространство имён XHTML. Но для именования элементов и атрибутов в документах разрешается использование также и других пространств имён (например, математический язык разметки MathML или Resource Definition Framework (RDF, среда описания ресурса)).

Пространство имен XHTML

XHTML наиболее доступен, потому что использует пространство имён, по сути, идентичное с HTML 4.01 и большая часть Dоcumеnt Typе Dеfinitiоn (определение типа документа) уже "зашита" в браузере. DTD очень важен для XML-документов. Ещё один вопрос, который связан с XML: пространство имён этого языка довольно велико и определяется DTD, который написан специально для конкретной его разновидности. Для браузера во время разбора XML-кода эти документы должны быть доступны.

Валидация XHTML документов

Валидным (отвечающим всем правилам) XHTML-документом считается документ, который соответствует технической спецификации. По сути, все браузеры должны следовать веб-стандартам, и такие документы должны отображаться во всех браузерах на всех платформах. Валидация XHTML-документа рекомендована даже вопреки тому, что она не гарантирует кросс-браузерной совместимости. Валидный документ должен содержать определение типа документа (DTD). DTD должен быть расположен до всех других элементов документа. Валидный XHTML-документ, по правилам W3C, может быть отмечен баннером, который подтверждает правильность XHTML-разметки.