Файл: Языки гипертекстовой разметки (Язык гипертекстовой разметки).pdf
Добавлен: 04.04.2023
Просмотров: 74
Скачиваний: 2
Для создания форм, в которые пользователь может вводить данные, для обработки используются специальные серверные программы, написанные на языках PHP или Perl. При помощи языка HTML можно помещать на веб-страницы гипертекстовую ссылку и интерактивную кнопку, чтобы соединять Web-страницы с другими страницами на Web-сайте [10, 54].
Новая версия языка HTML уже не будет создаваться, но для дальнейшего развития HTML был создан расширенный язык разметки гипертекста XHTML (Extensible Hypertext Markup Language ). XHTML по своим возможностям похож на HTML, но XHTML имеет более строгие требования к синтаксису кода. Как и HTML, XHTML тоже является подмножеством языка SGML, но XHTML, в отличие от предшественника, имеет больше соответствие со спецификациями XML. Вариант XHTML 1.0 был одобрен и внедрён Консорциумом Всемирной паутины (W3C) 26 января 2000 года [12, 61].
2.2 Расширяемый язык разметки XML
Во второй половине 90-х годов прошлого века началось технологическое переоснащение технологии Web. Среди языков гипертекстовой разметки стал играть важную роль разработанный в консорциуме W3C новый язык гипертекстовой разметки XML. Язык XML (Extensible Markup Language) – это расширяемый язык разметки, представляющий собой метаязык, который определяет процедуру создания языков разметки для специфических целей [12, 51].
Главной сферой применения стандарта платформы XML стали слабоструктурированные данные[1] Web-сайтов в формате XML-документов. Использование языка XML в данной области дало возможность представлять в Web-среде гипермедиа страницы в формате XML-документов и осуществлять поддержку связанных с ними метаданных[2]. Главной целью создания платформы XML является добавление в Web-среду метаданных, которые нужны для описания свойств поддерживаемых информационных ресурсов[3].
Метаданные нужны для того, чтобы создавать принципиально новые высокоуровневые Web-приложения, основой которых является интеграция с информационными технологиями, занимающиеся интеграцией с неоднородными информационными ресурсами. На рисунке 1 иллюстрируется упрощенная архитектура системы, в которой метаданные обеспечивают интеграцию неоднородных информационных ресурсов.
Простейшей возможностью для задания семантики – является использование пространственных имён. В отличие от языка HTML, который обеспечивает форматную разметку текста, определяя его внешний вид на экране, XML используется для структурной разметки [13, 39].
Структурная разметка в XML позволяет выделить в тексте кода содержательную структурную единицу, данные единицы называются элементами XML-документа. Чтобы выделить каждый тип элемента используется тег, который указывает имя типа элемента. В результате с каждый тег может ассоциироваться семантикой соответствующего элемента XML-документа, к примеру с адресом организации, номер телефона и т. д. [13, 45].
Приложение WEB
Реляционное приложение
Механизм доступа XML
Сервер баз данных с расширением для XML
XML - документы
БАЗА данных SQL
Метаданные XML
SQL - схема базы данных
Преобразователь: метаданные XML⇨SQL
Преобразователь: метаданные SQL⇨XML
Объединенные метаданные XML
Объединенная схема SQL
Рис. 1. Упрощенная архитектура системы, обеспечивающей интеграцию информационных ресурсов XML и SQL
Если некоторым сообществом разработчиков и пользователей XML-документов будет осуществлена договорённость о единой интерпретации имен, которые будут принадлежать некоторому набору, то данный унифицированный набор, возможно, применяя описания его смысла (например, в вид обычного текста на естественном языке), может быть использован как пространство имён. Адрес веб-документа, представляющий этот набор имён, будет рассматриваться в виде уникального идентификатора пространства имён, в результате на него можно ссылаться в XML-документе, в котором используются принадлежащие этому пространству имена. В результате чего им будет придаваться некоторый смысл [15, 42].
Метаданные, представляющиеся средствами RDF, могут быть использованы, чтобы поисковые машины Web могли эффективно производить поиск ресурсов, в электронных библиотеках и коллекциях Web-страниц, составляя некоторый виртуальный документ, представляющий содержание информационных ресурсов по конкретным предметным областям, а также оказывающий поддержку различным Web-приложениям, нуждающимся в семантической информации о Web-ресурсах [15, 52].
В настоящее время создаются сервисы для регистрации и поддержки пространств имён согласно интересам разных сообществ разработчиков и пользователей. Зарегистрированное пространство имен представляет собой стандарт для сообщества клиентов сервиса с регистрацией[16, 35].
Большая работа по продвижению стандарта платформы XML на практике ведётся крупным международным, некоммерческим консорциум OASIS (расшифровывается как, Organization for Structured Information Standards - организация по стандартизации структурированной информации), в состав этого консорциума входит более 600 как корпоративных, так и индивидуальных членов из разных стран мира. OASIS занимается разработкой и координацией процесса разработки и распространения информации о методологии применения технологии и стандартов XML [16, 42].
На распространение стандарта XML-платформы существенным образом влияет политика W3C, которая направленная на обеспечение доступности данных спецификаций. Создавая ряд для свободного распространения синтаксических анализаторов языков.
Хоть язык XML и созданные на нём стандарты получают всё большее распространение, имеется и ряд факторов, сдерживающие массовое распространение XML в среде сетей Web [16, 51].
Технологии XML также распространяется и России. В результате чего началось формирование русскоязычной терминологии в этой области.
Платформа XML имеет довольно благоприятные перспективы для широкого применения. Благодаря богатым функциональным возможностям рассмотренных семейств Web-стандартов, и высокой активности в области разработки и развития сетевых стандартов, а также создания программного обеспечения, на основе XML.
Расширяемый язык разметки гипертекста XHTML
В ходе активного распространения технологи XML образовалась проблема обеспечения преемственности в среде Web, что требовало создание возможностей, которые позволили бы пользоваться огромными информационными ресурсами в рамках технологии HTML.
Один из подходов для решения данной проблемы реализован в стандарте XHTML 1.0 одобренный W3C в январе 2000 г. Так как HTML и XHTML являются подмножеством языка SGML, но язык XHTML, в отличие от предшественника, более соответствует спецификациям XML [17, 51].
Идея предложенного подхода заключается в том, что надо создать на основе XML, язык разметки, который мог быть эквивалентен по функциональности языку HTML. Аналогично в настоящее время разрабатываются многие другие языки гипертекстовой разметки с конкретизацией XML. Процесс создания таких языков сводится, к разрабатываю способов определения типов документов (DTD).
XHTML это преемник HTML. Потребность, чтобы создать более строгую версию HTML появилась в следствии того, что современный веб-контент более ориентируется на нетрадиционные виды устройств (например, сотовые телефоны, смартфоны, планшетные компьютеры), в которых бывают часто ограниченными в ресурсах, поэтому web-страницы должны быть написаны на гибком и нетребовательном к ресурсам языке XHTML [17, 101].
Во всех современных браузерах имеется поддержка XHTML. Совместимость с ним поддерживается и в старых браузерах, т. к. в основу XHTML входит HTML. Данная совместимость приводит к замедлению процесса перехода от HTML к XHTML в сетях Web.
Настоящим преимуществом XHTML является его сочетание с каскадной таблицей стилей. Что позволило отделить процесс оформление документа от оформления содержимого документа.
Стандарт XHTML предлагает три варианта своего языка для отображения HTML-документов и три версии DTD:
- XHTML Strict (строгий XHTML);
- XHTML Transitional (переходный XHTML);
- XHTML Frameset (XHTML с фреймами).
Вариант XHTML Strict нужен, чтобы полностью отделить содержание документа от его оформления. Он используется для чистой структурной разметки веб-документа не применения элементы форматирования. Для форматирования такого документа можно дополнительно воспользоваться языком каскадных таблиц стилей (CSS) [16, 43].
Вариант XHTML Transitional позволяет использовать таблицы стилей, с некоторыми небольшими корректировками в разметке, для того чтобы документ мог отображаться в старых браузерах, в которых может не быть поддержки таблиц стилей. Он предназначается для лёгкого перехода из HTML в XHTML.
Вариант XHTML Frameset добавляет поддержку фреймов в веб-документ. Что позволило разбить страницу сайта в окне браузера на несколько отдельных разделов (фреймов), в которых находится набор функций управления разделами сайта.
Также существуют специализированные дополнительные версии XHTML:
XHTML 1.1 Модульный (Module-based): программист может импортировать дополнительные свойства в разметку документа. В этой версии имеется поддержка руби-разметку, которая необходима для отображения контента на восточных языках.
XHTML Основной (Basic): является специальной облегчённой версией XHTML для устройств, которые поддерживают ограниченный набор элементов XHTML, такой язык используется в основном для миниатюрных устройств, к примеру, для мобильных телефонов. В будущем он должен заменить WML и C-HTML.
XHTML мобильного профиля (Mobile Profile): основан на архитектуре XHTML Basic, он позволяет добавлять специфические элементы для отображения на мобильных телефонах. Он являлся шагом вперед к созданию мобильных сервисов 3G. XHTML предоставляет пользователю доступ к полноцветному контенту, который имеет отличный вид и имеет удобный интерфейс [18, 65].
Обеспечение модульности языка воплощается в проекте новой версии стандарта - XHTML 1.1.
Со временем XHTML стал более доступен, так как используемые им пространственные имена практически идентичны с HTML 4.01, что позволяет взаимодействовать с DTD во всех современных браузерах. Работа с DTD (Document Type Definition) является критически важным аспектом для XML-документов. Пространство имён языка XML очень велико и для его определения используется именно DTD написанных специально для конкретных разновидностей. Для браузера во время отображения соответствующего XML-кода данные документы должны быть доступными. Преимуществом XHTML в том, что пространство имён можно сократить до списка которым используется пользователь на сайте [18, 78].
Спецификация HTML состоит из следующих разделов.
Введение. Во введении приводится описание занимаемого языком HTML места в схеме World Wide Web, приведено описание краткой истории развития языка HTML, имеется описание действий, которые можно сделать, используя HTML 4.0, и содержится описание процесса создания документов формата HTML [19, 41].
Информация о языке. В разделе «Информация о языке» содержатся следующие данные:
- Информация о символах, которые отображаются в документе HTML.
- Информация об основных типах, данных в документе HTML.
- Информация об элементах управления структурой документа HTML.
- Информация об элементах управления представления документов формата HTML.
- Информация об элементах управления интерактивностью документа HTML, включая описание форм для ввода данных пользователем и скрипты для управления активными документами.
- Информация о формальном SGML-определении HTML.
Список нормативных и информативных документов. В этом разделе содержится информация о нормативных и информационных документах, на основании которых был создан язык HTML.
Выше описанной спецификацией можно пользоваться несколькими способами:
1) Прочесть её от начала до конца. Узнать общее представление о языке HTML и его технических параметрах.
2) Обращаться к необходимой информации. Получить только нужную информацию, а именно информацию о максимальной скорости передачи информации и о синтаксисе языка.
В оперативной версии спецификаций имеются:
1) Ссылки на элементы или атрибуты, связанные с определением их спецификаций.
2) На каждой странице имеется ссылка на указатели, чтобы найти определение на какой-либо элемент или атрибут, использовать можно не более двух ссылок.
3) На каждой первой странице трёх разделов руководства к исходному оглавлению добавлена более подробная информация о разделах.
Согласно спецификации HTML названия элементов описываются символами в верхних регистрах (например, в теге BODY), а названия атрибутов описываются символами в нижних регистрах (например, в тегах lang, onsubmit). Главное помнить, что в HTML имена элемента и атрибута не учитываются регистром, это было придумано для более легкого чтения пользователем [19, 45].
В название элемента и атрибута в HTML документе задаётся разметкой, поэтому пользователь может генерировать названия особым образом.