Файл: Языки гипертекстовой разметки (Глава 1. Технология Web).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 30.06.2023

Просмотров: 74

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

В название элемента и атрибута в HTML документе задаётся разметкой, поэтому пользователь может генерировать названия особым образом.

На каждое определение атрибута устанавливается отдельный тип его значения. Если возможных значений может быть несколько, то список значений, разделяется вертикальной чертой (|).

Информация о типе каждого определения атрибута помещается в квадратные скобки («[]»).

2.4.2 О спецификации XML

Расширенный язык разметки XML представляет собой поднабор SGML и имеет описание в спецификациях. Он создавался, чтобы обеспечить обслуживание, передачу и обработку в сети исходного SGML таким же способом, которым пользуется HTML. XML разрабатывался, чтобы облегчить процесс создания конкретной реализации и взаимодействий с SGML и HTML [20, 46].

W3C способствовало привлечению внимания к данной спецификации, для её широкого распространения, чтобы расширить функциональные возможности сети.

XML (сокращённо Extensible Markup Language) занимается описанием классов объектов данных, которые называются XML-документами, и частично занимается описанием поведения компьютерных программ обрабатывающих XML-документы. XML можно считать профилем приложения или урезанным вариантом SGML - The Standard Generalized Markup Language. По своей структуре документы XML схожи с документами SGML [20, 51].

Документ XML состоит из единиц хранения, которые называются экземплярами, в них содержат данные разбираемого и неразбираемого вида.

Разбираемые данные состоят из символов, из некоторых образуются символьные данные, а из других разметка. Разметка занимается кодированием описаний схем и логических структур единиц хранения документа. XML может предоставлять механизмы, чтобы наложить ограничение на схемы и логические структуры единиц хранения [20, 60].

XML разработала XML Working Group, которая была сформирована руководством World Wide Web Consortium (W3C) в1996 году [20, 65].

Цель создания XML:

1. Широкое распространение в сети Internet.

2. Поддержка большого диапазона приложений.

3. Совместимость с SGML.

4. Лёгкий для написания программ и обрабатывающих документов язык гипертекстовой разметки.

5. Обеспечение минимального количества свойств по выбору (optional) в идеале - к нулю.

6. Документы должны стать более разборчивыми и точными по смыслу.

7. Обеспечение быстрого дизайна.

8. Дизайн должен стать формальным и кратким.

9. Лёгкое создание документов.

10. Краткость должна иметь минимальное значение.


Данная спецификация, вместе с другими ассоциированными стандартами, может предоставить всю нужную информацию, чтобы начать понимать XML и создавать на нём компьютерные программы и документы [19, 75].

Символы – это разбираемые экземпляры содержащие текст, последовательности символов, которые могут представлять собой символьные данные или разметку. Текст является комбинацией символьных данных и разметки.

Комментарии могут помещаться в любое место документа, игнорируя прочую разметку. Кроме того, их можно помещать внутри объявления, о типе документа учитывая допустимую грамматику. Они не часть символьных данных документа, поэтому процессор XML может, не давать приложению возможности запрашивать тексты комментариев.

Инструкции процесса (ИП) используются, для ввода инструкций для приложения в текст документа. Раздел CDATA может появляться в тех же местах, что и символьные данные; этот раздел используется для создания escape-блоков текста, которые содержат символы, которые будут распознаваться в качестве разметки. Документ XML должен начинаться с объявления XML, в котором указана используемая версия XML [21, 47].

Поскольку будущие версии ещё не сформированы, эта конструкция даётся как средство предоставления возможности автоматического распознавания версии и должна, следовательно, быть включена обязательно. Процессоры могут сигнализировать об ошибке, если получат документ, помеченный неподдерживаемой версией [21, 67].

Функции разметки в документе XML состоят в описании структуры хранимых данных и их логической структуры, а также в ассоциировании пар атрибут-значение с их логической структурой. XML использует механизмы объявления типов документов, чтобы определить ограничения в их логической структуре, чтобы в последствии осуществить поддержку использования предопределённой единицы хранения. Документ XML считается правильным/valid, если в нём имеется ассоциированное объявление о типе документа, если документом выполняется ограничение [21, 69].

Объявление типа документа XML служит для указания на объявление разметки, предоставляя грамматику для классов документов. Объявление разметки представляет собой объявление типа какого-либо элемента, объявление списков атрибутов или объявление экземпляров, или объявление о нотациях. Данные объявления могут как полностью, так и частично иметься внутри каждого экземпляра параметров.

В каждом документе XML содержится один или более элементов, которые ограничены начальным и конечным тегом, либо тегами для пустых элементов. Каждый элемент имеет свой тип, с идентификацией по имени, которое называют «generic identifier» (GI) или родовой идентификатор, в результате чего может иметь в себе набор спецификаций по атрибутам. Каждая спецификация атрибута имеет своё имя и значение [21, 73].


Начало в каждом непустом элементе XML обозначается при помощи начального тега. Окончание в каждом элементе, который начатое начальным тегом, должно быть отмечено при помощи конечного тега, которое содержит имя, отражающее тип элемента, как в начальном теге. Текст, находящийся между начальным и конечным тегом называют «содержимым элемента».

Элемент без содержимого называют «пустым». Пустой элемент представляется либо при помощи начального тега, после которого добавляется конечный тег, либо при помощи тега пустого элемента. Тег пустого элемента имеет свою особую форму.

Структура элементов документа XML может быть ограничена для проверки, при помощи объявления типа элемента и списка его атрибутов. Объявление типов элемента может ограничивать содержимое элементов.

Объявления типов элементов часто используются для ограничения типов элементов, которые могут появиться как потомки элементов.

В типе элемента имеется содержимое элемента, если элемент данного типа обязан содержать в себе только дочерние элементы, а не символьные данные, дочерние элементы могут, по усмотрению, быть разделены пробелами [21, 82].

В этом случае ограничивается модель содержимого, а именно простая грамматика, которая управляет разрешённым типом дочерних элементов и их порядком, в котором они появляются.

В типе элемента также имеется смешанное содержимое, если элементы этого типа содержат в себе символьные данные, перенесёнными дочерними элементами.

Атрибут используется для ассоциации пар имя-значение с другими элементами. Спецификация атрибутов может указываться только в начальном теге и в теге пустого элемента; поэтому продукция, используемая чтобы их распознать, указывается в разделе.

Документ XML состоит из одной или более единиц хранения. Эти единицы называют экземплярами; в них имеется содержимое и все они идентифицируются согласно name\имени экземпляра. Содержимое в разбираемом экземпляре называют замещающим текстом; этот текст является неотъемлемой частью документа [22, 45].

Неразбираемый экземпляр представляет собой ресурс, содержимое которого может, или быть или не быть, текстом, и, в случае если это текст, может не быть XML. В каждом неразбираемом экземпляре имеется ассоциированная нотация, идентифицируемая по имени. Согласно требованию процессора XML делать идентификатор экземпляра и его нотации доступным приложению, а сам XML не налаживает ограничений на содержимое в неразбираемом экземпляре [17, 49].


Экземпляр параметров - это разбираемый экземпляр для пользования внутри ОТД. Этими двумя типами экземпляров используются разные формы ссылок, и они распознаются в разных контекстах. В результате чего ими заняты разные пространства имён; поэтому экземпляры параметра и общие экземпляры, имеющие одно имя - это двое разных экземпляра.

Ссылка в символах ссылается на специфические символы в наборе символов ISO/IEC 10646, к примеру, ссылка на символ, который не доступен напрямую из устройства для ввода. Ссылка экземпляра может ссылаться на содержимое только именованного экземпляра [20, 61].

Если процессором XML обнаруживается ссылка на разбираемые экземпляры, то, для проверки документа, процессор нужно включить его экземпляр с замещающим текстом. Если экземпляр внешний, а процессор проверяет документ XML, это значит, что процессор может, не считает необходимость, включать замещающие тексты экземпляра. Если не проверяющим процессором не был включён замещающий текст, то он должен уведомить приложение, о том, что им был обнаружен, но не прочитан, экземпляр.

Данное правило основано на том, что автоматически распознавать, предоставляемые механизмы экземпляров SGML и XML, которые были созданы, чтобы поддерживать модульность в авторизацию, не обязательно в других приложениях, особенно во время просмотра документа. Браузеры, к примеру, когда обнаружены ссылки на внешние разбираемые экземпляры, могут отобразить визуально предупреждение о том, что данный экземпляр существует, и запрашивает у пользователя команду для показа найденного экземпляра [22, 59].

Описанные ранее процессоры XML можно разделить на два класса: проверяющий и не проверяющий процессор. Проверяющий и не проверяющий процессоры нужны для вывода сообщений о нарушении ограничений в правильно сформированной спецификации содержимого экземпляра документа и любого другого разбираемого экземпляра, которые читаются [22, 63].

Проверяющий процессор обязан, по запросу пользователя, сообщать о нарушении ограничений, выраженные объявлением в ОТД, и невозможности выполнить ограничение правильности, данных в конкретной спецификации. Чтобы выполнить ограничение правильности, проверяющий процессор XML должен прочитать и обработать все ОТД и провести проверку всех внешних разбираемых экземпляров, на которые имеются в документе ссылки. Не проверяющие процессоры проверяют только экземпляры документов, вместе с внутренним поднабором ОТД, на правильность формирования. Формальная грамматика XML приведена в спецификации согласно используемым нотациям Extended Backus-Naur Form (EBNF). Каждое правило грамматики определено одним символом [22, 79].


2.4.3 О спецификации XHTML

Семейство типов документов XHTML базируется на XML и предназначено для работы с пользовательскими агентами на базе. Семейство XHTML является следующим шагом в эволюции Интернет. Переходя сегодня на XHTML, разработчики содержимого (контента) могут вступить в мир XML со всеми его преимуществами, сохраняя при этом совместимость содержимого с более старыми и более новыми версиями [15, 78].

Пространство имен XHTML может использоваться с другими пространствами XML в соответствии с [XMLNAMES], хотя такие документы не являются строго конформными XHTML 1.0 в соответствии с приведенным выше определением. В будущих работах W3C будут определены способы указания конформности документов, в которых используется несколько пространств имен [19, 61].

Конформный пользовательский агент должен соответствовать всем определенным в спецификации критериям.

Говорится о различиях которые присутствуют в языке XHTML. Поскольку XHTML является приложением XML, некоторые приемы, допустимые в языке HTML, основанном на SGML, должны быть изменены.

К документам XHTML 1.0 не предъявляется требование совместимости с существующими пользовательскими агентами, но на практике оно достаточно легко реализуемо.

Спецификация XHTML 1.0 закладывает основу семейства типов документов, которые будут расширениями и подмножествами XHTML, для поддержания широкого диапазона новых устройств и приложений путем определения модулей и механизма объединения этих модулей. Такой механизм позволит унифицировать способы расширения XHTML 1.0 и использования его подмножеств путем определения новых модулей [22, 71].

По мере перемещения XHTML с традиционных пользовательских агентов на рабочем столе на другие платформы становится ясно, что не все элементы XHTML будут необходимы на всех платформах.

Процесс модуляризации разбивает XHTML на ряд более мелких подмножеств элементов. Модуляризация дает определенные преимущества.

В профиле документа определяется синтаксис и семантика набора документов. Соответствие профилю документа обеспечивает основу гарантии совместимости. В профиле документа определяются возможности, необходимые для обработки документа этого типа.

HTML5 существует в двух вариациях - как разновидность XHTML и как модификация «исторического» HTML. Создатели веб-страниц могут применять любую из этих вариаций. В первой вариации новый язык полностью согласован с XML 1.0, так что разработчикам доступны все преимущества XML и смежных технологий. Во второй вариации HTML5 покончил с кошмарным наследием прошлого - формальной совместимостью с SGML. Все предыдущие стандарты HTML претендовали на эту совместимость, но ни один браузер не обрабатывал код HTML по замысловатым правилам SGML. Вместо этого использовались простые алгоритмы, распознающие набор конкретных элементов и атрибутов. HTML 5 узаконил такое поведение браузеров. Новый стандарт не оглядывается на SGML, а описывает частные правила для интерпретации конкретных тегов и других синтаксических конструкций. По сути, HTML 5 документирует принципы, по которым браузеры уже обрабатывают код последние пятнадцать лет [23, 79].