Файл: Языки гипертекстовой разметки.pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 25.06.2023

Просмотров: 114

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Информативные критические замечания выделены, для того чтобы различаться с прочего текста и имеют все шансы генерироваться агентами пользователей особенным способом.

Все примеры, иллюстрирующие нежелательное использование, помечены как "ПРИМЕР НЕЖЕЛАТЕЛЬНОГО ИСПОЛЬЗОВАНИЯ". В примеры нежелательного использования входят также рекомендуемые альтернативные решения. Все примеры, иллюстрирующие недопустимое использование, помечены как "ПРИМЕР НЕДОПУСТИМОГО ИСПОЛЬЗОВАНИЯ".

В примерах и замечаниях используется разметка, поэтому некоторыми агентами пользователей они могут генерироваться особым образом.

3.2 О спецификации XML

Расширяемый Язык Разметки (XML) является поднабором SGML и полностью описан в спецификации. Он создан с целью обеспечения обслуживания, передачи и обработки в WEB исходного SGML теми же способами, которые в данный момент имеются в HTML. XML был разработан для облегчения создания конкретных реализаций и для взаимодействия с SGML и HTML.


Значимость W3C в составлении рекомендации состоит в этом, для того чтобы вовлечь интерес к предоставленной спецификации и содействовать ее широкой популяризации. Данное расширит функциональность и возможности Веб.

Этот документ специфицирует синтаксис, формируемый путем отделения имеющихся широко распространенных международных стандартов обработки текста с целью применения в World Wide Web.
Extensible Markup Language, сокращённо XML, описывает класс предметов информации, именуемых XML-документы, и отчасти описывает действия обрабатывающих их компьютерных программ. XML представляется профилем приложения либо ограниченным видом SGML - The Standard Generalized Markup Language. Согласно структуре документы XML представлены "соответствующими" документами SGML.
Документы XML состоят из единиц хранения, именуемых экземпляры, что включают разбираемые либо неразбираемые данные.
Разбираемые данные состоят из символов, отдельные с каковых формируют символьные данные, а прочие - разметку. Разметка шифрует описание схемы и закономерной структуры единиц хранения документа. XML дает система наложения ограничений в схему и логичную текстуру единиц сохранения.XML был разработан XML Working Group (ранее известной как SGML Editorial Review Board), сформированной под руководством World Wide Web Consortium (W3C) в1996 году.

Её возглавил Jon Bosak из Sun Microsystems при активном участии XML Special Interest Group (ранее известной как SGML Working Group), также организованной W3C. Члены XML Working Group указаны в Приложении. Dan Connolly является контактёром рабочей Группы с W3C.


Цели создания XML:

1. XML будет широко распространён в Internet.

2. XML будет поддерживать большой диапазон приложений.

3. XML будет совместим с SGML.

4. Он будет лёгким для написания программ, обрабатывающих документы XML.

5. Количество свойств по выбору (optional) в XML будет сведено к абсолютному минимуму, в идеале - к нулю.

6. Документы XML должны быть разборчивыми и ясными по смыслу.

7. Дизайн XML должен выполняться быстро.

8. Дизайн XML должен быть формальным и кратким.

9. Документы XML должны легко создаваться.

10. Краткость в разметке XML имеет минимальное значение.


Данная спецификация, совместно с ассоциированными стандартами, дает полные данные, требуемые для понимания XML и формирования компьютерных программ его обработки.

Символы –это разбираемый образец включает текст, очередность символов, что способен демонстрировать символьные данные либо разметку. Текст складывается из смеси символьных данных и разметки.
Комментарии имеют все шансы возникать в любом участке документа за пределами иной разметки; помимо этого, они имеют все шансы возникать внутри объявления типа документа в тех местах, которые допускаются грамматикой. Они никак не представлены частью символьных данных документа: процессор XML способен, однако никак не обязан, предоставлять приложению вероятность запрашивать текст объяснений.

Инструкции хода (ИП) дают возможность внедрять в документ указания с целью дополнений. Разделы CDATA имеют все шансы возникать тамже, в каком месте и символьные данные; они применяются с целью escape-блоков текста, включающего символы, которые по-другому станут различаться как разметка.

Документы XML обязаны начинаться объявлением XML, что специфицирует применяемую версию XML.
Поскольку предстоящие версии еще никак не сформированы, данная структура предоставляется как способ предоставления способности автоматического распознования версии и обязана, таким образом, быть включена обязательно. Процессоры имеют все шансы информировать о ошибке, в случае если получат документ, означенный неподдерживаемой версией.

Функцией разметки в документе XML является обязательным характеризовать структуру хранения информации и логическую структуру и ассоциировать пары атрибут-значение с их логическими структурами. XML дает механизм объявления типа документа с целью определения ограничений в логической структуре и с целью поддержки применения предопределённых единиц хранения.

Документ XML представляется правильным/valid, в случае если он ассоциированное объявление типа документа и в случае если документ осуществляет ограничения, проявленные в нём.


Объявление типа документа XML содержит или указывает на объявления разметки, предоставляющие грамматику для класса документов. Эта грамматика известна как определение типа документа или DTD. Объявление типа документа может указывать на внешний поднабор (особый вид внешнего экземпляра), содержащий объявления разметки, или может непосредственно содержать объявления разметки во внутреннем поднаборе, или может иметь и то, и другое. DTD документа состоит из обоих соединённых поднаборов.
Обьявление разметки данное обьявление типа элемента, обьявление перечня атрибутов и обьявление экземпляра, либо обьявление нотации. Данные объявления имеют все шансы целиком либо частично находиться внутри экземпляров параметров.

Документ XML включает один либо несколько элементов, ограниченных или начальными и конечными тэгами, или для пустых элементов - тэгами пустых элементов. Любой компонент имеет тип, определяется согласно именем, которое порой именуется "generic identifier" (GI) - родовой идентификатор, и способен обладать набором спецификаций атрибутов. Любая спецификация атрибутов обладает именем и значением.
Начало любого непустого элемента XML отмечается начальным тэгом. Окончание каждого элемента, инициированного начальным тэгом, должно быть зафиксировано конечным тэгом, содержащим имя, отражающее тип элемента, равно как данное существовало в начальном тэге. Текст меж начальным и конечным тэгами содержимым элемента. Элемент без содержимого именуется пустым. Пустой элемент показан или начальным тэгом, в последствии коего напрямую необходим конечный тэг, или тэгом пустого элемента. Тэг пустого элемента обладает особенной формой.

Структура элемента документа XML способен, с целью полного контроля, быть ограничена путём применения обьявлений типа элемента и перечня атрибутов. Объявление типа элемента ограничивает содержимое элемента.

Объявление типа элемента Нередко ограничивают типы элементов, что имеют все шансы возникать в качестве потомков элемента.

Тип элемента обладает содержимом элемента, в случае если элементы этого типа должны включать только лишь дочерние элементы (а никак не символьные данные), что имеют все шансы являться, согласно усмотрению, поделены пробелами.

В данном случае сдерживание содержит модель содержимого, простую грамматику, распоряжающуюся разрешёнными типами дочерних элементов и порядком, в коем они имеют все шансы возникать.
Тип элемента обладает смешанное содержимое, в случае если элементы данного типа имеют все шансы включать символьные данные, перемежаемые дочерними (не обязательными) элементами.


Атрибуты применяются с целью ассоциирования пар имя-значение с элементами. Спецификации атрибутов имеют все шансы возникать только лишь в начальных тэгах и тэгах пустых элементах; следовательно продукции, применяемые с целью их определения, возникают в разделе.

Прежде чем значение атрибута передаётся приложению или проверяется на правильность, процессор XML обязан нормализовать значение атрибута путём применения к нему нижеприведённого алгоритма или путём использования некоторых других методов так, чтобы значение, передаваемое приложению, было тем же, что и произведённое алгоритмом.


Документ XML способен состоять из одной либо несколько единиц хранения. Они именуются экземплярами; они обладают содержимым и все (за исключением экземпляра документа и внешний поднабор ОТД) определяются согласно name/имени экземпляра. Содержимое распределяемого экземпляра именуется его замещающим текстом; данный текст является обязательной частью документа.

Не разбираемый экземпляр это ресурс, чьё содержимое способно, либо способен никак не являться текстом, и, в случае если данный текст, способен никак не являться XML. Любой не разбираемый экземпляр обладает группированную нотацию, идентифицируемую согласно имени. Кроме условия к процессору XML произвести личные идентификаторы экземпляра и нотации легкодоступными приложению, XML никак не прикладывает практически никаких ограничений в содержимое не разбираемых экземпляров.

Общие экземпляры это экземпляры с целью применения внутри охватываемого документа. В данной спецификации ОЭ порой именуются неквалифицированным термином экземпляр, в случае если данное никак не приводит к неоднозначности.

Экземпляры характеристик данное разбираемые экземпляры с целью применения внутри ОТД. Данные два типа экземпляров применяют различные формы ссылок и распознаются в разных контекстах. Таким образом, они захватывают различные пространства имён; экземпляр параметра и общий экземпляр с одним именованием – это два различных экземпляра.
Ссылка символа ссылается в своеобразный символ в наборе символов ISO/IEC 10646, к примеру, ссылка на символ, никак недоступный непосредственно из устройства ввода. Ссылка экземпляра ссылается в содержимое именованного экземпляра.

Если процессор XML замечает ссылку в разбираемый экземпляр, в таком случае, с целью чтобы проконтролировать документ, процессор должен ввести его (экземпляра) замещающий текст. В случае если экземпляр представляется внешним, а процессор никак не стремится проконтролировать документ XML, в таком случае процессор способен, однако данное никак не представляется важным, ввести замещающий текст экземпляра. В случае если не проверяющий процессор никак не содержит замещающий текст, он должен информировать приложение, что он выявил, однако никак не прочел, экземпляр.


Это правило основывается в этом, что же автоматическое распознование, предоставляемое механизмом экземпляров SGML и XML, поначалу сделанным с целью помощи модульности в авторизации, никак не непременно годится с целью иных дополнений, в особенности с целью просмотра документов. Браузеры, к примеру, при обнаружении ссылки на внешние разбираемый экземпляр, имеют все шансы выбрать визуальное предупреждение о этом, что же экземпляр имеется, и требовать его с целью демонстрации только лишь согласно запросу.

Литеральное значение экземпляра данное закавыченная строка, действительно презентованная в обьявлении экземпляра, соответственная нетерминальному EntityValue. Установление: замещающий текст это содержимое экземпляра в последствии замещения мнемоник символов и ссылок экземпляров характеристик.

Нотации идентифицируют по имени формат не разбираемых экземпляров, формат элементов, которые породили атрибут нотации, или приложение, которому адресуется инструкция процесса. Объявления нотации предоставляют имя нотации для использования в объявлениях экземпляра и списка атрибутов и в спецификациях атрибутов, а также внешний идентификатор для нотации, который может позволить процессору XML или его клиентскому приложению локализовать вспомогательное приложение, способное обработать данные в данной нотации.


Надлежащие процессоры XML разделяются в 2 класса: проверяющие и не проверяющие. Проверяющие и не проверяющие процессоры и тот и другой должны извлекать уведомления о нарушениях ограничений верно сформированности предоставленной спецификации в охватываемом экземпляра документа и разных иных разбираемых экземплярах, которые они читают.

Проверяющие процессоры должны, согласно выбору пользователя, уведомлять о нарушениях ограничений, сформулированных объявлениями в ОТД, и неосуществимости исполнения ограничений точности, данных в этой спецификации. Для того чтобы осуществить данное, проверяющие процессоры XML должны читать и подвергать обработке всегда ОТД и все внешние разбираемые экземпляры, что присутствуют ссылки в документе.
От не проверяющих процессоров необходимо только проконтролировать экземпляр документа, в том числе целый внутренний поднабор ОТД, в верное формирование.

Поскольку никак не требуется контролировать документ на правильность/верность, следует обработать все объявления, прочтенные в внутреннем поднаборе ОТД и в абсолютно всех экземплярах параметров, что прочтены, вплоть до первой ссылки в экземпляр параметра, что никак непрочтен; в таком случае принимать сведения в данных объявлениях должна применяться с целью нормализации значения атрибутов, включения замещающего текста внутренних экземпляров поддержки значений согласно умолчанию в атрибутах.