Файл: Языки гипертекстовой разметки (Понятие «информационная система» в Web).pdf
Добавлен: 24.05.2023
Просмотров: 265
Скачиваний: 3
Документ XML явля ется правильным/valid, ес ли он име ет ассоциированное объяв ление типа докум ента и ес ли документ выпол няет ограничения, выраж енные в нё м.
Объявление ти па документа XML соде ржит или указы вает на объяв ления разметки, предоста вляющие грамматику дл я класса докум ентов. Эта грамм атика известна ка к определение ти па документа ил и DTD. Объявление ти па документа мож ет указывать н а внешний подн абор (особый ви д внешнего экзем пляра), содержащий объяв ления разметки, ил и может непосред ственно содержать объяв ления разметки в о внутреннем подна боре, или мож ет иметь и то, и другое. DTD докум ента состоит и з обоих соедин ённых поднаборов.Объяв ление разметки эт о объявление ти па элемента, объяв ление списка атриб утов и объяв ление экземпляра, ил и объявление нота ции. Эти объяв ления могут полно стью или част ично содержаться вну три экземпляров парам етров.
Каждый доку мент XML содержит од ин или бол ее элементов, ограни ченных либо начал ьными и конеч ными тэгами, ли бо -для пус тых элементов - тэг ами пустых элеме нтов. Каждый элем ент имеет ти п, идентифицируется п о имени, кото рое иногда назыв ается "generic identifier" (GI) - родовой идентиф икатор, и мож ет иметь наб ор спецификаций атриб утов. Каждая специф икация атрибутов име ет имя и значение.
Нач ало каждого непус того элемента XML обозна чается начальным тэг ом.Окончание кажд ого элемента, нача того начальным тэг ом, обязано бы ть отмечено коне чным тэгом, содер жащим имя, отраж ающее тип элем ента, как эт о было да но в начал ьном тэге.Тек ст между начал ьным и коне чным тэгами назыв ается содержимым элем ента.
Элемент бе з содержимого назыв ается пустым. Пус той элемент предст авлен либо начал ьным тэгом, пос ле которого непосред ственно следует коне чный тэг, ли бо тэгом пуст ого элемента.Тэ г пустого элем ента имеет осо бую форму.
Струк тура элемента докум ента XML может, дл я целей пров ерки, быть огран ичена путём использ ования объявлений ти па элемента и списка атриб утов. Объявление ти па элемента ограни чивает содержимое элем ента.
Объявление ти па элемента час то ограничивают ти пы элементов, кото рые могут появл яться в каче стве потомков элем ента.
Тип элем ента имеет содер жимое элемента, ес ли элементы данн ого типа обяз аны содержать тол ько дочерние элем енты (а н е символьные дан ные), которые мог ут быть, п о усмотрению, разде лены пробелами.
В этом слу чае ограничение вклю чает модель содерж имого, простую грамм атику, управляющую разреш ёнными типами доче рних элементов и порядком, в котором он и могут появл яться.
Тип элем ента имеет смеша нное содержимое, ес ли элементы это го типа мог ут содержать симво льные данные, переме жаемые дочерними (необязат ельными) элементами.
Атри буты используются дл я ассоциирования па р имя-знач ение с элеме нтами. Спецификации атриб утов могут появл яться только в начальных тэг ах и тэг ах пустых элеме нтов; поэтому проду кции, используемые дл я их распозн авания, появляются в разделе.
Пре жде чем знач ение атрибута перед аётся приложению ил и проверяется н а правильность, проце ссор XML обязан нормали зовать значение атри бута путём приме нения к не му нижеприведённого алгор итма или пут ём использования некот орых других мето дов так, чтобызн ачение, передаваемое прило жению, было те м же, чт о и произве дённое алгоритмом.
Доку мент XML может сост оять из одн ой или бол ее единиц хран ения. Они назыв аются экземплярами; он и имеют содер жимое и вс е (исключая экзем пляр документа и внешний подн абор ОТД) идентифи цируются по name\име ни экземпляра. Содер жимое разбираемого экзем пляра называется ег о замещающим текс том; этот тек ст считается неотъе млемой частью докум ента.
Неразбираемый экзем пляр это рес урс, чьё содер жимое может, ил и может н е быть, текс том, и, ес ли это тек ст, может н е быть XML. Каж дый неразбираемый экзем пляр имеет ассоциир ованную нотацию, идентифи цируемую по име ни. Помимо требо вания к проце ссору XML сделать идентиф икаторы экземпляра и нотации досту пными приложению, XML н е накладывает ника ких ограничений н а содержимое неразби раемых экземпляров.
Общ ие экземпляры эт о экземпляры дл я использования вну три содержимого докум ента. В эт ой спецификации О Э иногда назыв аются неквалифицированным терм ином экземпляр, ес ли это н е приводит к неоднозначности.
Экзем пляры параметров эт о разбираемые экзем пляры для использ ования внутри ОТ Д. Эти дв а типа экземп ляров используют раз ные формы ссы лок и распоз наются в разли чных контекстах. Следова тельно, они зани мают разные простр анства имён; экзем пляр параметра и общий экзем пляр с од ни именем - эт о два раз ных экземпляра.
Ссы лка символа ссыла ется на специфи ческий символ в наборе симв олов ISO/IEC 10646, например, ссы лка на сим вол, не досту пный напрямую и з устройства вво да.Ссылка экзем пляра ссылается н а содержимое именов анного экземпляра.
Ес ли процессор XML обнару живает ссылку н а разбираемый экзем пляр, то, дл я того что бы проверить доку мент, процессор обя зан включить ег о (экземпляра) замещ ающий текст. Ес ли экземпляр явля ется внешним, а процессор н е пытается прове рить документ XML, т о процессор мож ет, но эт о не явля ется необходимым, вклю чить замещающий тек ст экземпляра. Ес ли непроверяющий проце ссор не вклю чает замещающий тек ст, он обя зан информировать прило жение, что о н обнаружил, н о не проч итал, экземпляр.
Эт о правило базир уется на то м, что автомат ическое распознавание, предоста вляемое механизмом экземп ляров SGML и XML, первона чально созданным дл я поддержки модуль ности в автори зации, не обязат ельно подходит дл я других прило жений, особенно дл я просмотра докум ентов. Браузеры, напр имер, при обнару жении ссылки н а внешний разбир аемый экземпляр, мог ут избрать визуа льное предупреждение о том, чт о экземпляр сущес твует, и запраш ивать его дл я показа тол ько по требо ванию.
Литеральное знач ение экземпляра эт о закавыченная стр ока, реально предста вленная в объяв лении экземпляра, соответс твующая нетерминальному EntityValue. Опреде ление: Замещающий тек ст это содер жимое экземпляра пос ле замещения мнем оник символов и ссылок экземп ляров параметров.
Нота ции идентифицируют п о имени фор мат неразбираемых экземп ляров, формат элеме нтов, которые поро дили атрибут нота ции, или прило жение, которому адрес уется инструкция проц есса.Объявления нота ции предоставляют им я нотации дл я использования в объявлениях экзем пляра и спи ска атрибутов и в специфи кациях атрибутов, а также внеш ний идентификатор дл я нотации, кото рый может позво лить процессору XML ил и его клиент скому приложению локали зовать вспомогательное прило жение, способное обраб отать данные в данной нота ции.
Соответствующие проце ссоры XML делятся н а два кла сса: проверяющие и не провер яющие. Проверяющие и не провер яющие процессоры об а обязаны выво дить сообщения о нарушениях ограни чений правильно сформиро ванности данной специф икации в содер жимом экземпляра докум ента и люб ых других разбир аемых экземплярах, кото рые они чит ают.
Проверяющие проце ссоры обязаны, п о выбору пользо вателя, сообщать о нарушениях ограни чений, выраженных объявл ениями в ОТ Д, и невозмо жности выполнения ограни чений правильности, дан ных в эт ой спецификации. Что бы выполнить эт о, проверяющие проце ссоры XML обязаны чит ать и обраба тывать все ОТ Д и вс е внешние разбир аемые экземпляры, н а которые имею тся ссылки в документе.
О т не провер яющих процессоров требу ется лишь прове рить экземпляр докум ента, включая ве сь внутренний подн абор ОТД, н а правильное формир ование.
Поскольку н е требуется прове рять документ н а правильность/верн ость, необходимо обраб отать все объяв ления, прочитанные в о внутреннем подна боре ОТД и во вс ех экземплярах парам етров, которые прочи таны, до пер вой ссылки н а экземпляр парам етра, который н е прочитан; т о есть инфор мация в эт их объявлениях обяз ана использоваться дл я нормализации знач ений атрибутов, включ ения замещающего тек ста внутренних экземп ляров поддержки знач ений по умолч анию в атриб утах.
Формальная грамм атика XML даётся в данной специф икации с использ ованием нотации Extended Backus-Naur Form (EBNF). Каж дое правило грамм атики определяет од ин символ.
3.3 О спецификации XHTML
В настоящей специф икации определяется XHTML 1.0, переформ улировка HTML 4 в ви де приложения XML 1.0, и три DTD, соответс твующих типам, опреде ляемым HTML 4. Семантика элеме нтов и и х атрибутов опред елена в рекоме ндации W3C HTML 4. Данная семан тика представляет соб ой основу дл я будущего расши рения языка XHTML.
XHTML предст авляет собой семей ство имеющихся н а данный мом ент и могу щих появиться в будущем тип ов документов и модулей, являю щихся копиями, подмнож ествами или расшир ениями языка HTML 4 [HTML]. Семей ство типов докум ентов XHTML базируется н а XML и предназ начено для раб оты с пользоват ельскими агентами н а базе. Бол ее подробную инфор мацию об эт ом семействе и его эвол юции можно най ти в разд еле "Направления разв ития".
Семейство XHTML явля ется следующим шаг ом в эвол юции Интернет. Пере ходя сегодня н а XHTML, разработчики содерж имого (контента) мог ут вступить в мир XML с о всеми ег о преимуществами, сохр аняя при эт ом совместимость содерж имого с бол ее старыми и более нов ыми версиями.
Преиму щества перехода н а XHTML 1.0 описаны вы ше. Вот неско лько основных преиму ществ:
Разработчики докум ентов и созда тели пользовательских аген тов постоянно откры вают новые спос обы выражения сво их идей в новой разм етке. В XML вв од новых элеме нтов или атриб утов достаточно про ст. Семейство XHTML разраб отано так, что бы принимать расши рения путем моду лей и техно логий XHTML для разра ботки новых соответс твующих XHTML модулей (описа нных в готовя щейся спецификации Модуляр изации XHTML). Модули позв олят комбинировать сущест вующие и нов ые наборы функ ций при разра ботке содержимого и создании нов ых пользовательских аген тов.