Файл: Методические указания по выполнению лабораторных работ по дисциплине (модулю) Лингвистическое и программное обеспечение автоматизированных систем.doc

Физическая структура XML-документа описывает его как набор сущностей. Документ должен содержать как минимум одну сущность — корневую сущность документа. Сущности могут включаться в XML-документ также с помощью XML-ссылок.

XML-ссылка — это ссылка на внешний объект, содержимое которого размещается в указанном месте документа. Ссылка на сущность работает как подстановка и обеспечивает модульность XML-документа, которая, как будет показано ниже, позволяет объединять данные из разных источников в единую структуру и легко собирать документы, а также их схемы из пригодных для повторного использования блоков.

2.7. Пространства имен

Различные приложения могут использовать сущности, имеющие одинаковые имена и содержащие различные данные. Для предотвращения конфликтов имен в XML используются пространства имен, которые представляют собой коллекции имен. В каждой коллекции имен все имена уникальны. Каждая коллекция должна иметь уникальный идентификатор (URI-адрес). Каждое XML-имя характеризуется идентификатором пространства имен и локальным именем в пределах своего пространства имен. Таким образом, появляется возможность определить элементы, имеющие одинаковые имена, но связанные с различными URI.

Рассмотрим правила использования пространств имен на конкретном примере. Пусть в одном документе необходимо объединить данные о клиенте компании, поступающие из разных источников. Из CRM-системы поступает информация о персональных данных клиента, из системы учета заказов — данные о заказе.

CRM

Mary

+7.602.555.9999

+7.602.555.9999

Система учета заказов

2223

10.10.2012

Пространство имен объявляется с помощью зарезервированного имени xmlns. Ниже приводится пример объявления пространств имен в XML-документе.

ClientInfo и ClientOrderData являются префиксами пространств имен и представляют сокращенные наименования идентификаторов.

После объявления пространств имен их префиксы могут использоваться в документе для определения принадлежности каждого элемента к конкретному пространству имен.

Для рассмотренного примера XML-документ, содержащий данные из двух пространств имен, будет выглядеть следующим образом:

xmlns:ClientOderData="http://www.mycompany.com/

ClientOrderData" >

Mary

+7.602.555.9999

+7.602.555.9999

2223

10.10.2012

Имя элемента или атрибута с префиксом называется уточненным именем (qualified name или QName) и используется анализаторами XML для извлечения элементов, принадлежащих соответствующим пространствам имен в пределах глобального XML-пространства имен http://www.w3.org/XML/1998/namespace.

Если пространство имен объявлено без префикса, то оно является пространством имен по умолчанию для тех элементов XML-документа, которые не используют префикс. Каждое пространство имен имеет свою область действия в рамках XML-документа. Объявление пространства имен применяется к элементу, содержащему определение, а также ко всем его дочерним элементам, если оно не переопределяется другим пространством имен в определении элемента. Имена атрибутов также можно уточнять, используя префикс объявленного пространства имен. Для атрибутов нельзя использовать пространства имен по умолчанию. Если для атрибута не указан префикс, то он не принадлежит ни к какому пространству имен. Атрибуты элементов для связывания с пространствами имен всегда необходимо уточнять префиксами.

Приведем пример использования пространства имен http://www. mycompany.com/ClientInformation как пространства имен по умолчанию:

?xml version="1.0" encoding="utf-8"?

xmlns:ClientOrderData="http://www.mycompany.com/

ClientOrderData">

Mary

+7.602.555.9999

+7.602.555.9999

2223

10.10.2012

2.8. Описание структуры XML-документов

Каждый XML-документ несет информацию о данных и их структуре (описание метаданных).

XML-документы могут быть двух типов:

документы, созданные с учетом логических и структурных правил;
документы, не использующие никаких правил, кроме синтаксических правил оформления XML-документов.

Проверку документов первого типа на соответствие заданным правилам осуществляет XML-процессор. Проверка документов второго типа выполняется разработчиком.

При создании документа первого типа описание его структуры может быть выполнено с использованием таких языков, как Document Type Definitions (DTD), XML Schema, RELAX NG, XML Data-Reduced и др. [24, 31]. Наибольшее распространение получили языки DTD и XML Schema.

Далее анализируются сильные и слабые стороны наиболее распространенных языков описания структуры и приводится краткое изложение их основ. Поскольку данное учебное пособие посвящено проблемам интеграции информационных систем, при рассмотрении языков описания структуры основное внимание будет уделено вопросам модульности и повторного использования схем.

Язык Document Type Definitions (DTD)

Язык Document Type Definitions (DTD) не базируется на XML. Этот язык имеет ряд ограничений в описании метаданных: не является расширяемым, не поддерживает строгое типизирование данных, ограниченно поддерживает пространства имен. Описание структуры на языке DTD постепенно вытесняется технологией XML Schema, однако до настоящего времени продолжает использоваться (иногда совместно с XML Schema).

Приведем краткое изложение правил использования основных конструкций DTD.

Описание структуры на языке DTD может быть включено в XMLдокумент (внутреннее подмножество) или размещено в отдельном файле, также возможен вариант смешанного описания. Во всех случаях для определения DTD необходимо использовать объявление . В табл. 2.2 приведены правила включения DTDописания в XML-документ.

Таблица 2.2

Правила включения DTD-описания в XML-документ

Вариант описания структуры	Правила записи
Внутренне описание DTD	] > где ROOT — имя корневого элемента; — описание структуры на языке DTD
Внешнее описание DTD	где ROOT — имя корневого элемента; SYSTEM_ID — место расположения файла внешнего DTD. Например, где SYSTEM_ID и PUBLIC_ID — место размещения файла внешнего DTD; PUBLIC_ID не зависит от места размещения XML-файла (например, место в локальной сети); "SYSTEM_ID" будет использовано только в том случае, если нет доступа к "PUBLIC_ID". Например,

Язык DTD позволяет описать требования к элементам и атрибутам документа. При описании элементов указываются:

модель содержимого, описывающая также наличие дочерних элементов;
ограничения на количество повторений элемента в документе.

Для описания элемента используется конструкция следующего вида:

Правила записи модели содержимого представлены в табл. 2.3.

Таблица 2.3

Правила записи модели содержимого

Модель содержимого	Описание	Пример
ANY	Элемент может содержать любые дочерние элементы или текст
EMPTY	Элемент не может содержать дочерние элементы или текст, может иметь атрибуты
(#PCDATA)	Элемент может содержать только текст
(NAME1, NAME2)	Элемент содержит указанные дочерние элементы в указанном порядке, не может содержать текст
(NAME1\|NAME2)	Элемент содержит один из указанных взаимоисключающих элементов, не может содержать текст
Смешанная модель	Элемент может содержать текст и дочерние элементы	Name, Phone) >

Ограничения на количество дочерних элементов задается следующим образом (табл. 2.4).

Таблица 2.4

Ограничения на количество дочерних элементов

Оператор количества элементов	Описание	Пример
Нет	Допустимо использовать один экземпляр элемента
*	Элемент может повторяться ноль и более раз
+	Элемент может повторяться один и более раз
?	Элемент может повторяться ноль или один раз

Атрибуты элементов объявляются для каждого элемента, если это необходимо, с помощью объявления ATTLIST.

При описании атрибутов указываются:

тип атрибута;
ограничения на употребление атрибута.

Для описания атрибутов элемента используется конструкция следующего вида:

(Значение_по_умолчанию | Ключевое_слово)

Имя_атрибута2 Тип_атрибута (Значение_по_умолчанию | Ключевое_слово) >

Правила описания допустимых типов атрибутов и ключевых слов приведены в табл. 2.5.

Таблица 2.5

Правила описания допустимых типов атрибутов и ключевых слов

Тип атрибута	Описание
CDATA	Строка символов
ID	Уникальное в рамках документа значение (аналог первичного ключа в базе данных), элемент не может иметь больше одного атрибута типа ID
IDREF	Ссылка на элемент, обладающий атрибутом ID с тем же самым значением, что и значение заданного атрибута IDREF. Используется для создания связей и перекрестных ссылок в документе. Аналог отношения «один-к-одному» в реляционной базе данных
IDREFS	Последовательность ссылок IDREF, разделенных пробелами. Позволяет смоделировать отношение «один-ко-многим»
ENTITY	Определяет имя внутренней или внешней сущности, предназначенной для повторного использования. В том числе используется для определения имени примитива, игнорируемого анализатором. Позволяет ссылаться на данные, структура которых нарушает разметку по правилам XML (в частности, использовать в XML-документах ссылки на двоичные файлы)
ENTITIES	Перечень значений ENTITY, разделенных пробелами
NMTOКEN	Имя, содержащее только символы, применяемые в именах (строка, состоящая из букв, цифр и символов «.», «-», «_», «:»). Может содержать имена других элементов или атрибутов
NMTOКENS	Перечень значений NMTOКEN, разделенных пробелами

Ограничения на использование атрибутов задаются с помощью следующих ключевых слов (табл. 2.6).

Смотрите также файлы

Презентация План.pptx

Internet это крупнейшая мировая компьютерная сеть. Сейчас Internet имеет примерно 20 миллионов пользователей более чем в 50 странах. Www доступен в основном через Internet.docx

Исследование математических моделей при решении задач на ценообразование и налогообложение.pdf

Доклад на научнопрактическую студенческую конференцию 21. 04. 2010 г по теме "Белый взрыв" социальноэкономические и политические последствия.doc

Вариант Реши уравнения 1 5,2x2 0 2 19x2 14x 5 0 3 8x2 17x 0 4 x2 2x 3 0 5 9x2 15x 4 0 6 35x2 33 0 7 x2 9x 10 0 8 13x2 11x 1 .doc

Файл: Методические указания по выполнению лабораторных работ по дисциплине (модулю) Лингвистическое и программное обеспечение автоматизированных систем.doc

2.6. Физическая структура XML-документа

2.7. Пространства имен

2.8. Описание структуры XML-документов

Смотрите также файлы

Информация

Списки файлов

Дополнительно