Файл: Распределенные системы обработки информации.pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 25.06.2023

Просмотров: 101

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

2.2. Расширяемый язык разметки XML

Консорциум World Wide Web, упростив SGML для использования в Web, предложил расширяемый язык разметки XML (Extensible Markup Language - рекомендация 1998 г.). XML представляет собой подмножество SGML, причем любой действительный документ XML является действительным документом SGML. Как и SGML, XML - это метаязык, определяющий другие языки разметки для специфических целей.

XML используется для разметки стандартных документов во многом так же, как HTML. Однако XML ориентирован на работу со структурированными данными, такими, как результаты запроса, метаинформация о Web-узле или элементы и тип схемы. Документ XML внешне похож на HTML. Он также состоит из текстовых фрагментов, аннотированных заключенными в угловые скобки тегами. XML - это язык разметки, описывающий целый класс объектов данных, называемых XML- документами. Этот язык используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов. То есть сам по себе XML не содержит никаких тэгов, предназначенных для разметки, он просто определяет порядок их создания. Язык XML – это универсальный формат для структуризации документов и данных, применяемый для обмена информацией, позволяя различным компьютерным системам "общаться", язык XML дает возможность обмениваться сведениями о данных, существенно повышая эффективность. По прогнозам экспертов, XML в будущем станет основой взаимоотношений между партнерами.

XML-документ представляет собой обычный текстовый файл, в котором при помощи специальных маркеров создаются элементы данных, последовательность и вложенность которых определяет структуру документа и его содержание. Основным достоинством XML документов является то, что при относительно простом способе создания и обработки (обычный текст может редактироваться любым тестовым процессором и обрабатываться стандартными XML анализаторами), они позволяют создавать структурированную информацию, которую хорошо "понимают" компьютеры.

Для создания XML документа в простейшем случае не понадобится ничего кроме обычного текстового редактора. При создании собственного языка разметки можно придумывать любые названия элементов, (почти любые, т.к. список допустимых символов ограничен), соответствующих контексту их использования. Таким образом, у разработчиков появляется уникальная возможность определять собственные теги, позволяющие им наиболее эффективно определять данные, содержащиеся в документе. Автор документа создает его структуру, строит необходимые связи между элементами, используя, те теги, которые удовлетворяют его требованиям и добивается такого типа разметки, которое необходимо ему для выполнения операций просмотра, поиска, анализа документа.


Еще одним из очевидных достоинств XML является возможность использования его в качестве универсального языка запросов к хранилищам информации. XML-документы могут выступать в качестве уникального способа хранения данных, который включает в себя одновременно средства для разбора информации и представления ее на стороне клиента. В этой области одним из перспективных направлений является интеграция Java и XML - технологий, позволяющая использовать мощь обеих технологий при построении машинно-независимых приложений, использующих, кроме того, универсальный формат данных при обмене информации.

XML позволяет также осуществлять контроль за корректностью данных, хранящихся в документах, производить проверки иерархических соотношений внутри документа и устанавливать единый стандарт на структуру документов, содержимым которых могут быть самые различные данные. Это означает, что его можно использовать при построении сложных информационных систем, в которых очень важным является вопрос обмена информацией между различными приложениями, работающими в одной системе. Создавая структуру механизма обмена информации в самом начале работы над проектом, менеджер может избавить себя в будущем от многих проблем, связанных с несовместимостью используемых различными компонентами системы форматов данных.

Можно выделить множество задач, связанных с созданием и обработкой структурированной информации, для решения которых может использоваться XML:

- технология XML может оказаться полезной для разработчиков сложных информационных систем, с большим количеством приложений, связанных потоками информации самой различной структурой. В этом случае XML - документы выполняют роль универсального формата для обмена информацией между отдельными компонентами большой программы;

- язык XML позволяет описывать данные произвольного типа и используется для представления специализированной информации, например, химических, математических, физических формул, медицинских рецептов, нотных записей, и т.д. Это означает, что XML может служить мощным дополнением к HTML для распространения в Web "нестандартной" информации;

- XML может использоваться в обычных приложениях для хранения и обработки структурированных данных в едином формате.

Характерными особенностями языка XML являются:

- разметка XML-файла позволяет описывать его содержание;

- XML-документ способен нести информацию о включенном в него материале. Он содержит информацию только о структуре и смысле документа, оставляя форматирование элементов таблице стилей (Extensible Stylesheet Language - XSL);


- сведения о содержании файла могут быть затем повторно использованы на различных компьютерах и в различных приложениях;

- способность объединять несколько XML-документов в один большой документ;

- для XML не обязательно определение типа документа;

- теги XML можно применять для управления поиском информации, в том числе и в глобальных сетях;

- XML предоставляет пользователю возможность определять свой собственный способ кодирования информации с использованием языка разметки;

- XML может употребляться в качестве формата обмена для протоколов транзакций;

В общем случае XML- документы должны удовлетворять следующим требованиям:

- в заголовке документа помещается объявление XML, в котором указывается язык разметки документа, номер его версии и дополнительная информация;

- каждый открывающий тэг, определяющий некоторую область данных в документе обязательно должен иметь своего закрывающего "напарника", т.е., в отличие от HTML, нельзя опускать закрывающие тэги;

- в XML учитывается регистр символов;

- все значения атрибутов, используемых в определении тэгов, должны быть заключены в кавычки;

- вложенность тэгов в XML строго контролируется, поэтому необходимо следить за порядком следования открывающих и закрывающих тэгов;

- вся информация, располагающаяся между начальным и конечными тэгами, рассматривается в XML, как данные, и поэтому учитываются все символы форматирования (т.е. пробелы, переводы строк, табуляции не игнорируются, как в HTML).

Если XML- документ не нарушает приведенные правила, то он называется формально-правильным и все анализаторы, предназначенные для разбора XML- документов, смогут работать с ним корректно. На сегодняшний день существует два способа контроля правильности XML- документа: DTD - определения(Document Type Definition) и схемы данных (XML Schema).

Корпорация Microsoft расширила поддержку XML для компонентов Office 2003 Enterprise Edition; кроме того, в состав данной редакции пакета включено новое приложение - InfoPath, которое позволяет создавать XML-документы и формы. Word, Excel, Visio и другие приложения пакета позволят импортировать XML- схемы и данные для манипуляций с ними (пересчета, создания отчетов, построения графиков) и заполнения несложных форм; элементы схем можно будет переносить в рабочее пространство приложения буксировкой. Схемы и данные затем можно будет сохранить в формате XML или передать в другие приложения посредством Web-служб или технологии Active Data Objects. Все эти возможности направлены не столько на ознакомление с XML нынешнего рядового пользователя Office, сколько на подготовку Office к неизбежному расширению поддержки XML в серверных продуктах Microsoft.


XML используется в качестве формата содержания и в качестве его оболочки, обеспечив возможность кругового преобразования документов между всевозможными форматами. XML-документы постепенно эволюционируют, вобрав в себя, кроме собственно содержания, историю ревизий, сведения о правах доступа и информацию о контекстном процессе.

XML позволяет:

- отделить данные от их представления и тем самым преодолеть хаотичность HTML;

- упорядочить данные в деревья и списки, структурировать их и порождать из них объектные модели;

- описывать метаданные на метаязыке таким образом, чтобы программные модули стали абсолютно универсальными, поскольку они будут иметь дело только с XML-файлами и больше ни с чем другим. Таким образом, с помощью XML можно попытаться реализовать принцип: "Данные должны управлять программами, а не наоборот".

XML поддерживается многими инструментами, разработанными известными фирмами, такими как IBM, MICROSOFT, Oracle, Sun, др. Фирма IBM разработала XML for Java parser — мощный высокоскоростной XML-анализатор; WebSphere — кросс-платформный сервер приложений на Java, расширяющий возможности наиболее популярных Web-серверов, таких, как Apache, IIS, Domino; XMI Toolkit — средство преобразования UML-моделей, построенных с помощью современных CASE-средств типа Rational Rose, в XML- и DTD-структуры; LotusXSL Processor — позволяющий задавать для XML-документов стилевые таблицы и преобразовывать XML-данные в стандартный HTML для поддержки браузеров, не умеющих распознавать язык XML. LotusXSL Processor существует в виде набора Java-классов, методы которых можно вызывать из любых Java-программ, агентов или сервлетов.

XML документы создаются как вручную, так и с помощью программных средств, специальных редакторов или конвертированием из БД. Очевидно, что ручной способ создания структурированной информации не может применяться для наполнения больших информационных узлов. Для этого существуют специальные средства разработки. Для создания XML файлов можно использовать любые XML редакторы (XMLPad, XMLSpy, Xalan, XMetal, др.). Одним их самых простых и удобных и бесплатных является редактор XMLPad. В офисе XP имеются возможности создавать и трансформировать XML файлы.

XML — отнюдь не модное направление, а естественный результат развития Web-технологий, следствие стремления к более эффективному использованию уникальных возможностей открытой глобальной информационной среды, которую они поддерживают. Создание платформы XML — это новая эпоха в развитии Всемирной паутины, это — начало нового, более наукоемкого и технологически более совершенного этапа в ее истории. Сегодня XML, несомненно, стал стандартом де-факто. Все ведущие поставщики программного обеспечения не только Web, но и систем баз данных, включают в свои программные продукты поддержку языка XML или даже создают специализированные системы.


Большую работу по продвижению стандартов платформы XML в практику ведет крупный Международный, некоммерческий консорциум OASIS (Organization for Structured Information Standards, Организация по стандартизации структурированной информации) (Error: Reference source not found), в составе, которого более 600 корпоративных и индивидуальных членов из различных стран мира. Эта деятельность является основной задачей консорциума. OASIS разрабатывает, координирует разработки и распространяет информацию о методологиях применения, технологиях и реализациях этих стандартов. В его задачу входит также создание приложений для «вертикальной» индустрии (например, разработки описания типов документов (Document Type Definition, DTD), схем XML и пространств имен XML), спецификаций интероперабельности (в частности, создание спецификаций профилей, включающих стандарты рассматриваемой категории), тестов на соответствие рассматриваемым стандартам.

Распространению стандартов XML-платформы существенным образом способствует политика W3C, направленная на обеспечение доступности их спецификаций, создание ряда свободно распространяемых синтаксических анализаторов для языка, то большое внимание, которые создатели стандартов XML уделяют обеспечению преемственности для существующей HTML-платформы и накопленных на ее основе ресурсов.

Хотя язык XML и базирующиеся на нем стандарты получают все более широкое распространение, имеются вместе с тем факторы, которые сдерживают массовое распространение XML в среде Web.

Во-первых, существует связанная с экономическими и иными причинами естественная инерционность столь масштабной среды, какой является сегодняшний Web. Эта инерция может преодолеваться только постепенно.

Во-вторых, пока еще не завершена работа над двумя важнейшими стандартами платформы XML, которые позволяют строить из отдельных XML-документов и их компонентов гипермедийную среду. Речь идет о стандартах XPointer (XML Pointer Language, язык указателей XML) и XLink (XML Linking Language, язык ссылок XML). Эти стандарты решают задачу определения гиперссылок в языке XML. Возможности стандартов XPointer и XLink предусматривают существенно более богаты возможности работы с гиперссылками, чем у имеющихся в HTML.

Технологии XML начинают распространяться и в нашей стране. В этой связи приобретает важное значение русскоязычная терминология в этой области.

Платформа XML имеет благоприятные перспективы для широкого практического применения. В пользу этого свидетельствуют не только богатые функциональные возможности рассмотренного семейства стандартов, но и высокая активность в области разработки и развития стандартов, а также производства программного обеспечения, на них основанного.