Файл: Языки гипертекстовой разметки (Понятие «информационная система» в Web).pdf
Добавлен: 24.05.2023
Просмотров: 268
Скачиваний: 3
Анализируя особен ности языка HTML и оценивая уров ень его прора ботки, можно при йти к выв оду, что уж е в ближа йшие годы след ует ожидать появл ения более соверш енных его модифи каций, новых язы ков и прикл адных пакетов дл я работы с web-страницами.
Динами ческий и статич еский HTML-документы
Разли чают два ви да html-документов – статич еские и динами ческие. Статические докум енты хранятся в файлах то й файловой сист емы, которая исполь зуется web-сервером ил и браузером пр и просмотре локал ьных файлов. Пр и размещении инфор мации на web-серв ере можно исполь зовать динамические докум енты - такие, кото рые не сущес твуют постоянно в виде фай лов, а генери руются в мом ент запроса клие нта.
Для генерир ования динамического докум ента HTML требуется специ ально написанная прогр амма по прав илам, определяемым web-серв ером. Динамический спо соб определяет хран ение данных в формализованном ви де, например в базе дан ных. Для генерир ования статических докум ентов можно исполь зовать любые сред ства отчетов, имеющ ихся в то й системе управ ления баз дан ных (СУБД), кото рой обработаны и формализованы дан ные.
Перспективы HTML
Нов ых версий язы ка HTML не буд ет, однако сущес твует дальнейшее разв итие HTML под назва нием XHTML (англ. Extensible Hypertext Markup Language — расшир яемый язык разм етки гипертекста). По ка XHTML по сво им возможностям сопос тавим с HTML, одн ако предъявляет бол ее строгие требо вания к синта ксису. Как и HTML, XHTML является подмнож еством языка SGML, одн ако XHTML, в отли чие от предшест венника, соответствует специф икации XML.
2.2 Расширяемый яз ык разметки XML
Вто рая половина 90-х годов проше дшего века ознамен овалась радикальными перем енами в технол огиях Web. Менее че м за пятил етнюю историю сво его существования Web прио брел многие сот ни миллионов пользов ателей на вс ех континентах, в его сре де сформированы и поддерживаются огро мные информационные ресу рсы. Эта глоба льная информационная сист ема интенсивно вторг ается в дру гие области информа ционных технологий, ста ла одним и з важных звен ьев инфраструктуры информац ионного общества.
Вме сте с те м ряд ограни чений, свойственных действ ующим технологиям Web (Web перв ого поколения ил и Web-1), стал сдержи вающим фактором дальне йшего его разв ития. Новые подх оды в обла сти технологий Web, кото рые начали констру ктивно воплощаться в жизнь н а пороге XXI ве ка, направлены, пре жде всего н а преодоление эт их ограничений и создание технолог ической платформы[1], кото рая бы обесп ечила потенциал дл я появления нов ого поколения Web (Web втор ого поколения ил и Web-2) и возмож ностей его разв ития на длите льную перспективу. Основопо лагающую роль в технологическом переосн ащении Web стал игр ать разработанный консор циумом W3C новый яз ык разметки XML. Яз ык XML (ExtensibleMarkupLanguage, расширяемый яз ык разметки) – эт о метаязык, являю щийся подъязыком SGML и определяющий проце дуру порождения язы ков разметки дл я специфических цел ей.
Консорциум W3C, созда нный для прове дения единой технич еской политики в рамках Web и развития ег о технологий, вед ет в насто ящее время разра ботку и поддер живает более полу тора сотен станд артов. Конечно ж е, невозможно предст авить их зде сь в доста точно полном ви де и прихо дится ограничиться ли шь обсуждением концепт уальных аспектов наиб олее важных и з них. Дл я основательного изуч ения стандартов платф ормы XML нужно обрат иться к и х оригинальным специфи кациям и дру гим материалам консор циума W3C.
Следует заме тить, что аббрев иатуру XML довольно час то используют дл я обозначения н е только сам ого языка XML, н о и некот орых других связа нных с ни м понятий — определ яющего язык станд арта W3C, информационных ресу рсов XML, комплекса основ анных на язы ке XML стандартов консор циума W3C, составляющих платф орму XML.
В т о время ка к язык XML вс е чаще испол ьзуют в сре де Web по прям ому своему назна чению — как выразит ельное средство дл я представления информа ционных ресурсов в этой сре де, он вме сте с те м энергично внедр яется в дру гие технологии. Разв итые выразительные возмож ности языка, а главное, ег о поддержка механи змами среды Web позво ляют использовать XML в качестве язы ка-посредника дл я определения форм атов обмена данн ыми между разли чными системами, кото рые используют Internet в качестве коммуник ационной среды.
Глав ная сфера приме нения стандартов платф ормы XML — это предста вление слабоструктурированных дан ных[2] Web-сайтов в форме XML-докум ентов. Собственно, дл я этой це ли и созда вался язык XML. Приме нение XML в эт ой области позво ляет не тол ько представлять в среде Web гиперме дийные страницы в форме XML-докум ентов, но и поддерживать связа нные с ни ми метаданные[3]. Благо даря этому мож но создать так ие поисковые маш ины Web, которые буд ут обеспечивать в результате обраб отки пользовательского поиск ового запроса гора здо более низ кий уровень информац ионного шума п о сравнению с нынешними HTML-технол огиями.
Одной и з важнейших цел ей создания платф ормы XML является привне сение в сре ду Web метаданных, описыв ающих свойства поддерж иваемых в не й информационных ресу рсов[4]. Речь ид ет прежде все го об опис ании структуры XML-докум ентов и и х смыслового содер жания (семантики). Необход имость решения эт ой задачи аргумент ируется стремлением к получению возмож ностей автоматической пров ерки правильности струк туры XML-документов и снижения уро вня информационного шу ма при отыск ании нужных дан ных в Web с помощью разли чных поисковых маш ин. Имеется в виду, чт о при нали чии явного опис ания структуры докум ентов проверку и х правильности мож ет осуществлять брау зер.
Однако ча ще всего н е учитывается ещ е одно важ ное назначение метад анных, описывающих информа ционные ресурсы Web. Метад анные необходимы дл я создания принцип иально новых высокоур овневых приложений Web, в частности основ анных на интег рации информационных техно логий и обеспеч ивающих интеграцию неодно родных информационных ресу рсов. Приведенный в приложении ри с. 1. иллюстрирует упрощ енную архитектуру сист емы, в кото рой метаданные исполь зуются для обеспе чения интеграции неодно родных информационных ресу рсов.
Пространства им ен XML
Простейшая возмож ность задания семан тики — использование простр анства имен. В отличие о т языка HTML, обеспечи вающего форматную разм етку текста, кото рая определяет ег о представление н а экране, XML слу жит для структ урной разметки.
Разм етка в XML позво ляет выделять в тексте содержа тельные структурные един ицы, называемые элеме нтами XML-документа. Дл я выделения кажд ого типа элеме нтов используется св ой тег, указыв ающий имя ти па элемента. Поэт ому с каж дым таким тег ом можно ассоции ровать семантику соответс твующих элементов XML-докум ента (адрес органи зации, номер теле фона и т. д.).
Ес ли некоторое сообщ ество разработчиков и пользователей XML-докум ентов договорится о единой интерпр етации имен, принадл ежащих некоторому наб ору, то эт от унифицированный наб ор, возможно, с каким-ли бо описанием и х смысла (напр имер, в ви де обычного тек ста на естест венном языке ил и представленный как им-либо ин ым образом), мож ет использоваться ка к пространство им ен. Адрес докум ента, представляющего в Web этот наб ор имен, буд ет рассматриваться ка к уникальный идентиф икатор пространства им ен, и н а него мож но ссылаться в XML-документе, гд е используются принадл ежащие этому простр анству имена. И тем сам ым им прида ется некоторый смы сл.
Примером дости жения консенсуса о составе простр анства имен явля ется набор элеме нтов метаданных дл я описания семан тики представленных в Web документов, назва нный Дублинским ядр ом (Dublin Core, DC).
Дублинское яд ро с прин ятой в не м семантикой элеме нтов метаданных мож ет использоваться в рамках платф ормы XML различными спосо бами. Например, мож но применять DC в качестве простр анства имен дл я некоторого ти па XML-документов ил и в RDF-специф икации (ResourceDefinitionFramework, стандарт схе мы описания источ ников).
RDF-спецификации предст авляют собой бол ее высокий уров ень семантического опис ания информационных ресу рсов. Информационные ресу рсы в RDF — эт о ресурсы Web, идентифи цируемые уникальным обра зом с помо щью их URI (Uniform Resource Identifier, обобщ ение концепции URL в WWW). Они мог ут также предст авлять собой колле кции других информа ционных ресурсов ил и литералов, назыв аемые контейнерами. Допуск аются контейнеры ти па мультимножества, последова тельности и альтер нативы.
Для то го чтобы RDF-специф икация семантики информа ционных ресурсов бы ла полной, необх одимо ассоциировать с нею опис ание семантики исполь зуемых в эт ой спецификации свой ств, которое в терминологии станд арта RDF называется схе мой.
Метаданные, предста вленные средствами RDF, мог ут использоваться дл я более эффект ивного поиска ресу рсов поисковыми маши нами Web, в электр онных библиотеках, в описаниях колле кций страниц Web, состав ляющих некоторый виртуа льный документ, дл я представления содер жания информационных ресу рсов в конкр етных предметных обла стях, а так же для подде ржки различных Web-прило жений, нуждающихся в семантической инфор мации о ресу рсах.
В зад ачу RDF не вхо дит стандартизация как их-либо набо ров семантических свой ств, и он и могут бы ть различными в разных случ аях.
В после днее время нач али создаваться серв исы регистрации и поддержки простр анств имен в интересах разли чных сообществ разрабо тчиков и пользов ателей. Зарегистрированное простр анство имен явля ется своего ро да стандартом дл я сообществ клие нтов сервиса регист рации.
Перспективы XML
XML — отн юдь не мод ное направление, а естественный резул ьтат развития Web-техно логий, следствие стрем ления к бол ее эффективному использ ованию уникальных возмож ностей открытой глоба льной информационной сре ды, которую он и поддерживают. Созд ание платформы XML — эт о новая эпо ха в разв итии Всемирной паут ины, это — нач ало нового, бол ее наукоемкого и технологически бол ее совершенного эта па в е е истории. Сего дня XML, несомненно, ст ал стандартом д е-факто. Вс е ведущие поста вщики программного обеспе чения не тол ько Web, но и систем ба з данных, вклю чают в св ои программные прод укты поддержку язы ка XML или да же создают специализ ированные системы.
Боль шую работу п о продвижению станд артов платформы XML в практику вед ет крупный Междуна родный, некоммерческий консо рциум OASISв сост аве, которого бол ее 600 корпоративных и индивидуальных чле нов из разли чных стран ми ра. Эта деятел ьность является осно вной задачей консор циума. OASIS разрабатывает, коорди нирует разработки и распространяет инфор мацию о методо логиях применения, технол огиях и реализ ациях этих станд артов. В ег о задачу вхо дит также созд ание приложений дл я «вертикальной» индус трии (например, разра ботки описания тип ов документов (DocumentTypeDefinition, DTD), сх ем XML и простр анств имен XML), специф икаций интероперабельности (в частности, созд ание спецификаций проф илей, включающих станд арты рассматриваемой катег ории), тестов н а соответствие рассматр иваемым стандартам.