Файл: Языки гипертекстовой разметки(Язык гипертекстовой разметки ).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 26.06.2023

Просмотров: 212

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

XHTML представляет собой язык разметки гипертекста, основанный на XML и максимально приближенный к стандартам HTML. XHTML отличается от HTML строгостью написания кода. Если HTML позволял писать практически любые конструкции и браузер их корректно распознавал, то теперь, с появлением XHTML, это стало невозможным. XHTML требует строгого соблюдения всех правил, предъявляемых W3C.

XHTML создавался с учетом общей совместимости пользовательских агентов. С помощью нового механизма профилирования пользовательских агентов и документов серверы, прокси и пользовательские агенты смогут преобразовывать содержимое наилучшим образом. В конечном счете, возможна разработка соответствующего XHTML содержимого, пригодного для любого соответствующего XHTML пользовательского агента.

XHTML совместим с HTML при соблюдении некоторых правил, т.е. даже самые старые браузеры, которые понимают HTML, могут работать и с XHTML.

Правильность написания XHTML-кода осуществляют программы-валидаторы, а пользовательские агенты, поддерживающие XHTML, сигнализируют о синтаксических ошибках во время написания кода.

При написании кода на XHTML необходимо выполнение следующих основных требований:

- в начале документа должен указываться один из возможных DTD:

- в теле документа должны обязательно присутствовать тэги: html, head, title и body;

- обязательно наличие атрибута xmlns в элементе html;

- имена тегов и атрибутов должны записываться в нижнем регистре;

- все значения атрибутов должны заключаться в "кавычки";

- все тэги должны закрываться;

- необходимо соблюдать корректную вложенность тэгов.

У XHTML есть свой собственный MIME-тип: <application/xhtml+xml> - специальный набор расширений, указывающий программам, как обрабатывать входящую информацию. Поэтому XHTML-данные правильно отдавать клиенту именно в формате <application/xhtml+xml>, поскольку все преимущества, помимо кросс-браузерности (увеличение скорости анализа кода процессором XML, сообщение об ошибках самим браузером и пр.), могут достигаться только в случае, если пользовательский агент поддерживает XHTML и ему сообщается о том, что входящие данные – это XHTML-код[18].

WML (Wireless Markup Language) – язык разметки для работы в Интернет беспроводных устройствах (WAP), основанный на XML. WML используется для описание контента и пользовательского интерфейса для особого класса узкополосных устройств, типа Palm Pilot, сотовых телефонов и пейджеров. Следует подчеркнуть, что размер WML-страниц не должен превышать 4 килобайт.


WML специально ориентирован ограничения подобных WAP-устройств, поэтому в его основе лежит идея хорошо структурированных данных – WML наследует синтаксис XML. В WML ориентируются на такие механизмы событий, как голос, либо еще какие-то варианты, кроме кнопочных.

В WML предъявляются жесткие требования к парности тегов, использованию регистра и обрамлению атрибутов кавычками. Используемые компоненты синтаксиса в WML – это символьные сущности, элементы, атрибуты, комментарии, переменные и секции CDATA.

В WML набор поддерживаемых тегов невелик.

По структуре WML напоминает несколько упрощенный HTML, при этом WML ориентирован на устройства, не обладающие возможностями персональных компьютеров (малоформатный экран, узкая полоса пропускания канала связи, малая собственная память, ограничения на "вычислительные" способности). Поэтому вся информация в WML содержится в так называемых «колодах» или «деках» (англ. deck) - минимальных блоках данных, которые могут быть переданы сервером.

В деках находятся «карточки» (card), каждая из которых ограничена тегами <card> и </card>. В одном деке всегда должна быть, по меньшей мере, одна карточка. При этом на экране устройства в каждый момент времени отображается только одна карточка, а пользователь может переключаться между ними, переходя по ссылкам.

Так, если для обычного сайта единицей является Web-page, то единица WML – это deck, состоящая из одной или нескольких card, составляющих вместе WML-документ (wml-файл). Как только wml-файл загружен в устройство с сервера, пользователь может листать экраны, переходить к следующему или возвращаться к предыдущему, не ожидая загрузки с сайта, что, конечно, выгодно по скорости.

Поскольку WML представляет собой ветвь XML, а любой XML-документ сначала должен пройти проверку на соответствие своему DTD, в любом wml-файле, необходимо указывать полный путь к WML DTD.

Строительные блоки и функциональные средства WML можно условно разделить на четыре категории: форматирование, навигация, ввод данных и управление действиями/событиями.

Так поскольку на экран выводится по одной карте, то в элементе card предусмотрен атрибут id - внутренний идентификатор для переходов, а также видимый на экране заголовок title. Для форматирования текста, почти аналогично элементы, аналогичные HTML: p – для параграфов, em и I – для выделения курсивом, big – для текста большего размера и др.

Для навигации и установки гиперссылок предусмотрены теги anchor и a.

Для ввода данных предусмотрены такие теги, как input, select/option (поле выбора из заранее заданного списка), postfield.


Для управления действиями используются tasks, do. Типовые "исполнительные" теги действий – это go, prev, refresh (перечитать текущую карту) или noop (ничего не делать). Действия на уровне конкретной карты описываются в тегах do, а на уровне всей колоды – в элементе template.

В WML есть также возможность назначать клавиши навигации.

Тег <onevent type="button">действие</onevent> позволяет приписать к одной из кнопок телефона пользовательское событие. В качестве действия обычно используется <go href="url"/>. Так, добавив к карте строку <onevent type="GO"><go href="#card2"/></onevent>, можно назначить кнопке GO переход непосредственно в меню.

Итак, подытожив материал первой главы работы можно сделать следующие выводы:

- под гипертекстом стоит понимать совокупность обычных фрагментов текста, связь между которыми реализуется посредством ссылок, встроенных в информационную систему, что позволяет пользователям осуществлять переход от одного текстового фрагмента к другому по их выбору. Основное преимущество гипертекста состоит в нелинейности повествования, которая позволяет создавать сразу несколько линейных последовательностей в изучении материала, что позволяет, не изучая всю предоставленную информацию, выбирать нужную, что позволяет сэкономить много времени;

- язык разметки документов – это набор специальных инструкций, называемых тегами, предназначенных для формирования в документах какой-либо структуры и определения отношений между различными элементами этой структуры.

- SGML - обобщенный метаязык, позволяющего строить системы логической и структурной разметки любых разновидностей текстов и не несущий информации о внешнем виде документа. Основным недостатком SGML является его сложность. Соответственно, и написание программ-обработчиков, поддерживающих SGML в полной мере, является очень трудоемким занятием. Более того, многие возможности SGML используются очень редко или не используются совсем, так что затраты на написание обработчиков, позволяющих построить крупные информационные системы на основе SGML, не оправдывают себя.

- HTML – широко используемый стандартизированный язык разметки документов в Интернете. Язык HTML интерпретируется браузерами; полученный в результате интерпретации форматированный текст отображается на экране монитора. Существует восемь версий языка HTML. HTML до его 5-ой версии определялся как приложение SGML. Спецификации HTML5 формулируются в терминах DOM. Один из основных недостатков HTML - его ограниченность. Это оборотная сторона той самой простоты, которая позволила HTML стать основным форматом данных WWW в самом начале развития Web-технологии. В HTML DTD определен фиксированный набор допустимых элементов разметки и правил их расстановки. Расширение этого набора возможно только при принятии очередной версии стандарта, а это - чрезвычайно долгий и трудный процесс, осложняющийся постоянными разногласиями крупнейших разработчиков html-браузеров (программ просмотра) по поводу полной или частичной поддержки нового стандарта, или введения собственных расширений языка, идущих вразрез со стандартизированными соглашениями. Таким образом, чем более специализированной становится область применения HTML (например, публикация инженерных расчетов, изобилующих сложными формулами), тем сильнее ощущаются ограничения HTML.


Другой недостаток HTML - определенная степень безразличия к структуре документа. Тэги HTML предназначены в первую очередь для определения способа отображения информации на экране, но они никак не связаны с отображаемыми данными по смыслу. Иными словами, тэги HTML указывают только как следует отобразить элемент на экране монитора, но они не указывают, какое значение имеет отображаемый элемент, к какой категории, классу он относится. Это не позволяет использовать тэги для ускорения поиска информации в документе, поиск таким образом приходится вести в сплошном тексте, а не в некоторой совокупности структурированных элементов. Разумеется, это еще более сужает область использования HTML в сегодняшних условиях.

- XML - это метаязык, определяющий другие языки разметки для специфических целей, предназначен для хранения структурированных данных и для обмена информацией между программами;

- XHTML - язык разметки гипертекста, основанный на XML и максимально приближенный к стандартам HTML. XHTML отличается от HTML строгостью написания кода;

- WML – язык разметки для работы в Интернет беспроводных устройствах (WAP), основанный на XML. WML используется для описания контента и пользовательского интерфейса для особого класса узкополосных устройств, типа Palm Pilot, сотовых телефонов и пейджеров.

В Таблице 1.3 Приложения 1 дана сравнительная характеристика языков гипертекстовой разметки.

1.3. Структура HTML-документа

HTML сегодня является самым универсальным языком разметки гипертекста и стандартизированным языком разметки документов во Всемирной паутине.

На данный момент разработано большое количество различных пособий и самоучителей, в том числе электронных, построенных на базе языка разметки гипертекста HTML (Hyper Text Markup Language). Именно на базе данного языка отформатированы все web-документы, а также гиперссылки, которые позволяют легко перемещаться со страницы на страницу[19].

Большинство документов имеют стандартные элементы, такие, как заголовок, параграфы или списки[20]. Используя тэги html, можно обозначать данные элементы, обеспечивая браузеры минимальной информацией для отображения данных элементов, сохраняя в целом общую структуру и информационную полноту документов. Все что необходимо, чтобы прочитать html - документ - это браузер, который интерпретирует тэги html и воспроизводит на экране документ в виде, который ему придает его автор. Html - документы могут быть созданы при помощи любого текстового редактора или специализированных html - редакторов и конвертеров.


Все тэги html начинаются с «<» (левой угловой скобки) и заканчиваются символом «>» (правой угловой скобки). Как правило, существует стартовый тэг и завершающий тэг. Завершающий тэг выглядит так же, как стартовый, и отличается от него слэшем «/» перед текстом внутри угловых скобок. Также существуют теги, которые не требуют завершающего тэга, но его использование придает исходному тексту документа улучшенную читаемость и структурируемость. HTML не реагирует на регистр символов, описывающих тэг.

Любой HTML документ содержит определенную структуру, без которой он будет просто обычным текстовым документом. Т.е., набор элементов, начало и конец каждого из которых обозначается специальными пометками - тегами, с помощью которых можно выделять заголовки документа, изменять цвет, размер и стиль букв, вставлять графические изображения и таблицы, а также специальных конструкций языка HTML, которые позволяют щелчком мыши перейти к просмотру другого документа[21].

HTML-документ состоит из собственно текста - данных, составляющих содержимое документа, и тегов — специальных конструкций языка HTML, используемых для разметки документа и управляющих его отображением. Графическая и звуковая информация, имеющаяся в HTML-документе, хранится в отдельных файлах[22].

Самый первый тэг, который встречается в документе, должен быть тэгом <html>. Тэг <!DOCTYPE html> сообщает браузеру, что документ написан с использованием html, и показывает, на какую версию html ориентироваться браузеру.

Основными тегами, используемыми HTML, являются html, head, body.

Тегом html определяется все содержание документа. С него документ начинается <html> и им заканчивается </html>. Эти теги сигнализируют о том, что находящиеся между ними строки являются единым гипертекстовым документом. Наличие этих тегов дает возможность программе просмотра идентифицировать формат документа и правильно его интерпретировать[23].

Основная, содержательна часть html документа заключается между тегами <body> и </body>, эта часть является «телом» документа. Тэги тела документа идентифицируют отображаемые в окне компоненты HTML документа. Тело документа может содержать ссылки на другие документы, текст и другую форматированную информацию.

Уровни заголовков <Hx>, где х=1,2...6. Когда пишется HTML-документ, текст делится на просто текст, заголовки частей текста, заголовки более высокого уровня и т.д. Первый уровень заголовков (самый большой) обозначается цифрой 1, следующий - 2, и т.д.