Файл: Языки гипертекстовой разметки (1. Язык разметки гипертекста. Понятие. Основные характеристики).pdf

К сегодняшнему дню Глобальная Сеть, помимо того, что объединила людей со всего мира, еще и утвердилась как неотъемлемая часть технологий практически каждого персонального компьютера. В самом деле, каждый пользователь, приобретающий и устанавливающий, к примеру, такой привычный пакет Microsoft Office, автоматически причисляется к обладателям Internet-технологий. Самое интересное, что данный факт не зависит от наличия подключения персонального компьютера к Сети Интернет.

Иначе говоря, средства и платформы, которые изначально планировались и внедрялись как средства работы с Сетью, теперь применяются и в иных целях, которые не имеют к Сети никакого отношения. Кроме того, к сегодняшнему дню программы для работы с Сетью заняли свое почетное, даже несколько обособленное место на рынке программного обеспечения.

Результатом подобных изменений явился тот факт, что большая часть пользователей стала иметь отношение к Сети, что также не зависит от желания самих пользователей.

Кроме того, на сегодняшний день стало популярным средством выражения собственного мнения и жизненной позиции размещение в Глобальной Сети персональных страниц. В то же время, большая часть современных государственных и коммерческих организаций стала приверженцем использования Сети не только для оптимизации работы сотрудников и организации в целом, но и для рекламы и продвижения организации.

Нельзя не отметить, что на рынке труда также произошли существенные изменения благодаря использованию технология Сети – пользователи получили возможность составлять резюме и вакансии в виде отдельных веб-страниц, доступных для просмотра всей Сети.

Подобный прогресс не был бы достигнут без такого базового явления, как разметки гипертекста. Так, для того чтобы проанализировать принципы работы и построения языков разметки, необходимо выполнить следующую цель – изучение языков гипертекстовой разметки.

Объектом исследования будут выступать сами языки гипертекстовой разметки.

Для достижения поставленной цели необходимо выполнить следующие задачи:

Рассмотреть понятие «язык разметки гипертекста»
Изучить основные характеристики гипертекстовой разметки
Проанализировать язык разметки гипертекста HTML
Охарактеризовать язык разметки гипертекста Dynamic HTML
Дать анализ языка разметки гипертекста XHTML
Привести выводы по проделанной работе.

В структуру работы включены такие элементы, как Введение, Заключение и Список использованных источников. Кроме того, работа содержит две главы, первая из которых состоит из двух параграфов, а вторая – из трех.

Основной теоретической базой исследования выступают работы современных исследователей проблемы, в их числе – Гончаров А., Макарова Н., Морозевич А., Зеневич А. и Шафран Э.

1. Язык разметки гипертекста. Понятие. Основные характеристики

1.1 Понятие «язык разметки гипертекста»

На сегодняшний день место основы современных технологий, применяемых в сети Internet заняли языки разметки гипертекста и написания сценариев, апплетов и скриптов публикаций WWW (World Wide Web). В современном мире уже разработано и продолжает разрабатываться большое количество разнообразных программных языков, либо специально ориентированных на использование в Web, либо включающих функции, предназначенные для Internet.

Язык разметки гипертекста в компьютерной терминологии представляет собой набор символов или последовательностей, которые вставляются в текст для передачи информации о его выводе или строении. Язык гипертекстовой разметки можно отнести к классу компьютерных языков. Текстовый документ, который был написан при помощи языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках – например, указание на заголовки, выделения, списки и т. д.

В более затруднительных случаях язык разметки предоставляет возможность интегрировать в документ интерактивные элементы и содержание других документов^[1].

Термин «разметка» (как результат одноименного процесса, англ. markup) происходит от английского словосочетания «marking up» («разметка (как процесс)», букв. «помечивание, размечивание»), которые было заимствовано из традиционной издательской практики проставления специальных условных пометок на полях и в тексте рукописи или корректуры перед передачей её в печать. Таким образом «разметчики» (markup men) указывали гарнитуру, стиль и размер шрифта для каждой части текста. На сегодняшний день разметкой текста занимаются редакторы, корректоры, графические дизайнеры — и, конечно же, сами авторы^[2].

Необходимо обратить внимание на то, что согласно Тьюрингу язык разметки гипертекста не является полным и его нельзя назвать языком программирования. Несмотря на это, фактически, исходя из соображений логики, язык разметки гипертекста не может не быть языком программирования. Это объясняется тем, что любые элементы языка программирования представляют собой неотъемлемую в программировании часть всего языка^[3].

В 1986 г. Международная организация по стандартизации (ISO) приняла первый стандарт ISO-8879, озаглавленный «Standard Generalized Markup Language (SGML)». Этот стандарт был посвящен описанию языка SGML – обобщенного метаязыка, позволяющего строить системы логической и структурной разметки любых разновидностей текстов. Слово структурная в данном контексте означает, что управляющие коды, вносимые в текст при такой разметке, не несут никакой информации о внешнем виде документа, а лишь указывают границы и соподчинение его составных частей, т.е. задают его логическую структуру.

Данный стандарт был разработан для стандартизации обмена данными между разнородными программами и платформами. Язык SGML являлся не только мощным, но и очень сложным средством. Кроме того, SGML-документ было трудно интерпретировать без определений языка разметки, который хранится в определении типа документа DTD (document type definition). DTD необходимо было посылать вместе с SGML-документом или включать в документ, для того чтобы можно было распознать теги, созданные пользователем. Под тегами понимались специальные управляющие коды, записываемые в виде текста, ограниченного угловыми скобками^[4].

Необходимо отметить, что основной проблемой того времени оставалась проблема корректного отображения ранее созданных страниц текста ввиду достаточно большого разнообразия программ создания текстовых документов и различных аппаратно-программных платформ.

В связи с этим разработчики SGML стремились создать программно- и аппаратно-независимые языки, с тем чтобы размеченный текст мог без труда интерпретироваться любой программой, работающей с любым устройством вывода.

Фактически SGML представлял собой не готовую систему разметки текста, а лишь удобный метаязык, позволяющий строить такие системы для конкретных обстоятельств. Стандарт SGML определял лишь синтаксис записи элементов разметки текстов – тегов и их атрибутов, а также содержал правила определения новых тегов и указания структурных отношений между ними. Для практической же разметки документов использовалось приложение SGML: набор определенных в соответствии со стандартом тегов, являющийся, по сути, формальным описанием структуры документа^[5].

1.2 Основные характеристики языков гипертекстовой разметки

В данном параграфе будут рассмотрены основные характеристики языков гипертекстовой разметки.

Различают логическую и визуальную разметки. В первом случае речь идет только о том, какую роль играет данный участок документа в его общей структуре (например, «данная строка является заголовком»). Во втором — определяется, как именно будет отображаться этот элемент (например, «данную строку следует отображать жирным шрифтом»).

Идея языков разметки состоит в том, что визуальное отображение документа должно автоматически получаться из логической разметки и не зависеть от его непосредственного содержания. Это упрощает автоматическую обработку документа и его отображение в различных условиях (например, один и тот же файл может по-разному отображаться на экране компьютера, мобильного телефона и на печати, поскольку свойства этих устройств вывода существенно различаются). Однако это правило часто нарушается: например, создавая документ в редакторе наподобие MS Word, пользователь может выделять заголовки жирным шрифтом, но нигде не указывать, что эта строка является заголовком^[6].

Языки разметки используются везде, где требуется получение форматированного текста на основании одного лишь текста: в типографии (SGML, TeX, PostScript, RTF), пользовательских интерфейсах компьютеров (Microsoft Word, OpenOffice, troff), Всемирной Сети (HTML, XHTML, XML, WML, VML, PGML, SVG, XBRL).

Языки, предназначенные для простого и быстрого написания текста в простом текстовом редакторе, называются облегчёнными (Lightweight markup language). Особенности таких языков:

Минимум функций.
Небольшой набор поддерживаемых тегов.
Легки в освоении.
Исходный текст на таком языке читается с такой же лёгкостью, как и готовый документ.

Применяются они там, где человеку приходится подготавливать текст в обычном текстовом редакторе (блоги, форумы), либо там, где важно, чтобы пользователь с обычным текстовым редактором также мог прочитать текст. Вот несколько широко распространённых облегчённых языков разметки:

BBCode
Markdown
reStructuredText
Textile
Различные системы автодокументирования (например, Javadoc)^[7].

Общая особенность всех языков разметки в том, что они перемешивают текст документа с инструкциями разметки в потоке данных или файле. Это не необходимость, возможно изолировать разметку от текста, используя указатели, метки, идентификаторы или другие методы координации. Такая «отделенная разметка» характерна для внутреннего представления программ, работающих с размеченными документами. Тем не менее, внедренная или «междустрочная» разметка более принята где бы то ни было.

Пока развивалась идея использовать языки разметки с текстовыми документами, это увеличило использование языков разметки в других областях, предложили использовать их для представления различных типов информации, включая плей-листы, векторную графику, веб-сервисы, интерфейсы пользователя. Большинство этих приложений основано на XML, так как это хорошо структурированный и расширяемый язык.

Использование языка XHTML также показывает, что его можно комбинировать с различными языками разметки одного профиля, например XHTML+SMIL или XHTML+MathML+SVG^[8].

2. Основные языки гипертекстовой разметки: HTML, Dynamic HTML, XHTML

2.1 Язык разметки гипертекста HTML

Большая часть документов в системе World Wide Web хранится в формате HTML. HTML – это язык гипертекстовой разметки, используемый для кодирования документов. Язык HTML представляет собой набор команд, в соответствии с которыми браузер отображает содержимое документа, команды HTML не отображаются. В языке HTML реализован механизм гипертекстовых ссылок, который обеспечивает связь одного документа с другими. Эти документы могут находиться на том же сервере, что и страница, с которой на них делается ссылка, а могут быть размещены на другом сервере^[9].

Команды в тексте HTML-документа называются тегами.

HTML-тег может содержать список атрибутов. Текст тега заключается в угловые скобки (< и >). В простейшем случае тег представляет собой имя, заключенное в угловые скобки, например <TITLE> или <В>. Для более сложных тегов характерно наличие атрибутов, которые могут иметь конкретные значения, определяющие функции тега. Например:

<Р ALIGN=«JUSTIFY»>

В данном случае <Р> - это тег, ALIGN - один из его атрибутов, a «JUSTIFY» - значение этого атрибута. (Данный тег определяет начало абзаца, атрибут ALIGN определяет способ выравнивания текста в абзаце, значение «JUSTIFY « задает выравнивание по ширине.)

Регистр символов в именах тегов не учитывается. Теги <Р> и <р> будут интерпретироваться одинаково. Однако в некоторых случаях важно использовать определенный регистр символов в значениях атрибутов.

Большинство HTML-тегов имеют парный закрывающий тег. Текст, к которому применяется форматирование, заключается между открывающим и закрывающим тегами. Закрывающий тег имеет имя, идентичное открывающему тегу, но перед именем закрывающего тега ставится косая черта. Например, чтобы отобразить текст курсивом, его нужно заключить в теги <I> и </I>: