Файл: Языки гипертекстовой разметки (Определение понятия „Языки гипертекстовой разметки“).pdf
Добавлен: 29.06.2023
Просмотров: 44
Скачиваний: 2
Введение
Тема данной курсовой работы — языки гипертекстовой разметки.
Цель исследования — проанализировать особенности и ключевые этапы развития языков гипертекстовой разметки на примере таких языков, как GML, SGML, HTML и XML.
Предмет исследования — языки GML, SGML, HTML и XML.
Этапы решения поставленной цели:
- Определить понятие «Языки гипертекстовой разметки»;
- Выявить основные особенности языков гипертекстовой разметки;
- Изучить историю развития языков гипертекстовой разметки;
- Проанализировать особенности конкретных языков гипертекстовой разметки.
Актуализация языков гипертекстовой разметки как совокупности отдельных идей гипертекста и языков разметки стала возможной только благодаря развитию компьютерных технологий и Всемирной паутины. Они позволили стереть границы коммуникации не только внутри локальных файловых систем, но и между целыми информационными сетями.
Не стоит забывать и про потребности бизнеса, который, особенно в последние годы, оперирует Big Data. Пользователи, посещающие Интернет, находятся под постоянной бомбардировкой персонализированных предложений контекстной рекламы, ориентирующейся на его действиях в Сети — это, отчасти, стало возможным благодаря языкам разметки и их формализированной разметке контента сайта, позволяющей роботам-исследователям эффективно его считывать.
В случае больших онлайн-энциклопедий, вроде Википедии, создание удобных систем гипертекста это уже вопрос не только удобства, но и необходимости — контент множества страниц находится друг с другом в постоянной взаимосвязи, невыразимой без корректного ссылочного аппарата.
1. Определение понятия «Языки гипертекстовой разметки»
Вполне естественно начать курсовую работу с определения объекта исследования, а именно языков гипертекстовой разметки. Основной проблемой нашего исследования является не столько факт недостатка авторитетной литературы, дающей чёткое определения для рассматриваемого понятия, но и буквальное отсутствие его использования. Поэтому в данном исследовании дается специальное (автономное) и последовательное определение языков гипертекстовой разметки.
1.1 Имеющиеся референсы
В большинстве источников под языками гипертекстовой разметки понимается конкретно язык разметки HTML. Действительно, эта аббревиатура так и расшифровывается: HyperText Markup Language, или, с английского языка, «язык гипертекстовой разметки».
Так как объект нашего исследования находится также в названии XHTML, стоит упомянуть и о нем. XHTML, с английского eXtensible HyperText Markup Language, — расширяемый язык гипертекстовой разметки. Его развитие остановлено и новые версии не выпускаются, а W3C (Консорциум Всемирной паутины) рекомендует вместо него использовать HTML. Стоит отметить, что, несмотря на схожие названия, они с HTML кардинально различаются.
Однако, такое ограничение для исследуемого понятия нам кажется избыточным из-за самого определения гипертекста, которое появилось задолго до появления Web’а. Гипертекст — это термин, обозначающий систему из текстовых страниц, имеющих перекрёстные ссылки. В компьютерной терминологии гипертекст — это текст, сформированный с помощью языков разметки с расчетом на использование гиперссылок.
Также рассмотрим понятие гиперссылки. Это часть гипертекстового документа, ссылающаяся на другой элемент в самом документе, на другой объект, расположенный на локальном диске или в компьютерной сети, либо на элементы этого объекта.
Таким образом, применение гипертекста и гиперссылок, даже если рассматривать их исключительно в рамках Web’а, явно не ограничивается использованием HTML или XHTML. Из этого вытекает необходимость в разработке более актуального определения для языков гипертекстовой разметки, по крайней мере, в контексте данной курсовой работы.
1.2 Итоговое определения
Для определения языков гипертекстовой разметки основными являются следующие уже рассмотренные нами термины: гипертекст, гиперссылки, а также языки разметки. Язык разметки в компьютерной терминологии — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Под языком разметки понимают набор соглашений о разметке, применяемых для кодирования текстов. Язык разметки должен специфицировать, какая разметка допустима, какая разметка обязательна, как отличить разметку от текста и что разметка значит.
Таким образом, на основе этих трёх понятий мы можем сформировать определение для языков гипертекстовой разметки — это языки разметки, поддерживающие использование гиперссылок. Стоит также отметить, что языки разметки в данном случае рассматриваются только в контексте компьютерных языков — то есть, языков, относящимся к компьютерной технике.
Уже на основе таких вводных данных мы можем немного расширить предметную область языков гипертекстовой разметки, упомянув попадающие под определение языки разметки — таковыми окажутся, например, GML, SGML, и произошедшие от них HTML и XML.
1.3 Особенности и принципы работы
Как мы уже выяснили, наиболее общее определение для языков разметки, в частности гипертекстовой, звучит так — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении.
Сформированный с использованием языка (гипертекстовой) разметки текстовый документ содержит не только последовательность букв и служебных символов как текст, но и дополнительную информацию, о его различных участках — это могут быть различные выделения, списки, заголовки и так далее.
Фактически, такой документ, помимо содержательной части, содержит в себе набор специальных меток-инструкций, называемых тегами (tags), выполняющих определенные функции. Их можно разделить на два подвида, в соответствии с их назначением: логическую и визуальную.
1.4 Логическая функция
Логическая функция (разметка) отвечает за выделение логических элементов и неразрывно связана с семантикой формируемого документа. Она указывает какую именно роль играет данный участок в общей структуре или, в случае некоторых языков разметки, иерархии — например, указание определенной строки текста как заголовка или пункта списка.
1.5 Визуальная функция
Визуальная функция (разметка) отвечает за задание функций обработки выделенных элементов. Она определяет, как именно будет отображаться конкретный элемент — например, позволяет отдельную строку отображать жирным шрифтом.
Стоит отметить, что в случае продвинутых языков (гипертекстовой) разметки визуальная функция может дополняться с помощью отдельных спецификаций, реализуемых иным средствами — об этом чуть ниже.
1.6 Идея языков разметки
Основная идея языков разметки состоит в том, что визуальное отображение документа должно автоматически получаться из логической разметки и не зависеть от его непосредственного содержания. Естественно, что это же актуально и в случае языков гипертекстовой разметки.
Таким образом реализуется упрощение автоматической обработки документа и его отображение в зависимости от окружения. Один и тот же файл может совершенно разным образом отображаться на экранах компьютера, мобильного телефона, в печати, так как свойства этих устройств вывода существенно различаются.
Однако это правило часто нарушается: например, создавая документ в редакторе наподобие MS Word, пользователь может выделять заголовки жирным шрифтом, но нигде не указывать, что эта строка является заголовком.
Также возможно изолировать разметку от содержания документа, используя указатели, метки, идентификаторы или другие методы координации. Такая «отделенная разметка» характерна для внутреннего представления программ, работающих с размеченными документами. Тем не менее, внедренная или «междустрочная» разметка более принята где бы то ни было.
1.7 Отношение к языкам программирования
Разумеется, что языки гипертекстовой разметки имеют все свойства, присущие языкам как знаковым системам, но их статус как языков программирования часто ставится исследователями и пользователями Всемирной паутины под вопрос.
Рассмотрим определение языков программирования — это совокупность однообразных, определенных и понятных исполнителю инструкций для последовательной их записи с целью исполнения неким устройством, являющимся частью вычислительной машины. Язык программирования также должен обладать следующими особенностям:
- ограниченное число заранее известных инструкций;
- заранее известные правила структуры инструкций;
- каждая конструкция языка должна однозначно соотносить то, что написано, с тем, что требовалось обозначить.
Из вышесказанного следует, что языки гипертекстовой разметки попадают под определение языков программирования, но не являются ими, так как их задача заключается в структурировании и формировании данных, а не обработке.
Также языки гипертекстовой разметки не являются Тьюринг-полными — на них можно совершить только некоторую ограниченную совокупность действий, интерпретируемых средствами вывода.
2. История развития
Даже в контексте данного исследования историю развития языков гипертекстовой разметки нельзя рассматривать самостоятельно, в отрыве от более общих понятий. Поэтому будет уместно рассмотреть истории развития гипертекста и языков разметки отдельно, а затем резюмировать их к объекту исследования.
2.1 История развития гипертекста
Как уже упоминалось ранее, гипертекст как явление появился задолго до Всемирной паутины.
Толкование Книги псалмов Гильберта Порретанского из Пуатье, датируемой, 1150 годом нашей эры, принято считать самой первой системой гипертекста. В другие места книги читателя отсылали специальные пометки на полях. Бумажный носитель, естественно, не позволял пользоваться такой системой с достаточным удобством.
Первая теория автоматизации процесса создания и удобного использования гипертекстовой системы принадлежит Ванневару Бушу, который представлял её в виде машины, оперирующей микрофотопленками. Эта машина, названная им «Мемексом», была описана им в 1945. Разумеется, ни о какой возможности перехода запроса от одного «Мемекса» к другому не было речи — машина была задумана в виде автономного письменного стола.
Сам термин «изобретён» Теодором Нельсоном в 1965 году, а через семь лет он же предложил систему визуализации «параллельных документов» — «Ксанаду», наглядно представлявшую ссылки и связи документов.
Билла Аткинсон был вдохновлен «Ксанаду» на создание программы «Гиперкард» — она служила основой для ряда современных систем гипертекста и определила главные инструменты навигации браузеров.
Множество основных идей и изобретений в области гипертекста так и остались нереализованными или неудачно сформированными в определяющих массовое представление о гипертексте современных браузерах. В целом, как и тысячу лет назад, составить хороший гиперссылочный аппарат всё ещё достаточно затруднительно, и, кроме скорости перемещения по ссылкам, мало что изменилось.
2.2 История развития языков разметки
Понятие «разметка», «markup» произошло от словосочетания «marking up» — «процесс помечивания, размечивания». Оно, в свою очередь, пришло из издательской практики проставлять специальные условные пометки в тексте и на полях рукописей и корректур перед сдачей их в печать.
Таким образом «markup men» — «разметчики» — указывали спецификацию переданной работы: стиль, гарнитуру, размер шрифта и так далее, указанные для каждой конкретной части текста. Сейчас разметкой текста занимаются корректоры, редакторы, графические, а также веб-дизайнеры и сами авторы.