Файл: Языки гипертекстовой разметки(Об истории языков гипертекстовой разметки ).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 19.06.2023

Просмотров: 47

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Содержание

Содержание 1

Введение 2

Глава 1. Об истории языков гипертекстовой разметки 

SGML 5

HTML 8

XML 10

Глава 2 Сравнение HTML и XML – что лучше 13

Возможности HTML 13

Теги управления абзацами 16

Теги управления переносом 16

Теги выделения структуры документа 17

Теги смыслового выделения текста 17

Теги стилистического выделения текста 18

Дополнительные теги форматирования 19

Использование шрифтов в документах 19

Вставка изображений в документ 22

Возможности XML: 23

Лучший контроль над размещением информации 23

Независимость от сервера 24

Лучший контроль над большими документами 24

Как выглядит XML-документ 25

Применение множественных гиперссылок 27

Типы документов XML 29

Правильные документы 30

Действительные документы 31

Сравнение XML и HTML 32

Заключение 34

Список используемых источников 35

Введение

В 80-е годы прошлого века термин «гипертекст» в филологическом смысле употреблял известный структуралист-нарратолог Жерар Женетт в своей книге «Палимпсесты»[1] , рассуждая о различных видах интертекстуальных связей. Жерар Женнет разработал практическую модель исследования межтекстовых отношений, уделяя основное внимание не частным текстуальным связям, а произведению как целостной структуре. Он предложил собственную классификацию разных типов взаимодействия текстов. Однако термин «гипертекст» в рамках концепции Женетта имел более узкое значение, чем в компьютерных разработках, где он становится ключевым словом.

Существует множество определений гипертекста. Самое простое из них можно найти почти в любом руководстве по веб-дизайну: Гипертекст — это текст, связанный ссылками с другими текстами.

Тед Нельсон определял гипертекст следующим образом: «Под гипертекстом я понимаю не последовательное сочинение (non-sequential writing) а текст, который разветвляется и позволяет читателю выбирать <…>. Проще говоря, это ряд кусков текста (a series of text chunks), соединенных линками, предлагающими читателю различные пути« .[2]


Словарь культуры XX века В.Руднева дает следующее определение гипертекста: Гипертекст — текст, устроенный таким образом, что он превращается в систему, иерархию текстов, одновременно составляя единство и множество текстов. [3]

Для полноты картины приведем и другие достаточно типичные дефиниции гипертекста собранные из разных источников.

1. Гипертекст — это соединение смысловой структуры, структуры внутренних связей некоего содержания, и технической среды, технических средств, дающих возможность человеку осваивать структуру смысловых связей, осуществлять переходы между взаимосвязанными элементами [4].

2. Механизм, заключающийся в возможности связать отрывки текста, переходить от одного к другому, называется гипертекстом или нелинейным текстом [5].

3. Надтекст, некая единица информации, частями которой являются тексты и/или текст, части которого имеют «сверхсвязи», то есть соединены друг с другом не линейным отношением в одномерном пространстве (отношением следования как в обычном тексте естественного языка), а множеством различных отношений, представляемых в многомерном пространстве. В гипертексте отсутствуют заранее заданные ограничения на характер связей (сеть) [6].

4. Гипертекст можно определить как нелинейную документацию, которая ветвится и взаимосвязывается, позволяя читателю исследовать содержащуюся в ней информацию в последовательности, которую он сам выбирает. Гипертекст позволяет связывать текст, аудио, фотографии, чертежи, карты, движущиеся картинки и другие формы информации в осмысленное целое, доступ к которому может осуществляться при помощи системы индексации, ориентированной на конкретные идеи, а не на конкретные слова в тексте [7].

5. Гипертекст — это текст, организованный таким образом, что из некоторых его элементов возможен алеаторический (по выбору читателя) переход сразу на несколько других элементов либо возможны ссылки на другие элементы этого же текста или других текстов[8].

6. Гипертекст — это представление информации как связанной (linked) сети гнезд (nodes), в которых читатели свободны прокладывать путь (navigate) нелинейным образом. Он допускает возможность множественности авторов, размывание функций автора и читателя, расширение работы с нечеткими границами и множественность путей чтения» [9].

Почти о том же писал и Р.Барт:

«…текст пронизан сетью бесчисленных, переплетающихся между собой внутренних ходов, не имеющих друг над другом власти; он являет собой галактику означающих, а не структуру означаемых; у него нет начала, он обратим; в него можно вступить через множество входов, ни один из которых нельзя признать главным; вереница мобилизуемых им кодов теряется где-то в бесконечной дали, они «неразрешимы» (их смысл не подчинен принципу разрешимости, так что любое решение будет случайным, как при броске игральных костей); этим сугубо множественным текстом способны завладеть различные смысловые системы, однако их круг не замкнут, ибо мера таких систем — бесконечность самого языка« [10].


Глава 1. Об истории языков гипертекстовой разметки

Изначально слово разметка, как правило, использовалось для описаний аннотаций или других обозначений внутри текста, которые предназначались для указаний составителю документа или, как его иногда называют, "верстальщику" того, как именно конкретное место должно быть напечатано. Подобные способы могут включать в себя подчеркивание волнистой чертой, обозначающее курсив, какие-либо специальные значки для пропуска отдельных фраз или их печати конкретным шрифтом, и так далее. Когда с течением времени форматирование и печать стали автоматизированными, этот термин уже охватывал все виды специальных кодов разметки, которые вставлялись в электронные текстовые документы для управления форматированием, печатью либо другой обработкой.

Под языком разметки, таким образом, понимают набор соглашений о принципах форматирования, которые применяются для кодирования текстовых блоков. Язык разметки должен четко обозначать, какая разметка допустима именно в данном документе, какая разметка обязательна, как отличить ее элементы от простого текста и что разметка значит.

SGML

SGML (Standard Generalized Markup Language) был официально принят в 1986 году в качестве международного стандарта (ISO 8879:1986) для описания независимых от устройств ввода/вывода и от вычислительной среды методов представления текстовой информации в электронной форме. Основой для его создания послужил довольно старый язык разметки GML(Generalized Markup Language), разработанный компанией IBM еще во времена первых персональных копьютеров. Если быть точным, то SGML - это метаязык, предназначенный для описания других языков разметки.

Язык SGML - это типичное детище академической науки, изящная игрушка теоретиков. Его создание не было вызвано насущной практической необходимостью. Принципы, на которых строится этот язык, значительны и интересны; несомненно, идеология SGML оказала влияние на многие компьютерные разработки.

Однако сам по себе SGML не получил сколько-нибудь заметного распространения - до тех пор, пока в 1991 г. сотрудники Европейского института физики частиц (CERN), занятые созданием системы передачи гипертекстовой информации через Интернет, не выбрали SGML в качестве основы для нового языка разметки гипертекстовых документов. Этот язык - самое известное из приложений SGML - был назван HTML (HyperText Markup Language, "язык разметки гипертекста").

Цель появления SGML очень проста. В то время существовало несколько "языков разметки", ни один из которых не был совместим с несколькими платформами или даже программными пакетами. Появление SGML сделало возможным унификацию языков разметки, что было использовано для обеспечения гибкости и возможности передачи информации между приложениями и платформами.


SGML, в отличие от всех других языков разметки, созданных на его основе, использует принцип так называемой описательной разметки вместо процедурной. Подобная система использует элементы разметки, которые попросту предоставляют названия для отнесения отдельных частей документа к определенным категориям. Другими словами, тэги, такие как <para> или \end{list}, просто идентифицируют порцию документа и утверждают, что "эта часть является параграфом" или что "эта часть является концом начатого списка", и т.п. Система же, использующая процедурную разметку (сюда попадают текстовые процессоры, например, Microsoft Word) определяет, какая непосредственно обработка будет выполняться в конкретной точке текстового документа: "в этом месте вызвать такую-то процедуру с параметрами 5, е и z" или "передвинуть границу документа на 7 мм правее относительно какого-либо элемента, пропустить одну строку начать следующую с красной строки" и т.д. В SGML инструкции, которые необходимы для обработки документа с определенной конкретной целью (например, для форматирования), четко отделяются от описательной разметки, которая встречается внутри документа. Обычно они собраны вне документа в отдельных процедурах или программах.

При использовании описательной, а не процедурной разметки один и тот же документ может быть обработан разными программами, каждая из которых может применять свои собственные инструкции обработки к тем его частям, которые она считает важными. Например, программа анализа содержимого может полностью игнорировать сноски, тогда как программа форматирования может извлекать и собирать их для печати в конце каждой части. Различные виды инструкций обработки могут ассоциироваться с одной и той же частью файла. Например, одна программа может извлекать из документа фамилии людей и географические названия для создания индекса или базы данных, тогда как другая, обрабатывающая тот же самый текст, может печатать фамилии и названия отличающимся шрифтом.

SGML вводит также понятие типа документа, и, соответственно, способы его определения (document type definition, DTD). Документы считаются типизированными, так же как и другие обрабатываемые компьютерами объекты. Тип документа формально определяется его составными частями и их структурой. Скажем, можно определить тип документа таким образом, что он должен состоять из заголовка и, возможно, имени автора, за которыми следует аннотация и последовательность одного или более абзацев. Любой документ в отсутствие заголовка, в соответствии с этим формальным определением, не будет являться отчетом, так же как не будет им являться и последовательность абзацев, за которой следует аннотация, невзирая на то, насколько похож на отчет такой документ с точки зрения читателя-человека.


Поскольку документы относятся к известным типам, можно использовать специальную программу, называемую анализатором (parser), для того чтобы обработать документ, утверждающий, что он относится к конкретному типу, и проверить, действительно ли все элементы, требуемые для данного типа документов, присутствуют и находятся в правильной последовательности и корректно структурированы. Что еще более важно, разные документы одного типа могут обрабатываться унифицированным образом. Можно писать программы, использующие знания, заключенные в информационной структуре документа, которые, таким образом, могут быть более интеллектуальными.

SGML, как метаязык, позволяет определять конкретные языки (часто называемые "приложениями SGML"), ориентированные на конкретное применение. Пример тому - язык HTML, широко использующийся на WWW. Каждый такой язык описывается в виде DTD, определяя элементы и их атрибуты. Получив такой DTD, программное обеспечение для работы с SGML может корректно обрабатывать документы, написанные в соответствии с этим DTD.

HTML

Язык HTML был разработан британским учёным Тимом Бернерсом-Ли приблизительно в 1991--1992 годах в стенах Европейского совета по ядерным исследованиям в Женеве (Швейцария). HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. HTML успешно справлялся с проблемой сложности SGML путём определения небольшого набора структурных и семантических элементов (размечаемых «тегами»), служащих для создания относительно простых, но красиво оформленных документов. Помимо упрощения структуры документа, в HTML внесена поддержка гипертекста. Мультимедийные возможности были добавлены позже. Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на оборудовании с различной технической оснащенностью (цветной экран современного компьютера, монохромный экран органайзера, ограниченный по размерам экран мобильного телефона или устройства и программы голосового воспроизведения текстов). Однако, современное применение HTML очень далеко от его изначальной задачи. Например, тег <TABLE>, использованный для форматирования страницы, предназначен для создания в документах самых обычных таблиц, но, как можно убедиться, здесь нет ни одной таблицы.