Файл: Языки гипертекстовой разметки документов (Понятие гипертекста).pdf
Добавлен: 01.05.2023
Просмотров: 142
Скачиваний: 3
Глобальная . Это графическое полной из узлов и . Ввиду с отображением числа , такие мало для реальных объемом сотни . Больше с ними разработчики (Янкелович, , ван Дам). и глобальные в реальных системах "графическими ".[13]
(бэктрекинг). узлы и текущего сохраняются и возможность в предыдущие .[13]
(проложенные ). Это хранящиеся , которые проходить по . Подобное при создании учебников или . Для больших значение возрастает.
Поиск (в гипертекстовых ). Используются все в области поиска: запросы, кий поиск, запросов и др.
Фильтры. Это ограничения навигации задаваемого подмножества и связей. подмножества видами () и могут сохранены для повторного .[13]
. Список слов, или узлов, по алфавиту, , автору, и т. д. Индексы автором и тот недостаток, что не учитывают зрения на то, как он хочет гипертекст.
Закладки. может (пометить) текущую , чтобы к ней позже.
Для больших и гипертекстовых растет использовать , интеллектуальную в навигации.
В – об одном подходе, отечественным и направленном на проблемы в гипертексте.
В подходе и система в сети навигацию, , что навигационная должна подобна дискурсу (, предложения вместе смысловое ). Это означает, что локальной между узлов в должна и некая связность, разворачиванию темы, начальным тропы.[5]
когерентная , конечно, не всегда. , человек, навигацию в , может перемещаться по в надежде на интересные , получить на какой-то вопрос, найденные рассматриваются по , вне контекста.[6]
есть и виды активности при с гипертекстом, где навигация . Это – браузинг по тематике, или какого-то по материалу, в сети, или же чернового документа из сети.[6]
навигация в системе – российской . В этой локальные по связям в тропе-трейле под так называемым , следящем за (тематической) . Этот базируется на подтем дискурса.
реализована в интерактивного , которое в тропу-дискурс.
разработки опираются на таких психолого-лингвистов, как ван , Кинч и . Результаты представлены в на гипертекстовой международной "Восток-Запад" '93.
Глава 2. Языки разметки
популярный на день гипертекстовой HTML, был специально для информации, в сети , и явля одной из составляющих WWW. С использованием модели способ разнообразных ресурсов в стал упорядочен, а получили механизм и просмотра информации.
HTML( Markup ) - язык гипертекстовой , который в время в World Web. Изначально как язык для научной и документацией. языка занимается W3C ( Consortium).
HTML является версией общего разметки - (Standart Markup ), который был ISO в качестве а еще в 80-х . Этот предназначен для других разметки, он допустимый тэгов, их и внутреннюю документа. за правильностью дескрипторов при помощи набора , называемых , которые программой при разборе . Для каждого документов свой правил, грамматику языка . С помощью можно структурированные , организовывать , содержащуюся в , представлять эту в некотором формате. Но в некоторой сложности, использовался, в , для описания других (наиболее из которых HTML), и приложения с SGML- напрямую.
2.1 SGML
— метаязык, на котором определять язык разметки для . SGML — разработанного в году в IBM GML (Generalized Language).
Изначально был разработан для использования машинно-читаемых документов в правительственных и проектах. Он использовался в и издательской , но его сложность его широкое для повседневного .
Основные документа : [16]
- SGML-декларация — , какие и ограничители появляться в ;
- Document Type Definition — определяет синтаксис разметки. DTD включать определения, , как символьные ;
- Спецификация , относится к — также ограничения , которые не быть внутри DTD;
- SGML-документа — по мере, быть элемент.
SGML множество синтаксической для использования приложениями. SGML-декларацию, даже от использования скобок, этот считается , так называемым reference .
Пример SGML:
<quote ">
typically like <>this</>
</quote>
стандартизован ISO: « 8879:1986 processing—Text and systems—Standard Markup (SGML)».
HTML и XML произошли от . HTML — это SGML, а — это подмножество , разработанное для процесса разбора . Другими SGML SGML Docbook (документирование) и «Z » (типография и ).
2.1.1 Описательная
Система разметки коды , просто названия для частей . Коды, , как <para> или \} просто часть и утверждают про нее: " элемент - " или "это - начатого списка" и т.д. , система разметки , какая должна в конкретной документа: " вызвать PARA с 1, b и x", или "сдвинуть границу на 2см , правую -- на 2см , пропустить и встать на левую ", и т.д. В SGML , необходимые для документа с целями (, для его форматирования) отделяются от разметки, внутри . Обычно они вне документа в процедурах или .
При описательной, а не , разметке и тот же документ обрабатывать программами, из которых применять правила к тем частям , которые она важными. , программа содержимого совершенно сноски в тексте, как программа может и собирать их для печати в каждой . С одними и же частями могут разные обработки. , одна может имена и географические для создания или базы , а другая, тем же текстом, печатать собственные отличающегося .
2.1.2 Типы
SGML понятие документа и, как , определения документа ( type , DTD). Тип документа определяется его частями и их . Например, отчета констатировать, что он из заголовка, , автора, за следуют и один или абзацев. Все, что не заголовка, в с этим определением, не является, так же, как не им последовательность , за которой аннотация, вне от того, такие похожи на для читателя-человека.
Раз имеют типы, использовать программу, анализатором (), для проверки , утверждающего принадлежность типу. проверяет, что все , требуемые документа, на деле и расположены в порядке. Что важно, документы и того же могут одинаковым . Можно программы, знание документа, , таким , могут в более манере.
2.1.3 Данные
цель SGML в том, чтобы транспортабельность документов из аппаратной и среды в без потери . Два описанных свойства эту задачу на уровне; свойство -- на строк (символов), из составляется . SGML универсальный строковой (string ), то есть, машинно-независимый обозначить, что последовательность в документе заменяться при его некоторой последовательностью. очевидное этого -- обеспечение номенклатуры; , и более , -- противодействие известной различных систем наборы друг , или способ в системе все графические , необходимые для приложения, использования обозначений символов. , определенные механизмом , называются (entities). В слово (entity) специальный : оно означает часть документа, ко всяческим структуры. может строка или целый текста. Для его в документ конструкция, как ссылка на (entity ).
2.1.4. SGML
Этот описывает и согласованный разметки или структурных текста, SGML. Он описывает, способы предлагает для правил, возможные комбинации единиц в текстах.
В стандарте для текстовых , рассматриваемых как компоненты, термин (element). типам даются названия, но не предлагает способов значение типа , кроме его к другим элементов. То , все, что можно про элемент, (например) <>, -- это то, что его экземпляры встречаться (а и не встречаться) элементов <farble>, и что он раскладываться (а и не раскладываться) на типа <>. Следует , что стандарт совершенно не семантика элементов: она от приложения (В момент работа по (с использованием SGML) стандартного"я семантики и стилей (document and semantics language, )".) Дело SGML-совместимых разметок (, как описанный в Руководство) -- осмысленные идентификаторов и документировать их использование в текстов. Это -- из целей документа. От выбора элементов, их функцию, технический для названия элемента: идентификатор ( identifier), или GI.
В размеченном (экземпляре , document ) каждый должен явно или отмечен образом. предоставляет разных это сделать, часто из них -- вставить (tag) в начале (открывающая , start-tag) и еще -- в конце (закрывающая , end-tag). открывающей и меток для выделения в тексте, так же, как скобки или используются в пунктуации. , элемент может отмечен в так: [16]
слышала!</quote> ясно показывает ...
Как данный , открывающая имеет вид <>, где открывающая скобка начало метки, "" -- идентификатор элемента, и угловая означает метки. метка аналогичный вид, за того, что за угловой стоит косой , так что соответствующая метка </название>. (На деле , используемые в ограничителей ( скобки, черта, знак) переопределяться, но использовать , приведенные в описании.)
Элемент быть (empty), то , не содержать вообще ; элемент содержать текст. , однако, одного будут содержаться () внутри другого . [16]
использования , устанавливающих, элементы быть в другие, очень свойством . Не переходя к разбору правил, попытаться , как размеченный образом может обработан с целями. индексирующая может только элементы для генерации заголовков, или , использованных в стихотворения; программа может пустые между , возможно, с красной первую каждой , или вставляя строфы. части стихотворения набираться способами. сложная программа соотносить знаков со строфовыми и разделами. , желающие следствия разделов или строк, редактором стихотворения, это сделать меняя меток. И, , представленный текст быть с одного на другой и любой (или ), понимающей внесенных в меток, всяких и трансляций, обычно для файлов процессоров.
Правила вышеописанных -- шаг в создании спецификации SGML или определения документа, сокращаемого как DTD. При DTD дизайнер может произвольно или сколь гибкую . Нужно компромисс удобством простым и сложностью реальных . Это особенно , когда правила к уже существующим : дизайнер иметь туманное об изначальном или смысле текстов, и непротиворечивых , касающихся их , может очень . С другой , когда новый , например, для в некоторую базу , то чем точнее правила, тем они могут выдержаны. в случае уже существующего может смысл ограничивающий правил, к определенному текста или , касающейся , -- хотя бы как проверки этого или гипотезы. помнить, что определение документа интерпретацией . Не существует DTD, охватывающего все о тексте, может удобно одни DTD для конкретных анализа.
В настоящее SGML всего там, где основным является структуры . Например, при технической весьма , чтобы и подразделы соответствующим вложены, перекрестные были , и так далее. В ситуациях к относятся как с материалу, к применяется определенный правил. , как говорилось , использование правил также упростить аккуратной элементов и ограниченных . Делая правила , исследователь свою по разметке и электронного , в то же время интерпретацию и значимые кодируемого . [16]
часть задает минимизации для . Эти правила , обязаны ли открывающая и метки для появления элемента. Они вид пары , разделенных , первый из относится к , а второй -- к метке. В случаях присутствовать или или буква O; означает, что должна , а буква -- что она может опущена. Так, в примере элемент, <line>, иметь метку. элементы <> и <anthology> также и закрывающую . [16]
часть описания, в круглые , называется содержимого , потому что она , что могут экземпляры . Содержимое либо в других , либо при специальных слов. несколько зарезервированных , из которых часто -- #PCDATA. Это от parsed data( символьные ), и оно означает, что элемент включать разрешенные данные. представить SGML в виде наподобие дерева, с предком (в нашем , это будет <>), то почти , если по ветвям вниз (, от <anthology> к <>, <stanza>, <> или <title>), мы к #PCDATA. В примере так <title> и <>. Так как в их модели указано #PCDATA и не никаких элементов, то они не содержать элементы.
Вышеприведенное для <stanza> , что строфа из одной или строк. Оно обозначение (occurence ) -- плюс -- для того, раз может элемент, в модели . В синтаксисе есть три включения, представленных плюс, знаком и . (Так же, как и , эти знаки формальные и могут переопределены SGML .) Знак означает, что элемент встречаться или более раз; знак , что может не более элемента; означает, что может или , или появляться и более раз. Так, бы модель для <stanza> (LINE*), бы допустимы без строк, так же, как и с чем одной . Если бы она (LINE?), то строфы бы тоже , но ни одна не могла бы более чем строку. <poem> в устанавливает, что <> не может больше заголовка (но не иметь ни ) и что оно должно как минимум <stanza> (и иметь ). [16]