Файл: Языки гипертекстовой разметки документов (Понятие гипертекста).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 01.05.2023

Просмотров: 147

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Глобальная . Это графическое полной из узлов и . Ввиду с отображением числа , такие мало для реальных объемом сотни . Больше с ними разработчики (Янкелович, , ван Дам). и глобальные в реальных системах "графическими ".[13]

(бэктрекинг). узлы и текущего сохраняются и возможность в предыдущие .[13]

(проложенные ). Это хранящиеся , которые проходить по . Подобное при создании учебников или . Для больших значение возрастает.

Поиск (в гипертекстовых ). Используются все в области поиска: запросы, кий поиск, запросов и др.

Фильтры. Это ограничения навигации задаваемого подмножества и связей. подмножества видами () и могут сохранены для повторного .[13]

. Список слов, или узлов, по алфавиту, , автору, и т. д. Индексы автором и тот недостаток, что не учитывают зрения на то, как он хочет гипертекст.

Закладки. может (пометить) текущую , чтобы к ней позже.

Для больших и гипертекстовых растет использовать , интеллектуальную в навигации.

В – об одном подходе, отечественным и направленном на проблемы в гипертексте.

В подходе и система в сети навигацию, , что навигационная должна подобна дискурсу (, предложения вместе смысловое ). Это означает, что локальной между узлов в должна и некая связность, разворачиванию темы, начальным тропы.[5]

когерентная , конечно, не всегда. , человек, навигацию в , может перемещаться по в надежде на интересные , получить на какой-то вопрос, найденные рассматриваются по , вне контекста.[6]

есть и виды активности при с гипертекстом, где навигация . Это – браузинг по тематике, или какого-то по материалу, в сети, или же чернового документа из сети.[6]

навигация в системе – российской . В этой локальные по связям в тропе-трейле под так называемым , следящем за (тематической) . Этот базируется на подтем дискурса.

реализована в интерактивного , которое в тропу-дискурс.

разработки опираются на таких психолого-лингвистов, как ван , Кинч и . Результаты представлены в на гипертекстовой международной "Восток-Запад" '93.

Глава 2. Языки разметки

популярный на день гипертекстовой HTML, был специально для информации, в сети , и явля одной из составляющих WWW. С использованием модели способ разнообразных ресурсов в стал упорядочен, а получили механизм и просмотра информации.

HTML( Markup ) - язык гипертекстовой , который в время в World Web. Изначально как язык для научной и документацией. языка занимается W3C ( Consortium).


HTML является версией общего разметки - (Standart Markup ), который был ISO в качестве а еще в 80-х . Этот предназначен для других разметки, он допустимый тэгов, их и внутреннюю документа. за правильностью дескрипторов при помощи набора , называемых , которые программой при разборе . Для каждого документов свой правил, грамматику языка . С помощью можно структурированные , организовывать , содержащуюся в , представлять эту в некотором формате. Но в некоторой сложности, использовался, в , для описания других (наиболее из которых HTML), и приложения с SGML- напрямую.

2.1 SGML

— метаязык, на котором определять язык разметки для . SGML — разработанного в году в IBM GML (Generalized Language).

Изначально был разработан для использования машинно-читаемых документов в правительственных и проектах. Он использовался в и издательской , но его сложность его широкое для повседневного .

Основные документа : [16]

  1. SGML-декларация — , какие и ограничители появляться в ;
  2. Document Type Definition — определяет синтаксис разметки. DTD включать определения, , как символьные ;
  3. Спецификация , относится к  — также ограничения , которые не быть внутри DTD;
  4. SGML-документа — по мере, быть элемент.

SGML множество синтаксической для использования приложениями. SGML-декларацию, даже от использования скобок, этот считается , так называемым reference .

Пример SGML:

<quote ">

typically like <>this</>

</quote>

стандартизован ISO: « 8879:1986 processing—Text and systems—Standard Markup (SGML)».

HTML и XML произошли от . HTML — это SGML, а  — это подмножество , разработанное для процесса разбора . Другими SGML SGML Docbook (документирование) и «Z » (типография и ).

2.1.1 Описательная

Система разметки коды , просто названия для частей . Коды, , как <para> или \} просто часть и утверждают про нее: " элемент - " или "это - начатого списка" и т.д. , система разметки , какая должна в конкретной документа: " вызвать PARA с 1, b и x", или "сдвинуть границу на 2см , правую -- на 2см , пропустить и встать на левую ", и т.д. В SGML , необходимые для документа с целями (, для его форматирования) отделяются от разметки, внутри . Обычно они вне документа в процедурах или .

При описательной, а не , разметке и тот же документ обрабатывать программами, из которых применять правила к тем частям , которые она важными. , программа содержимого совершенно сноски в тексте, как программа может и собирать их для печати в каждой . С одними и же частями могут разные обработки. , одна может имена и географические для создания или базы , а другая, тем же текстом, печатать собственные отличающегося .


2.1.2 Типы

SGML понятие документа и, как , определения документа ( type , DTD). Тип документа определяется его частями и их . Например, отчета констатировать, что он из заголовка, , автора, за следуют и один или абзацев. Все, что не заголовка, в с этим определением, не является, так же, как не им последовательность , за которой аннотация, вне от того, такие похожи на для читателя-человека.

Раз имеют типы, использовать программу, анализатором (), для проверки , утверждающего принадлежность типу. проверяет, что все , требуемые документа, на деле и расположены в порядке. Что важно, документы и того же могут одинаковым . Можно программы, знание документа, , таким , могут в более манере.

2.1.3 Данные

цель SGML в том, чтобы транспортабельность документов из аппаратной и среды в без потери . Два описанных свойства эту задачу на уровне; свойство -- на строк (символов), из составляется . SGML универсальный строковой (string ), то есть, машинно-независимый обозначить, что последовательность в документе заменяться при его некоторой последовательностью. очевидное этого  -- обеспечение номенклатуры; , и более , -- противодействие известной различных систем наборы друг , или способ в системе все графические , необходимые для приложения, использования обозначений символов. , определенные механизмом , называются (entities). В слово (entity) специальный : оно означает часть документа, ко всяческим структуры. может строка или целый текста. Для его в документ конструкция, как ссылка на (entity ).

2.1.4. SGML

Этот описывает и согласованный разметки или структурных текста, SGML. Он описывает, способы предлагает для правил, возможные комбинации единиц в текстах.

В стандарте для текстовых , рассматриваемых как компоненты, термин (element). типам даются названия, но не предлагает способов значение типа , кроме его к другим элементов. То , все, что можно про элемент, (например) <>, -- это то, что его экземпляры встречаться (а и не встречаться) элементов <farble>, и что он раскладываться (а и не раскладываться) на типа <>. Следует , что стандарт совершенно не семантика элементов: она от приложения (В момент работа по (с использованием SGML) стандартного"я семантики и стилей (document and semantics language, )".) Дело SGML-совместимых разметок (, как описанный в Руководство) -- осмысленные идентификаторов и документировать их использование в текстов. Это -- из целей документа. От выбора элементов, их функцию, технический для названия элемента: идентификатор ( identifier), или GI.


В размеченном (экземпляре , document ) каждый должен явно или отмечен образом. предоставляет разных это сделать, часто из них -- вставить (tag) в начале (открывающая , start-tag) и еще  -- в конце (закрывающая , end-tag). открывающей и меток для выделения в тексте, так же, как скобки или используются в пунктуации. , элемент может отмечен в так: [16]

слышала!</quote> ясно показывает ...

Как данный , открывающая имеет вид <>, где открывающая скобка начало метки, "" -- идентификатор элемента, и угловая означает метки. метка аналогичный вид, за того, что за угловой стоит косой , так что соответствующая метка </название>. (На деле , используемые в ограничителей ( скобки, черта, знак) переопределяться, но использовать , приведенные в описании.)

Модели элемента:

Элемент быть (empty), то , не содержать вообще ; элемент содержать текст. , однако, одного будут содержаться () внутри другого . [16]

использования , устанавливающих, элементы быть в другие, очень свойством . Не переходя к разбору правил, попытаться , как размеченный образом может обработан с целями. индексирующая может только элементы для генерации заголовков, или , использованных в стихотворения; программа может пустые между , возможно, с красной первую каждой , или вставляя строфы. части стихотворения набираться способами. сложная программа соотносить знаков со строфовыми и разделами. , желающие следствия разделов или строк, редактором стихотворения, это сделать меняя меток. И, , представленный текст быть с одного на другой и любой (или ), понимающей внесенных в меток, всяких и трансляций, обычно для файлов процессоров.

Определение документов : DTD

Правила вышеописанных -- шаг в создании спецификации SGML или определения документа, сокращаемого как DTD. При DTD дизайнер может произвольно или сколь гибкую . Нужно компромисс удобством простым и сложностью реальных . Это особенно , когда правила к уже существующим : дизайнер иметь туманное об изначальном или смысле текстов, и непротиворечивых , касающихся их , может очень . С другой , когда новый , например, для в некоторую базу , то чем точнее правила, тем они могут выдержаны. в случае уже существующего может смысл ограничивающий правил, к определенному текста или , касающейся , -- хотя бы как проверки этого или гипотезы. помнить, что определение документа интерпретацией . Не существует DTD, охватывающего все о тексте, может удобно одни DTD для конкретных анализа.


В настоящее SGML всего там, где основным является структуры . Например, при технической весьма , чтобы и подразделы соответствующим вложены, перекрестные были , и так далее. В ситуациях к относятся как с материалу, к применяется определенный правил. , как говорилось , использование правил также упростить аккуратной элементов и ограниченных . Делая правила , исследователь свою по разметке и электронного , в то же время интерпретацию и значимые кодируемого . [16]

минимизации

часть задает минимизации для . Эти правила , обязаны ли открывающая и метки для появления элемента. Они вид пары , разделенных , первый из относится к , а второй -- к метке. В случаях присутствовать или или буква O; означает, что должна , а буква  -- что она может опущена. Так, в примере элемент, <line>, иметь метку. элементы <> и <anthology> также и закрывающую . [16]

содержимого

часть описания, в круглые , называется содержимого , потому что она , что могут экземпляры . Содержимое либо в других , либо при специальных слов. несколько зарезервированных , из которых часто  -- #PCDATA. Это от parsed data( символьные ), и оно означает, что элемент включать разрешенные данные. представить SGML в виде наподобие дерева, с предком (в нашем , это будет <>), то почти , если по ветвям вниз (, от <anthology> к <>, <stanza>, <> или <title>), мы к #PCDATA. В примере так <title> и <>. Так как в их модели указано #PCDATA и не никаких элементов, то они не содержать элементы.

Обозначения

Вышеприведенное для <stanza> , что строфа из одной или строк. Оно обозначение (occurence ) -- плюс -- для того, раз может элемент, в модели . В синтаксисе есть три включения, представленных плюс, знаком и . (Так же, как и , эти знаки формальные и могут переопределены SGML .) Знак означает, что элемент встречаться или более раз; знак , что может не более элемента; означает, что может или , или появляться и более раз. Так, бы модель для <stanza> (LINE*), бы допустимы без строк, так же, как и с чем одной . Если бы она (LINE?), то строфы бы тоже , но ни одна не могла бы более чем строку. <poem> в устанавливает, что <> не может больше заголовка (но не иметь ни ) и что оно должно как минимум <stanza> (и иметь ). [16]