Файл: Языки гипертекстовой разметки (Особенности языка разметки гипертекста HTML).pdf
Добавлен: 01.05.2023
Просмотров: 80
Скачиваний: 3
Поскольку документы относятся к известным типам, можно использовать специальную программу, называемую анализатором (parser), для того, чтобы обработать документ, утверждающий, что он относится к конкретному типу, и проверить, действительно ли все элементы, требуемые для данного типа документов, присутствуют и находятся в правильной последовательности. Что еще более важно, разные документы одного типа могут обрабатываться унифицированным образом. Можно писать более интеллектуальные программы, использующие знания, заключенные в информационной структуре документа.
- Независимость данных
Основная цель проектирования SGML была в создании гарантий того, что документ, закодированный согласно его положениям, будет переносимым с одной аппаратной и программной среды в другую без потери информации. Два его свойства, описанных выше, отвечают этому требованию на абстрактном уровне; третье свойство - на уровне строчек байтов (символов), которые составляют документ. SGML предоставляет обобщенный механизм строковой подстановки, то есть, простой машинно-независимый способ указания, что конкретная строка символов в документе в момент обработки документа должна заменяться на некоторую другую строку. Одно очевидное применение этому механизму - обеспечение единой терминологии; другое, и более значительное, - противодействие известной неспособности разных компьютерных систем понимать наборы символов друг друга, например, одной системе представлять все графические символы, необходимые приложению, путем описательного отображения непередаваемых символов. Строки, определяемые этим механизмом, называются сущностями (entities).
Преимущества:
Что дает использование SGML в реальной жизни? Возможность производить документы в любом требуемом виде. Все использованные программы - бесплатны и распространяются в исходных текстах, что позволит установить их на всех используемых системах.
Продуктивность:
Четко разделенные процессы ввода информации и ее форматирования позволяют автору сосредоточиться на изложении мыслей, не отвлекаясь на двигание текста по экрану и подбор стилей.
Единая стилистика:
Легко выдерживать различные документы в едином стиле, используя единую терминологию. Если стиль или термины нужно изменить, это делается разом во всех документах, не трогая их содержимое.
Повторное использование:
Часть документа, оформленная в виде SGML-элемента, может переноситься в другие документы, легко повторяться в разных местах текста.
Долговечность информации:
Из-за того, что SGML - простой и стандартный формат хранения данных, отсутствует необходимость переформатировать их ввиду устаревания аппаратной или программной платформы. Информация просто доступна навсегда. Она несет с собой все необходимое для создания документа.
Управление данными:
С SGML можно определять информационные элементы и манипуляции с ними с произвольной степенью детальности. Размеченные элементы могут иметь атрибуты, определяющие характеристики и свойства элементов. Эта информация не предназначена для печати, но может помочь в управлении элементами данных. Например, атрибут ID (идентификатор) может уникальным образом идентифицировать один абзац, или целый раздел, примечание, иллюстрацию, задание, - любой элемент, как в этом примере:
<para id=431>Информация</para>
Так как идентификаторы являются машинно-читаемыми, они могут связывать между собой информацию и использоваться для разнообразного управления ей. Например:
- Контролировать безопасность доступа к информации, позволяя только определенным людям просматривать или изменять ее.
- Автоматизировать перемещение информации - например, обновление данных в одном месте может инициировать обновление той же информации в других приложениях.
Разделяемость:
Возможность работы со структурированными компонентами документа позволяет строить целый документ из составных частей, разбросанных по организации. Это позволяет пользователям делиться информацией без ее дублирования.
Чтобы начать работать с документами в SGML пользователю нужны два основных средства: редактор и средства экспорта (форматирования).
SGML-редактор
SGML-редактор отличается как от привычных текстовых редакторов, так и от "word processor"-ов. От первых - наличием поддержки структурированных документов, от вторых - отсутствием поддержки визуального форматирования. Редактор разбирает DTD редактируемого документа и "ведет" пользователя в соответствии с ним. Например, если DTD предусматривает элемент <SECTION>, в котором могут встречаться только элементы <SUBSECTION> или <PARAGRAPH>, то пользователю, редактирующему элемент <SECTION>, будет предложено вставить один из этих двух разрешенных элементов. SGML-редактор также обычно содержит средства навигации по иерархии документ.
Из числа популярных SGML-редакторов можно назвать ArborText ADEPT*Editor, SoftQuad Author/Editor, psgml, Adobe FrameMaker+SGML, Corel WordPerfect, и множество других.
Средства форматирования
Существует множество средств работы с SGML текстами. Большую их часть составляют средства форматирования - экспорта SGML в другие форматы для печати, просмотра и т.п. Выходные форматы могут быть любыми, завися лишь от доступного программного обеспечения и нужд пользователя. Например, конвертеры в HTML, RTF и LATEX.
SGML-процессоры могут быть устроены по-разному. Существует несколько поколений таких средств (стоит вспомнить, что SGML отсчитывает уже второй десяток лет своей истории). Обычно они включают:
анализатор, разбирающий SGML документ, проверяющий корректность документа и строящий некоторое внутреннее представление иерархии элементов документа;
ядро, предоставляющее базовые функции работы с SGML (возможно, объединенное с анализатором в единую программу);
набор спецификаций, задающих ядру программы для конкретной обработки документа.
Синтаксический разбор SGML довольно сложен, поэтому полноценных анализаторов существует немного. Эталонным считается пакет SP.
Спецификации, или стили, пишутся на предлагаемом ядром языке программирования. Есть SGML-процессоры, программируемые на языках Perl, Tcl, диалектах Lisp, и т.п. Каждый процессор предлагает собственное представление иерархии документа и собственные примитивы работы с ним.
Такое положение призвано изменить принятый стандарт DSSSL (Document Style Semantics and Specification Language). Он специфицирует единый язык и интерфейсы SGML-процессоров. Используемый в нем язык программирования близок к популярному функциональному языку Scheme.
Используемые программы
В качестве SGML-редактора можно использовать XEmacs, включающий в комплект поставки SGML-модуль psgml. Ядром SGML-процессора выбрать CoST. Для форматирования в HTML, RTF и LATEX написан набор спецификаций на CoST. Использовать nsgmls, парсер из пакета SP. Управлению версиями помогает пакет контроля версий RCS.
Выбор DTD
При переходе к использованию технологии SGML встает вопрос выбора DTD. Обычно без проб и ошибок обойтись не удается. Можно пробовать "стандартные" DTD, широко используемые в индустрии, например, TEI Lite или DocBook. Можно создавать свои DTD, ориентированные на типичные документы, встречающиеся в повседневной работе. Переход между DTD ввиду использования SGML-процессоров обычно безболезнен, поэтому тут возможно длительное экспериментирование.
SGML и Web
Язык форматирования Web-страниц HTML изначально вводился как приложение SGML. Позже, с бурным развитием WWW, HTML начал всячески расширяться с целью дать автору больший контроль над внешним представлением информации. Новые элементы и атрибуты, такие как <FONT> или <BGCOLOR>, ориентировались на визуальное форматирование. Появились и стали активно использоваться средства, не входящие собственно в язык разметки: imagemaps, Java и JavaScript, plugins, и прочее. Много появилось также элементов HTML, поддерживаемых только определенным браузером, или по-разному работающих в разных браузерах. Поэтому сейчас уже сложно утверждать, является ли HTML приложением SGML или нет. Очень немногие страницы создаются в соответствии со спецификациями на HTML и соответствующими DTD.
Эту проблему отчасти призваны облегчить каскадируемые стили, стандарт на которые принят W3 консорциумом. CSS1 отделяет стиль, задающий визуальное представление элементов, от разметки элементов.
Публикация в SGML
Если документы делаются доступными через WWW, то их придется переводить в формат HTML. Это можно делать заранее, а можно - "на лету", используя CGI или аналогичный интерфейс WWW сервера.
3.2. Основные части документа SGML
SGML-декларация — определяет, какие символы и ограничители могут появляться в приложении;
Document Type Definition — определяет синтаксис конструкций разметки. DTD может включать дополнительные определения, такие, как символьные ссылки-мнемоники;
Спецификация семантики, относится к разметке — также даёт ограничения синтаксиса, которые не могут быть выражены внутри DTD;
Содержимое SGML-документа — по крайней мере, должен быть корневой элемент.
SGML предоставляет множество вариантов синтаксической разметки для использования различными приложениями. Изменяя SGML-декларацию, можно даже отказаться от использования угловых скобок, хотя этот синтаксис считается стандартным, так называемым concrete reference syntax.
Пример синтаксиса SGML:
<QUOTE TYPE="example">
typically something like <ITALICS>this</ITALICS>
</QUOTE>
SGML стандартизован ISO: «ISO 8879:1986 Information processing—Text and office systems—Standard Generalized Markup Language (SGML)»
HTML и XML произошли от SGML. HTML — это приложение SGML, а XML — это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML являются SGML Docbook (документирование) и «Z Format» (типография и документирование).
Заключение
В век цифровых технологий существует множество программ для создания web сайтов. Также, как и существуют различные языки разметки гипертекста.
В данной курсовой работе были рассмотрены такие языки разметки гипертекста, как SGML, XML, HTML. И выявлено, что HTML и XML произошли от SGML. HTML — это приложение SGML, а XML — это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. XML - Extensible Markup Language, то есть Расширяемый Язык Разметки, возник в результате развития языка HTML (HyperText Markup Language, языка разметки гипертекста). Однако было бы грубой ошибкой воспринимать его лишь как некую усовершенствованную версию языка HTML. По сути, язык XML представляет собой новое поколение языков разметки.
Были рассмотрены структуры написания страниц посредством разных языков. Сходства и различия представленных вариантов. И выявлено, что XML является более развитым языком разметки по сравнению с HTML. HTML применяется главным образом для представления содержания текстовых документов, a XML используется для структурирования данных.
XML — это не замена HTML. И это не просто HTML с дополнительными тегами, хотя описание XML гораздо больше по своему объему, нежели описание HTML. Несмотря на то, что HTML является приложением SGML, a XML является подмножеством SGML, HTML и XML имеют существенные различия. В частности, XML позволяет создавать собственные теги для различных целей. Кроме того, различия более ощутимы, если принять во внимание те проблемы, для решения которых применяется XML. Можно сказать, что XML представляется решением обычных проблем, вызванных применением HTML. При помощи XML достигается:
Лучший контроль над размещением информации.
Меньшая загрузка Web-сервера благодаря возможностям по доступу к информации на клиентской стороне.
Применение различных типов гиперссылок (hyperlinks).
Возможность распространения различных видов информации в Internet и intranet.
Меньшее количество проблем, возникающих при отображении больших страниц (long pages).
Тем не менее, несмотря на то что XML считается более «качественным» языком, HTML уверенно удерживает первое место по популярности.
Знания, полученные мною при написании данной курсовой работы, пригодятся мне в будущем на работе, мне следует ещё многое изучить, чтобы стать профессионалом в данном деле, но я буду и дальше изучать web-разработку на обозначенных языках и совершенствоваться как специалист.
Список использованной литературы:
- Сухов К. HTML5 – путеводитель по технологии. – М.: ДМК Пресс, 2013. – 352 с.
- Дженнифер Нидерст Роббинс HTML5, CSS3 и JavaScript. Исчерпывающее руководство. 4-ое издание 2014г, 516 с.
- Робсон Э., Фримен Э. Изучаем HTML, XHTML и CSS. 2-е изд. — СПб.: Питер, 2014. — 720 с.
- Олифер В. Г., Олифер Н.А. Компьютерные сети. СПб.: Питер, 2005 - 864 с.
- Кох Дж., Дэвидсон К. XML. Огромные возможности и легкость изучения, 2007г, 256 с.
- Учебник PHP - "Для Чайника" URL: http://project.net.ru/web-master/php/article1/ (Дата обращения 25.03.2019)
- Что такое HTML и краткая история HTML URL: http://netagent.chat.ru/html/ul1.html (Дата обращения 15.03.19).
- Иллюстрированный самоучитель по созданию сайтов URL: http://project.net.ru/others/article3/ (Дата обращения 15.04.2019)
- Учебник по Проекту Документирования FreeBSD для новых участников URL: http://www.ntwk.ru/docs/freebsd/fdp-primer/sgml-primer.html (Дата обращения 12.04.2019)
- Коротко об HTML 5.2 URL: https://habr.com/ru/post/345388/ (Дата обращения 28. 04. 2019)
- World Wide Web Consortium URL: https://www.w3.org/TR/html52/changes.html#new-features (Дата обращения 06.04.2019)
- Basic Web Page Building(Создание базовой веб-страницы) - URL: https://www.arachnoid.com/arachnophilia/Documentation/BasicWebPageBuilding.html (Дата обращения 24.04.19).