Файл: Языки гипертекстовой разметки (История развития языков гипертекстовой разметки ).pdf
Добавлен: 27.06.2023
Просмотров: 80
Скачиваний: 3
СОДЕРЖАНИЕ
Глава 1. Теоретические основы гипертекстовой технологии
История развития языков гипертекстовой разметки
Глава 2.Основные конструкции языков гипертекстовой разметки
2.1 Язык гипертекстовой разметки HTML
2.2. Расширяемый язык разметки XML
2.3. Расширяемый язык разметки гипертекста XHTML
Глава 3. Практическое применение языков разметки гипертекста
3.1. Создание документов в стандарте HTML
3.2. Создание документов в стандарте XML
Введение
Компьютеры уверенно вошли в жизнь людей и продолжают набирать популярность. Причины всеобщего увлечения ими просты: они дают возможность интересно проводить досуг, общаться с друзьями из любого города в чатах и на форумах, искать нужную информацию в Интернете.
Качественные изменения арсенала научно-технических средств, которые состоялись в последние годы под воздействием научно-технического прогресса, открыли новые возможности в работе с информацией, поставили перед человечеством задание усовершенствования старых и разрабатывание новых методик, технологий ее проработки.
Достаточно перспективными для использования, обработки и хранения информации есть гипертекстовые технологии. Они позволяют фиксировать и прорабатывать информацию в кратчайшие сроки, избегая сложных лабораторных процессов. Именно гипертекстовые технологии ставят работу с информацией на высокий уровень.
Целью данной курсовой работы является рассмотреть применение гипертекстовых языков.
Для достижения цели были поставлены следующие задачи:
- Изучить литературу по данной теме;
- Произвести сравнительный анализ литературы по данной тем;
- Рассмотреть технологию гипертекста
- Рассмотреть основные конструкции языков гипертекстовой разметки
- Проанализировать практическое применение языков разметки гипертекста
Для написания работы были использованы 12 литературных источника, в том числе периодическая литература. Практическая значимость работы заключается в том, что материал может быть использован для дальнейших исследований в области информатики и смежных ей дисциплин.
Глава 1. Теоретические основы гипертекстовой технологии
История развития языков гипертекстовой разметки
появление первых версий языков гипертекстовой разметки относят к 1986 году, а в 1991 году HTML был существенно доработан и стал использоваться именно для передачи гипертекста по просторам всемирной паутины
Первая версия языка разметки гипертекста HTML была создана на основе стандарта обобщенного языка разметки SGML (Standard Generalized Markup Language), который в некотором роде можно считать прообразом расширяемого языка разметки данных XML (eXtensible Markup Language). Стандарт XML в наше время приобрел огромную популярность благодаря большому количеству своих расширений, используемых в компьютерных технологиях.
В результате существуют аббревиатуры SGML, HTML, XML и XHTML. Рассмотрим что каждая означает. SGML это не что иное, как набор правил, на основе которых можно строить любые языки разметки. HTML и есть один из этих языков - приложение SGML. Другими словами, SGML определяет то, как должны выглядеть элементы разметки, а HTML - какие именно должны быть элементы и как они должны интерпретироваться браузерами. XHTML, в свою очередь, является приложением XML, а сам XML ни что иное, как упрощенный вариант SGML. Языки HTML и XHTML, не смотря на то, что очень внешне похожи, имеют существенные скрытые отличия, которые, по большей части, заключаются в принципе их обработки[1].
Официальной спецификации HTML 1.0 не существует. До 1995 года существовало множество неофициальных стандартов HTML. Чтобы стандартная версия отличалась от них, ей сразу присвоили второй номер.
Версия 3 была предложена Консорциумом всемирной паутины (W3C) в марте 1995 года и обеспечивала много новых возможностей, таких как создание таблиц, «обтекание» изображений текстом и отображение сложных математических формул. Даже при том, что этот стандарт был совместим со второй версией, реализация его была сложна для браузеров того времени. Версия 3.1 официально никогда не предлагалась, и следующей версией стандарта HTML стала 3.2, в которой были опущены многие нововведения версии 3.0, но добавлены нестандартные элементы, поддерживаемые браузерами Netscape Navigator и Mosaic[2].
В версии HTML 4.0 произошла некоторая «очистка» стандарта. Многие элементы были отмечены как устаревшие и нерекомендованные. В частности, элемент font, используемый для изменения свойств шрифта, был помечен как устаревший (вместо него рекомендуется использовать таблицы стилей CSS).
В 1998 году консорциум Всемирной паутины начал работу над новым языком разметки, основанном на HTML 4, но соответствующим синтаксису XML. Впоследствии новый язык получил название XHTML. Первая версия XHTML 1.0 одобрена в качестве Рекомендации консорциума Всемирной паутины 26 января 2000 года.
Планируемая версия XHTML 2.0 должна была разорвать совместимость со старыми версиями HTML и XHTML, но 2 июля 2009 года консорциум Всемирной паутины объявил, что полномочия рабочей группы XHTML2 истекают в конце 2009 года. Таким образом, была приостановлена вся дальнейшая разработка стандарта XHTML 2.0
В 2014 году вышла новая версия HTML 5.0. Цель разработки HTML5 — улучшение уровня поддержки мультимедиа-технологий с одновременным сохранением обратной совместимости, удобочитаемости кода для человека и простоты анализа для парсеров.
Определение содержания основных понятий
Гипертекст- это технология, которая базируется на средствах обработки больших, глубоко вложенных, структурированных, объединенных семантически, текстов и информации, организованных в виде фрагментов и принадлежащих к одной и той же системе объектов, которая расположена в вершине некоторой сети и выделяемая обычно цветом. Данная технология позволяет при машинной реализации моментально, нажатием одной или нескольких клавиш, вызывать и помещать в необходимое место просматриваемого или организуемого нового текста необходимые фрагменты гипертекста, которые "привязаны" к выделенному по цвету ключевому слову или словосочетанию, или нескольким слов.
Основными компонентами технологий, состоящих в применении гипертекстовой модели к информационным ресурсам, распределенным в Интернете, являются:
- URL - универсальный способ адресации ресурсов в сети;
- HTML - язык гипертекстовой разметки документов;
- HTTP (HyperText Transfer Protocol) - протокол обмена гипертекстовой информацией;
- дополнительные средства (CGI, Java, JavaScript).
Гипертекстовая база данных - это набор текстовых файлов, написанных на языке HTML, который определяет форму представления информации (разметка) и структуру связей этих файлов (гипертекстовые ссылки).
Такой подход предполагает наличие еще одной компоненты технологии - интерпретатора языка. В World Wide Web функции интерпретатора разделены между сервером гипертекстовой базы данных и интерфейсом пользователя.
Сервер, кроме обеспечения доступа к документам и реализации гипертекстовых ссылок, осуществляет также препроцессорную обработку документов, в то время как интерфейс пользователя проводит интерпретацию конструкций языка, связанных с представлением информации.
Универсальный идентификатор ресурсов (URL)[3]
Система универсальных идентификаторов ресурсов (URL) разработана для использования в системах Интернет и в ее основу заложены следующие принципы:
- расширяемость - новые адресные схемы должны были легко вписываться в существующий синтаксис;
- полнота - по возможности любая из существовавших схем должна была описываться посредством URL;
- читаемость - адрес должен легко пониматься человеком.
Формат URL включает:
- схему адреса;
- IP- или доменный адрес машины;
- номер ТСР-порта;
- адрес ресурса на сервере (каталог или путь);
- имя HTML-файла и метку;
- критерий поиска данных.
Гипертекстовая разметка используется для указания, в какой части экрана и как должен отображаться текст, каким образом связаны между собой тексты, которые составляют гипертекстовую базу данных. Исходя из данных целей вводятся специальные управляющие символы. Текст с данными управляющими символами сохраняется в обычном текстовом файле в кодировке ASCII и может быть отредактирован почти любым текстовым редактором[4].
Язык гипертекстовой разметки HTML предложил Тим Бернерсон-Ли в 1989 г. До создания HTML был стандарт языка разметки для печатных документов - SGML ( Standart Generalised Markup Language ), который был взят в качестве основания HTML . Полагалось, что такое решение поддержит использование существующего программного обеспечения для истолкования нового языка гипертекстовой разметки[5].
В качестве элемента гипертекстовой базы данных для языка HTML был выбран обыкновенный текстовый файл, хранящийся средствами файловой системы операционной среды электронной вычислительной машины.
Глава 2.Основные конструкции языков гипертекстовой разметки
2.1 Язык гипертекстовой разметки HTML
За основу модели разметки документов в HTML принята теговая модель. Теговая модель описывает документ как совокупность контейнеров, каждый из которых начинается и заканчивается тегами. Т.е. документ НТМL представляет собой не что иное, как обычный АSСII-файл, с добавленными в него управляющими НТМL-кодами (тегами).
Теги НТМL-документов в большинстве своем просты для понимания и использования, ибо они образованы с помощью общеупотребительных слов английского языка, понятных сокращений и обозначений. НТМL-тег состоит из имени, за которым может следовать необязательный список атрибутов тега. Текст тега заключается в угловые скобки (< и >)[6]. Простейший вариант тега - имя, заключенное в угловые скобки, например <HEAD> или <i>. Для более сложных тегов характерно различие атрибутов, которые могут иметь конкретные значения, определенные автором для видоизменения функции тега.
Атрибуты тега следуют за именем и отделяются друг от друга одним или несколькими знаками табуляции, пробелами или символами возврата к началу строки. Порядок записи атрибутов в теге значения не имеет. Значение атрибута, если таковое имеется, следует за знаком равенства, стоящим после имени атрибута. Если значение атрибута - одно слово или число, то его можно просто указать после знака равенства, не выделяя дополнительно. Все остальные значения необходимо заключать в одинарные или двойные кавычки, особенно если они содержат несколько разделенных пробелами слов. Длина значения атрибута ограничена 1024 символами. Регистр символов в именах тегов и атрибутов не учитывается, чего нельзя сказать о значениях атрибутов. Например, особенно важно использовать нужный регистр при вводе URL других документов в качестве значения атрибута HREF.
Чаще всего НТМL-теги состоят из начального и конечного компонентов, между которыми размещаются текст и другие элементы документа. Имя конечного тега идентично имени начального, но перед именем конечного тега ставится косая черта (/) (например, для тега стиля шрифта - курсив <i> закрывающая пара представляет собой </i>, для тега заголовка <ТIТLЕ> закрывающей парой будет </ТIТLЕ>). Конечные теги никогда не содержат атрибутов. По своему значению теги близки к понятию скобок "begin/end" в универсальных языках программирования, которые задают области действия имен локальных переменных и т. п. Теги определяют область действия правил интерпретации текстовых тегов документа.
При использовании вложенных тегов в документе следует соблюдать особую аккуратность. Вложенные теги нужно закрывать, начиная с самого последнего и двигаясь к первому. Некоторые НТМL-теги не имеют конечного компонента, поскольку они являются автономными элементами. Например, тег изображения <IMG>, который служит для вставки в документ графического изображения, конечного компонента не требует. К автономным тегам также относятся разрыв строки (<BR>), горизонтальная линейка (<HR>) и теги, содержащие такую информацию о документе, которая не влияет на его отображаемое содержимое, например теги <META> и <BASE>.
В некоторых случаях конечные теги в документе можно опускать. Большинство браузеров реализованы так, что при обработке текста документа начальный тег воспринимается как конечный тег предыдущего. Самый распространенный тег такого типа - тег абзаца <Р>. Поскольку он используется в документе очень часто, то его обычно ставят только в начале каждого абзаца. Когда один абзац заканчивается, следующий тег <Р> сигнализирует браузеру о том, что нужно завершить данный абзац и начать следующий. Большинство авторов тегом конца абзаца вообще не пользуются.