ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 04.12.2019
Просмотров: 612
Скачиваний: 4
Структура HTML-документа
. Любой документ на языке HTML представляет
собой набор
, причѐм начало и конец каждого элемента обозначается
Тег
,
(иногда
тэг
tag
, читается
(в
) — элемент языка разметки гипертекста. Более правильное
Например, текст Википедии, заключенный между
начальным тегом <small>и конечным тегом </small> (от
small маленький
) предписывает
отображать его меньше основного текста.Например:
Это маленький текст
.
А это
большой.
(<big>—</big>).
тег является элементом документа, а текст, содержащийся между начальным и
конечным тегом — содержанием элемента.
Синтаксис тегов
Используют либо только два тега —
открывающий
, или
начальный
, и
закрывающий
, или
конечный
, или еще дополнительно в зависимости от реализации языка возможно применение
одиночного тега
и
тега пустого элемента
. Например, тег отступа абзаца может оформлять
абзац между <p> </p>, а может в одиночной форме до следующего первого попавшегося <p>
Пример пустого элемента: <HR></HR> - разрыв текста без сохранения отступов, но вы
можете использовать специальную форму записи тега, используя меньшее число символов:
<HR/>
Набор и рекомендуемые интерпретации тегов определены организацией
можно назначать другие символы для обрамления тега (например, фигурные
скобки), но в некоторых подмножествах этого языка (например,
возможность отсутствует.
Кроме того, существуют разные системы языков-подмножеств, которые используются, с
меньшими возможностями, например на веб-форумах и досках объявлений используется
язык разметки
, теги которого ограничиваются символами квадратных скобок: [ ].
Например, [url="http://ru.wikipedia.org"]Русская Википедия[/url] — ссылка на языке
указывающая на страницу русской Википедии.
Атрибуты
У тега могут быть свойства, называемые
атрибутами
, дающие дополнительные
возможности форматирования текста. Они записываются в виде пары имя-значение, причем
нечисловое значение заключается в кавычки.
Например, можно выделить фрагмент текста определенным шрифтом (тег <font>), указав в
этом теге название шрифта и желаемый размер: <font face="Times, Arial, Courier" size=4>
оформляемый текст
</font>
Тип элемента документа
Имя тега определяет
тип
элемента. В HTML имя тега определяет лишь правила разметки,
так, имя тега «i» (например
<i>Курсивный текст</i>
) определяет, что между тегами
расположен текст, который следует отображать в браузере в
курсивном
начертании. XML
представляет собой более гибкий стандарт. Имена тегов в нем не регламентируются жестко:
пользователи могут вводить и использовать для своих нужд новые теги (см.
Например, мы сами для себя можем определить, что элементом с именем тега «person» мы
определяем
тип
этого XML элемента, как фамилия имя и отчество. И скажем, год рождения,
как часть информации по данному человеку:
: <person>Иванов Иван Иванович <year>1984</year></person> Можно даже
задать дополнительно в таблицах
, что все теги
<person>
будут определенного
цвета.
: <div name="person"> Иванов Иван Иванович, 1984 </div> Тут уже нет
возможности сформировать элемент документа для анализа текста, но оформить
можно.
Таким образом, HTML представляет собой неструктурированный текст, а XML — документ
с иерархической структурой, что дает возможность обработки документа: трансформацию
данных, поиск нужных элементов документа и т. д.
Структура элемента
и основанных на нем языках (
версий 2—4.01, языки семейства
элементы должны быть строго вложенными друг в друга, «перехлест» элементов
недопустим
неправильно:
<a><b></a></b>
правильно : <person><i>
Имя Фамилия
</i></person>
Распространенное заблуждение, что SGML и HTML разрешают «перехлест» элементов,
основанно на нарушающем стандарты
, пытавшихся
«исправлять» ошибки разметки по собственным алгоритмам.
Однако SGML (и HTML) допускают применение ряда сокращенных синтаксических
конструкций, в том числе необязательные (опциональные) закрывающие и даже
открывающие теги (автоматически достраиваемые при разборе документа на основе
указанной схемы документа и текущего контекста). В XML, напротив, все теги должны быть
открыты и закрыты явным образом, что значительно упрощает алгоритм его разбора и
снижает требования к аппаратному обеспечению для него.
Примечания
1.
е
(а не
э
) регламентировано орфографическим словарем, см.
Элементы могут быть
пустыми
, то есть не содержащими никакого текста и других данных
(например, тег перевода строки
<br>
). В этом случае обычно не указывается закрывающий
тег. Кроме того, элементы могут иметь
атрибуты
, определяющие какие-либо их свойства
(например, размер шрифта для элемента
font
). Атрибуты указываются в открывающем теге.
Вот примеры фрагментов HTML-документа:
<strong>Текст между двумя тегами — открывающим и закрывающим.</strong>
<a href="http://www.example.com">Здесь элемент содержит атрибут href.</a>
А вот пример пустого элемента: <br>
Регистр, в котором набрано имя элемента и имена атрибутов, в HTML значения не имеет (в
отличие от XHTML). Элементы могут быть вложенными. Например, следующий код:
<b>
Этот текст будет полужирным,
<i>а этот - ещѐ и курсивным</i>
</b>
даст такой результат:
Этот текст будет полужирным,
а этот — ещё и курсивным
Кроме элементов, в HTML-документах есть и
сущности
entities)
. Сущности начинаются с символа
&
имя
;
или
&#
NNNN
;
, где
NNNN
— код символа в
в десятичной системе счисления.
Например,
©
(©). Как правило, сущности используются для
представления символов, отсутствующих в кодировке документа, или же для представления
«специальных» символов:
&
— амперсанда (&),
<
— символа «меньше» (<) и
>
—
символа «больше» (>), которые некорректно записывать «обычным» образом, из-за их
особого значения в HTML.
Подробнее по этой теме см.:
Подробнее по этой теме см.:
Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, должен
начинаться со строки объявления версии HTML
<!DOCTYPE…>
, которая обычно выглядит
примерно так:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Если эта строка не указана, то добиться корректного отображения документа в браузере
становится труднее.
Далее обозначается начало и конец документа тегами
<html>
и
</html>
соответственно.
Внутри этих тегов должны находиться теги заголовка (
<head></head>
) и тела
(
<body></body>
) документа.
Варианты DOCTYPE для HTML 4.01
Строгий (
Strict
): не содержит элементов, помеченных как «устаревшие» или «не
одобряемые» (
deprecated
).
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Переходный (
Transitional
): содержит устаревшие теги в целях совместимости и
упрощения перехода со старых версий HTML.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
Frameset
): аналогичен переходному, но содержит также теги для
создания наборов фреймов.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN"
"http://www.w3.org/TR/html4/frameset.dtd">
Варианты DOCTYPE для HTML 5
используется только один вариант DOCTYPE:
<!DOCTYPE HTML>
Браузерные войны
Основная статья
основные производители браузеров — компании
— начали внедрять собственные наборы элементов в HTML-разметку. Создалась
путаница из различных конструкций для работы во Всемирной паутине, доступных для
просмотра то в одном, то в другом браузере. Особенно большие трудности были при
создании
программ на языке
создавать несколько вариантов страниц или прибегать к другим ухищрениям. На какое-то
время проблема потеряла актуальность по двум причинам:
Соответственно, проблема веб-мастеров становилась проблемой пользователей
альтернативных браузеров.
Благодаря усилиям производителей других браузеров, которые либо следовали
стандартам
), либо пытались создать максимальную
совместимость с Internet Explorer.
На современном этапе можно констатировать рост популярности браузеров, следующих
рекомендациям W3C (это
). Доля Internet Explorer
на данный момент составляет менее 50 %.
В современной практике существует возможность упростить разработку кросс-браузерных
программ на языке JavaScript, с помощью различных библиотек и фреймворков. Например
таких как
Элемент HTML
— это основная структурная единица
, написанная на языке
Структура HTML-документа
— это
документов, то есть любой документ на языке HTML
представляет собой набор элементов, причем начало и конец каждого элемента обозначается
специальными пометками, называемыми
. Регистр, в котором набрано имя тега, в
HTML значения не имеет. Элементы могут быть
пустыми
, то есть не содержащими никакого
текста и других данных (например, тег перевода строки
<br>
). В этом случае обычно не
указывается закрывающий тег. Кроме того, элементы могут иметь
атрибуты
, определяющие
какие-либо их свойства (например, размер шрифта для тега
<font>
). Атрибуты указываются
в открывающем теге. Вот пример части разметки HTML-документа:
<p>Текст между двумя тегами - открывающим и закрывающим.</p>
<a href="http://www.example.com">Здесь элемент содержит атрибут href.</a>
А вот пример пустого элемента: <br>
Каждый HTML-документ, отвечающий спецификации HTML какой-либо версии, обязан
начинаться со строки декларации версии HTML <!DOCTYPE>, которая обычно выглядит
примерно так:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Если эта строка не указана, то добиться корректного отображения документа в
становится труднее.
Далее обозначается начало и конец документа тегами <html> и </html> соответственно.
Внутри этих тегов должны находиться теги заголовка (<head></head>) и тела
(<body></body>) документа.
Варианты DOCTYPE для HTML 4.01
Строгий (Strict): не содержит тегов, помеченных как «устаревшие» или «не
одобряемые» (deprecated).
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN"
"http://www.w3.org/TR/html4/strict.dtd">
Переходный (Transitional): содержит устаревшие теги в целях совместимости и
упрощения перехода со старых версий HTML.
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
(Frameset): аналогичен переходному, но содержит также теги для
создания наборов фреймов.