Файл: Языки гипертекстовой разметки (1 ОСОБЕННОСТИ ЯЗЫКОВ ГИПЕРТЕКСТОВОЙ РАЗМЕТКИ И ИХ СТРУКТУРА).pdf
Добавлен: 30.06.2023
Просмотров: 37
Скачиваний: 2
Как итог всему вышесказанному. На данный момент не все интернет браузеры поддерживают XHTML. Для того чтобы поэкспериментировать с этим новым стандартом локально, достаточно файлу с гипертекстом дать расширение .xhtml и открыть его в поддерживающем XHTML интернет браузере, например, в Opera. Если разметка не будет соответствовать well-formed XML, то браузер выведет сообщение об ошибке. Если у тега не будет определено пространство именxmlns=http://www.w3.org/1999/xhtml, то вы увидите просто xml. Ниже приведен пример XHTML разметки страницы:
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>xhtml sample</title>
</head>
<body>
<h1>It is <b>xhtml</b> parsing result</h1>
</body>
</html>
Как заставить браузеры использовать XHTML обработчик для страниц, размещенных на удаленных серверах, вы можете найти в интернете, но заниматься этим сейчас, с моей точки зрения, не обязательно. При разработке сайтов я рекомендую придерживаться правил XHTML, и проверять страницу на соответствие этому стандарту локально. А какой обработчик будет использован браузером пользователя не так важно, поскольку если страница соответствует синтаксису XHTML, то синтаксису HTML она соответствует точно. Принудительно использовать парсер XHTML можно заставить браузер в любой момент, настроив должным образом заголовки интернет страниц на сервере.
Следующий текст может быть полезен как авторам интернет ресурсов и начинающим веб-мастерам, так и программистам, использующим HTML, как инструментоформления отчетов в процессе трансформации данных из других форматов, в том числе из формата XML посредством XSL. Если формируемая разметка не должна стать частью интернет ресурса общего пользования, то на все рассуждения про оптимизацию страниц с целью продвижения их в поисковой выдаче можно не обращать особого внимания. Материал предлагаю воспринимать, как краткий справочник-учебник по основам языка разметки гипертекста и применения каскадных таблиц стилей.
Следующим образом должен выглядеть шаблон интернет страницы на XHTML:
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title>Заголовок страницы</title>
<meta http-equiv="Content-Type" content="text/html; charset=windows-1251"/>
<meta name="description" content="Описание страницы"/>
<meta name="keywords" content="Ключевые слова"/>
<link rel="stylesheet" href="Путь к файлу каскадных таблиц стилей .css" type="text/css"/>
</head>
<body>
</body>
</html>
Помимо самой разметки, для поисковых систем в интернете (Google, Яндекс и других) важна метаинформация о странице. К метаинформации относят содержимое мета-тегов (<meta>) и тега заголовка страницы (<title>). Если располагать их по степени важности для поискового сервиса, то на первом месте идет содержательность и уникальность (по отношению к другим страницам интернет ресурса) заголовка страницы, на втором месте - более развернутое (символов 150-250) описание страницы (description) и на третьем месте уже список ключевых слов (keywords) через запятую.
В чем их важность?
Во-первых, содержимое заголовка – это подпись-ссылка на вашу страницу в поисковой выдаче, а содержимое тега description – это один из кандидатов на роль сниппета (краткого описания страницы) все в тех же результатах поиска. На самом деле те же Google и Яндекс стараются создать сниппет из основного текста вашей страницы, но это у них не всегда получается, поскольку текста может быть совсем мало или не быть вообще, к примеру, на странице размещены только картинки, видео или анимация. В этом случае им не остается ничего другого, как обратиться к краткому описанию страницы. Имея возможность управлять представлением ссылки на ваш сайт, вы можете сделать ее более привлекательной для пользователей поисковой системы и тем самым повысить ее показатель CTR (click-through rate) – количество переходов, деленное на количество показов страницы в результатах поиска.
Во-вторых, исходя из назначения мета-тегов, они должны содержать именно заголовок, отражающий тему страницы, ее краткое описание и ключевые слова. Следовательно, сопоставив мета-теги и само содержание страницы можно понять, насколько оно (содержание) может соответствовать ожиданиям потенциальных пользователей, когда те увидят заголовок и сниппет на странице результатов поискового запроса и примут решение перейти по ссылке. В информационном поиске это соответствие также называют степенью релевантности или просто релевантностью результатов запроса, и именно релевантность, представленная в виде числовых величин, полученных по тщательно скрываемым от общественности алгоритмам оказывает значительное влияние на позиции того или иного сайта в рейтингах поисковиков.
Мета-теги с атрибутом http-equiv играют роль заголовков HTTP запросов, и содержат различного рода системные настройки и параметры, необходимые браузеру, чтобы корректно отображать содержимое веб-страниц. В данном примере с помощью такого тега браузеру сообщается, что формат страницы – это текст или гипертекст text/html, для отображения которого следует использовать кодировку windows-1251. В русскоязычном сегменте всемирной паутины в основном используют указанному мной кодировку или “универсальную”, построенную на основе 8-ми битного представления юникода, кодировку UTF-8. Если кодировка в мета-теге указана не будет, а браузер пользователя не сможет определить ее самостоятельно, то текст может предстать в нечитаемом виде.
2 ОСОБЕННОСТИ РАБОТЫ С ЯЗЫКОМ HTML
2.1 Техника разметки текста с помощью HTML
HTML (язык гипертекстовой разметки) — это основной язык, с помощью которого создаются веб-страницы. Страница, которую пользователь видит в своем браузере, может состоять из множества разных файлов — например, изображений, анимационных роликов, сценариев JavaScript, апплетов и т. д. - но основой страницы практически всегда является документ HTML. Другие языки разметки (прежде всего многочисленные приложения XML) пока еще слабо поддерживаются браузерами и поэтому не вытесняют HTML на компьютерах обычных пользователей.
CSS (каскадные таблицы стилей) — это язык, предназначенный для оформления веб-страниц и некоторых других видов документов. Разработчик стандартов HTML и CSS, Консорциум Всемирной Паутины (The World Wide Web Consortium, W3C) рекомендует разделять структуру и представление — т. е. кодировать в HTML только логическую структуру документа, а все, что связано с отображением документа на экране или представлением на других устройствах, выполнять средствами CSS.
Аббревиатура «HTML» расшифровывается как «HyperText Markup Language» (в переводе на русский язык — «язык разметки гипертекста»). Взрывной рост Всемирной Паутины в начале 1990-х во многом обусловлен широким распространением этого языка и браузеров, отображающих написанные на нем страницы.
Все три слова в названии языка — «структурный», «разметка» и «гипертекст» - нуждаются в дополнительных пояснениях, которые сейчас и будут даны.
В коде документа HTML находится не только сама информация, которую пользователь увидит на веб-странице, но и некоторые инструкции о том, как браузер пользователя будет обрабатывать эту информацию.
Например, можно включить в документ такую конструкцию, как заголовок заключенного в тэги H1. Пользователь увидит на странице только сам текст заголовка. Окружающие его тэги H1 не отображаются на странице, но снабжают браузер информацией, позволяющей правильно интерпретировать этот текст. Они обозначают, что такой текст является заголовком первого уровня. Большинство современных графических браузеров по умолчанию выделяют этот заголовок полужирным шрифтом увеличенного кегля. (Забегая вперед, заметим, что многие поисковые системы придают заголовкам больший вес, чем обычному тексту, а заголовкам первого уровня — в свою очередь, больший вес, чем прочим заголовкам.)
Язык HTML предназначен в первую очередь для структурной разметки, т. е. для обозначения каждого элемента в соответствии с его местом и ролью в структуре документа. Например, тэг <p>…<⁄p> обозначает, что элемент является просто абзацем обычного текста, тэг <ul>…<⁄ul> — что элемент является перечнем, тэг <blockquote>…<⁄blockquote>— что элемент является цитатой и т. д.
В HTML есть также тэги, управляющие внешним видом отдельных элементов: например, тэг <i>…<⁄i> выделяет текст курсивом, тэг <font>…<⁄font> изменяет различные параметры шрифта, а тэг <br ⁄> вставляет перевод строки. Все такие тэги не относятся к структурной разметке, и применять их не рекомендуется. Все, что касается оформления веб-страницы, ее внешнего вида, можно и нужно делать с помощью CSS.
Структурная разметка не имеет никакого отношения к внешнему виду документа. Документ может быть отображен на экране компьютера, написан от руки или напечатан на пишущей машинке; в конце концов, его можно прочитать вслух — но все заголовки в нем останутся заголовками, все neречни — перечнями, а цитаты — цитатами. Структурная роль элементов документа, в отличие от оформления, никак не меняется в зависимости от того, какими средствами просматривают этот документ.
Иными словами, структурная разметка говорит о том, чем является тот или иной элемент, а не о том, как его следует или не следует отображать. Грамотная структурная разметка обеспечивает независимость документа от устройства вывода.
Структурная разметка не говорит о том, как конкретно должен быть выделен текст. Но это не мешает разработчику оформить его нужным образом с помощью CSS. Технология CSS позволяет даже написать отдельные таблицы стилей для каждого возможного устройства отображения.
Хорошая структурная разметка также облегчает автоматическую обработку документа. Например, когда необходимо пронумеровать все заголовки или составить оглавление документа — программа легко справится с этой задачей, если заголовки помечены соответствующими структурными тэгами. Можно при этом включить в середину документа новые заголовки — программе не составит труда перенумеровать все заново и обновить оглавление. Если не использовать для заголовков правильные тэги H1, H2 и т. д., то их нумерация или составление оглавления превратится в кропотливую и неэффективную ручную работу.
2.2 Особенности работы с тэгами в валидаторе W3C
Собственно говоря, первая версия языка Html появилась в начале девяностых годов прошлого века (жутковато звучит — прошлого века, однако, это именно так) и была ориентирована в первую очередь на передачу информации в научной среде, но, однако, с этого момента можно начинать отчет популярности всемирной паутины.
До этого интернет был уделом немногих знающих и интересующихся людей, но с появлением ХТМЛ и первых браузеров, способных интерпретировать его незамысловатый код в понятные и удобные пользователю вещи (веб страницу или, как еще часто говорят, веб документ), всемирная паутина начала свое победоносное шествие. Наверное, появление языка гипертекстовой разметки можно приравнять к переходу от текстовых к графическим операционным системам.
Довольно интересными на мой взгляд представляются темп и нюансы развития этого языка разметки. Итак, через несколько лет после появления первой версии, по инициативе Тима Бернерса-Ли был создан консорциум W3C(World Wide Web Consortium), призванный был стать законодателем стандартов и не допустить разброда и шатаний в рядах разработчиков, которые могли привести к очень неприятным последствиям.
В 1994 году разрабатываются стандарты гипертекстовой разметки второй версии, а уже в 1995 ведутся работы над Html 3 с поддержкой CSS (таблиц каскадных стилей). Примерно в это же время появляется и набирает популярность первый браузер Мозаика, который очень быстро был переделан в Netscape Navigator.
MicroSoft хотела купить Netscape Navigator для интеграции его в Windows, но разработчики этого браузера отказались (в итоге появился Mozilla Firefox), в результате чего мы получили и имеем по сей день собственное творение MicroSoft (IE — Internet Explorer), которое они создали на базе открытых кодов Мозаики.
Что интересно, IE (в силу своей предустановленности в самой популярной операционной системе) сумел-таки выкинуть из рейтинга браузеров некогда очень популярный Netscape Navigator, но получил взамен ряд новых игроков (бесплатный браузер Opera, обозреватель от Mozilla, а еще сегодняшнего лидера Гугол Хром и др.). В этот период разработчики браузеров зачастую бежали впереди паровоза (валидатора) и вводили свои собственные стандарты, ибо работа над форматом Html в W3C шла довольно медленно.
Узрев такое дело, консорциум в течении одного 1997 года сделал огромный скачок — язык разметки претерпел сразу два изменения, перейдя от версии 3.2 до версии 4.0, а затем (в 1999) и до той версии, которую мы используем по сей день — Html 4.01. С тех пор, представляете, стандарт не менялся уже около двенадцати лет (всех все устраивало, и разработчиков браузеров и команду валидатора W3C).