Файл: Распределенные системы обработки информации. Языки гипертекстовой разметки.pdf
Добавлен: 29.06.2023
Просмотров: 22
Скачиваний: 2
Введение
Актуальность. Собственно, появление html и ознаменовало появление интернета в том виде, в котором мы его знаем сейчас, приведя к началу бурного роста сети и количества сайтов в ней.
HTML - это сокращение от англ. "HyperText Markup Language", что в переводе на русский означает "язык гипертекстовой разметки". HTML - это стандартный язык, который и по сей день используется для создания веб-страниц, размещаемых в интернете.
HTML – быстро развивающийся язык разметки веб-документа, который является основой большинства популярных веб-сайтов. Не каждому известно, что HTML5 – это обновление языка HTML, эффективность которого, при создании веб-приложении различных типов и организации представления контента на сайте, на порядок выше предыдущих версий.
Цель работы – изучить языки гипертекстовой разметки.
Достижение указанной цели определило постановку и решение следующих задач:
- исследовать историю языков разметки;
- изучить языков разметки на примере HTML;
- привести пример использования HTML.
Предметом исследования можно назвать языки гипертекстовой разметки.
Объектом исследования является язык HTML.
Теоретико-методологическую основу исследования составили научные труды, посвященные анализу языков гипертекстовой разметки. При разработке и решении поставленных задач использовались методы сравнительного анализа, а также группировки.
Структура работы. Работа включает введение, две главы, заключение и список литературы. В первой главе рассматриваются история языков гипертекстовой разметки. Во второй главе рассматриваются основы языка HTML. В третьей главе приведен пример использования языка HTML.
Научно-методической основой работы служат труды отечественных и зарубежных ученых в области программирования. При выполнении работы использовалась научно-методическая литература, публикации в периодической печати и научных изданиях, материалы Интернет-порталов.
Глава 1. Теоретические основы языков разметки
1.1. История языков разметки
Начало истории HTML было положено Чарльзом Гольдфарбом в 1969 г., когда он создал для компании IBM прототип языка разметки технической документации GML (Generalized Marckup Language - обобщенный язык разметки), которому в 1986 г. был придан статус международного стандарта SGML (Standart GML). Этот обобщенный язык предназначен для построения систем логической, структурной разметки любых разновидностей текста. Структурная разметка в данном случае означает, что управляющие коды, вносимые в текст при такой разметке, не несут никакой информации о форматировании документа, а лишь указывают границы и соподчиненность его составных частей[1].
После создания Тимом Бернес-Ли в 1989 г. первого браузера многие коммерческие компании подхватили эту инициативу и стали выпускать свои браузеры и к ним свои собственные расширения языка HTML.
Каждая из компаний стремилась сделать свой браузер самым лучшим и удобным, и вводила в его интерпретатор собственные новые элементы, отвечающие за визуальную разметку страниц. Делалось это с целью привлечь пользователей и разработчиков веб-страниц к собственному продукту. Тем самым основная прелесть HTML - "платформенно-независимое отображение документа" - была утеряна[2].
С начала 1994 г. наблюдается всплеск активности фирмы Netscape. Основатели этой компании, в прошлом разработчики в NCSCA (National Center for SuperComputer Applications - Национальный Центр Суперкомпьютерных приложений), были создателями первого графического браузера Mosaic и имели большой опыт в разработке графических браузеров.
Программа Mosaic была единственной в то время браузером поддерживающим графические возможности. Она была разработана в Национальном центре суперкомпьютерных приложений США (National Center for Supercomputer Applications - NCSA), там же, кстати, была разработана WWW (World Wide Web). По этой причине никаких противоречий между официальными стандартами и их реализацией в браузерах тогда не существовало[3].
Для повышения популярности собственного продукта - Netscape Navigator, были разработаны "Расширения Netscape для HTML". Это дало свои плоды, - к концу 1995 г. компания завоевала до 90% рынка браузеров.
С небольшим запозданием на этот рынок пришла фирма Microsoft. Версия Internet Explorer 2.0 не представляла ничего выдающегося по сравнению с той же версией Netscape Navigator (которая действительно была второй), включавшей в себя интерфейс подключаемых модулей, поддержку Java-апплетов (программ на языке Java, подробнее смотрите раздел Java), встроенный язык сценариев JavaScript, возможности разбивки окна браузера на фреймы и многое другое.
В результате назревала проблема несовместимости браузеров. Динамично растущей Сети грозил хаос.
В апреле 1994 года был образован Консорциум W3C (World Wide Web Consortium). Так как официальной спецификации HTML 1.0 не существовало, W3C начал заниматься подготовкой спецификации HTML следующей версии. Но чтобы стандартная версия отличалась от всех предыдущих, ей сразу присвоили номер 2.0. Разработка спецификации HTML 2.0 шла не спеша и лишь в сентябре 1995 года она была утверждена. Из больших дополнений был добавлен лишь механизм форм для отсылки информации с компьютера пользователя на сервер[4].
Тем временем Консорциум W3 в параллель со спецификацией 2.0 занимался обсуждением HTML 3.0. Она была предложена в марте 1995 года. Третья версия предлагала много новых возможностей: поддержка таблиц, обтекание изображения текстом, отображение сложных математических формул, примечания. Поддержка этого стандарта браузерами того времени была не удовлетворена.
В 1996 г. W3C объявил о сотрудничестве с лидерами рынка для установления стандартов совместимости программного обеспечения. Была предложена версия HTML 3.2, которая стала компромиссным решением - попыткой примирить Microsoft и Netscape и ибъединить их оригинальные решения в одно целое[5].
Если первая версия языка (HTML 1.0) была направлена на предсталение языка как такового, где описание его возможностей носило скорее рекомендаельный характер, вторая версия языка (HMTL 2.0) фиксировала практику использования конструкций языка, версия + (HTML +, она же "замороженная" в силу недоработанности HTML 3.0) представляла новые возможности, расширяя набор элементов HTML в сторону отображения научной информации и таблиц, а также улучшение стиля компоновки изображений и текста, то версия HTML 3.2 призвана упорядочить все нововведения и согласовать их с существующей практикой. Кроме того, в версии 3.2 снова делается попытка флрмализации интерфейса пользователя гипертекстовой распределенной системы. По сравнению с версией 2.0, HTML 3.2 позволяет реализовать отображение таблиц, выполнение мобильных кодов, обтекание графики текстом, а также отображение верхних и нижних индексов.
Успех W3C оказался спорным, т.к. компании продолжали придумывать новые расширения к языку HTML и внедряли их поддержку в свои браузеры. Разработчики браузеров обвиняют W3C из-за того, что он является своеобразным тормозом в развитии HTML, ввиду отсутствия давления на него со стороны пользователей, и не спешит принять некоторые их расширения, в то время как многие веб-разработчики давно и успешно их применяют на своих страницах. С помощью версии HTML 4.0 W3C предпринял очередную попытку установить стандарты.
В 1997 г. Консорциум W3C опубликовал спецификацию языка HTML 4.0, в которой указано, какие из элементов устарели и не рекомендуются к дальнейшему применению (APPLET, BASEFONT, CENTER, DIR, FONT, ISINDEX, MENU, S, I, STRIKE и U), а также новые элементы и атрибуты (ABBR, ACRONYM, BDO, BUTTON, COLGROUP, DEL, FIELDSET, FRAME, FRAMESET, IFRAME, INS, LABEL, LEGEND, NOFRAMES, NOSCRIPT, OBJECT, OPTGROUP, PARAM, SPAN, TBODY, TFOOT, THEAD и Q), которые предлагается использовать в дальнейшем[6].
При этом W3C обозначил тенденцию развития языка HTML все более в сторону логического форматирования содержимого. Была дана возможность идентификации практически любого элемента или группы элементов по имени, описаны основные атрибуты для событий. Однозначно указано на платформенную независимость HTML, другими словами, было подчеркнуто, что HTML не является языком визуальной верстки текстов, а является языком логической разметки. Почти все атрибуты, определяющие представление документа HTML (цвета, выравнивание, шрифты, графика и т.д.), являются нежелательными, взамен рекомендуется испоьзовать таблицы стилей и классы.
Атрибуты Id и Class позволяют авторам назначать элементам информацию об имени и классе для таблиц стилей, ссылок, скриптов, объявления объектов, общей обработки документа и т.д., а также ожидается, что задачу представления таблиц в ближайшем будущем возьмут на себя таблицы стилей. HTML 4.0 поддерживает более обширный набор описаний клиентских устройств, так что авторы могут писать таблицы стилей в зависимости от устройств. Многие элементы теперь имеют атрибуты-обработчики событий, это легло в основу повышения интерактивности документов, дало возможность пользователям динамически изменять вид и содержание документов.
Появилась возможность говорить о надстройке к языку HTML - Dynamic HTML, позволяещей создавать и визалировать интерактивные web-страницы без помощи подключаемых модулей, не увеличивая трафика (кол-ва передаваемых по Сети данных). Применение новых решений направлено именно на снижение кол-ва обращений к серверу, т.е. снижение трафика, что так необходимо в условиях роста популярности различных переносных устройств доступа в сеть.
Кроме возможностей разметки текста, включения мультимедиа и формирования гипертекстовых связей, уже существовавших в предыдущих версиях HTML, в версию 4.0 включены дополнительные срества работы с мультимедиа, языки программирования, таблицы стилей, упрощенные средства печати изображений и документов, которые становятся более доступными для всех пользователей HTML 4.0. Эти дополнения служат интернационализации WWW и распространению ее по всему миру. Кроме того, для управления сценариями просмотра страниц web-сайта можно использовать языки программирования этих сценариев типа JavaScript, Java и VBScript.
В 2014 году был завершен стандарт HTML 5, который кардинально отличается от прошлых версий HTML.
Практически с момента основания W3C параллельно с выпуском новых спецификаций HTML шла разработка нового языка XML (eXtensible - расширяемый), который в будущем должен заменить HTML. Пока еще мало кто из непрофессиональных авторов web-страниц пользуется этим языком разметки.
Но уже сейчас стоит соблюдать некоторые правила этого языка (такие как использование парных тэгов и внешнее определение форматирования), поскольку XML из свода правил, из не слишком понятной и сложной для рядового пользователя технологии "дорос" к 2000г. до четырех вариантов реализации[7]:
- Собственно XML как правила построения настраиваемого и расширяемого языка разметки
- XHTML 1.0 (eXtensible HTML) - рекомендован к использованию 26 января 2000г. как переопределение спецификации HTML 4.01 в терминах XML
- XHTML 1.1 - модульный подход, ориентированный на быстрое создание интерпретаторов языка с любым доопределением или уменьшением дескрипторов исходного
- XHTML Basic - облегченная версия, рассчитаннная на мобильных пользователей (по оценкам W3C, в 2002г. 75% информации в Internet будет просматриваться с мобильных клиентов: телефоны, карманные компьютеры и т.п.).
1.2. Языки разметки
Язык разметки (текста) — набор символов или последовательностей, вставляемых в текст для передачи информации о его выводе или строении. Текстовый документ, написанный с использованием языка разметки, содержит не только сам текст (как последовательность слов и знаков препинания), но и дополнительную информацию о различных его участках — например, указание на заголовки, выделения, списки и т. д. В более сложных случаях язык разметки позволяет вставлять в документ интерактивные элементы и содержание других документов.
HTML (от англ. Hypertext Markup Language — «язык разметки гипертекста») — это стандартный язык разметки документов в Интернете. Все веб-страницы создаются при помощи языка HTML (или XHTML). Текстовые документы, содержащие код на языке HTML (такие документы традиционно имеют расширение «html» или «htm»), обрабатываются браузером. Интернет-обозреватель, или браузер, обычно предоставляет пользователю удобный интерфейс для запроса веб-страниц, их просмотра (и вывода на иные внешние устройства) и, при необходимости, отправки введённых пользователем данных на сервер. Наиболее популярными на сегодняшний день браузерами являются Internet Explorer, Mozilla Firefox, Opera и Safari.
С помощью языка HTML вы можете: сделать текст полужирным, курсивным или подчёркнутым; вставить специальные символы (выходящие за рамки ASCII символы пунктуации, математические символы, греческие и готические буквы, стрелки и т.п.); поменять начертание, цвет шрифта; выровнять текст по центру, левому/правому краю, по ширине; оформить текст как гиперссылку на другую страницу или файл; нарисовать таблицу.
XML (англ. eXtensible Markup Language -расширяемый язык разметки). Свое название XML получил по той причине, что в нем нет фиксированного формата, как в HTML. В то время как язык HTML ограничивается набором твердо закрепленных тегов, пользователи XML могут создавать свои собственные тэги, которые бы отвечали тематике документа. Таким образом, XML — это метаязык. Этот язык используется в качестве средства для описания грамматики других языков и контроля за правильностью составления документов.
Документ XML выглядит во многом похожим на HTML. В XML существуют открывающие, закрывающие и пустые тэги. Однако, в отличие от HTML, правила относительно тегов более строгие. Например, смысл тега зависит от регистра, а каждый открывающий тег должен во всех случаях иметь парный закрывающий тег. Кроме того, теги в документе могут быть вложены друг в друга[8].