Файл: Языки гипертекстовой разметки (Технологии хранения данных).pdf
Добавлен: 28.03.2023
Просмотров: 172
Скачиваний: 2
СОДЕРЖАНИЕ
1.1 Информация. Информационные процессы
1.2 Информационное развитие общества
1.3 Технологии хранения данных
2.1 Концепция систем хранения данных
2.3 Классификация хранилищ данных
2.4 Типовые технологические решения организации хранилищ данных
3.1 Проект распределенной гипертекстовой системы
Корпоративная информационная фабрика.
Такая архитектура представляет собой эволюцию архитектуры корпоративного хранилища данных. Развитие заключается в скоординированном извлечении информации из источников данных и помещение ее в реляционную базу данных, нормализованную до третьей нормальной формы. Также предполагается заполнение дополнительных репозиториев презентационных данных.
Хранилище данных с архитектурой шины данных.
Данная архитектура хранилища данных представляет собой виртуальную коллекцию витрин данных, имеющих собственную архитектуру типа «звезда».
Объединенное (федеративное) хранилище данных.
В рамках объединенной архитектуры хранилище данных формируется из набора экземпляров хранилищ данных, которые действуют на полуавтономной базе и обычно организационно или территориально разнесены. Тем не менее, имеются основания для рассмотрения и управления этими наборами в качестве одного большого хранилища данных.
2.5 Облачные хранилище данных
Современным подходом децентрализованного и надежного хранения данных являются облачные хранилища информации.
Появлению такой услуги как облачное хранилище данных начале нового века способствовали два фактора.
Первый заключается в том, что ряд компаний – разработчиков программного обеспечения представили на рынке наборы Web-приложений для работы с документами. К таким приложениям в качестве дополнительного бесплатного бонуса предлагались файловые хранилища, с достаточно большой информационной емкостью.
Практика показала, что эти хранилища начали активно осваиваться пользователями для хранения совершенно различной информации, не ограниченной офисными форматами данных.
Вторая предпосылка развития облачных сервисов и хранилищ состоит в том, что примерно в то же время обострилась конкуренция за рынок между электронными почтовыми сервисами. В результате как один из результатов конкурентной борьбы появились новые услуги, в том числе и предоставление онлайн – хранилищ информации.
Облачное хранилище данных представляет собой модель онлайн -хранилища, в котором информация сохраняется на большом количестве распределенных в сети интернет компьютерных серверах, предлагаемых для эксплуатации пользователям.
Отличие этой модели от хранения данных на собственных выделенных серверах отличается от услуг облачных хранилищ тем, что количество или какая-либо внутренняя структура серверов клиенту не видна. Он воспринимает данные как единый большой виртуальный сервер, хотя на самом деле физически серверы обычно располагаются удаленно, иногда на разных континентах.
Основной принцип и задача виртуализации хранилища данных — с одной стороны, скрыть от пользователя все внутренние процессы обустройства хранилища, с другой стороны - задать каждому хранилищу единый конкурентный функционал.[6]
Схема корпоративного облачного хранилища представлена на рисунке 14.
Рисунок 14 – Схема корпоративного облачного хранилища данных
Изучение вопроса позволяет прийти к выводу, что современным подходом к хранению и использованию информации являются распределенные хранилища данных.
3 ЯЗЫКИ РАЗМЕТКИ ГИПЕРТЕКСТА
3.1 Проект распределенной гипертекстовой системы
В 1989 году Тим Бернерс-Ли (рисунок 15) представил на рассмотрение администрации международного центра высоких энергий (CERN) проект распределенной гипертекстовой системы.
Рисунок 15 - Тим Бернерс-Ли – основатель «всемирной паутины»
Автор назвал свою систему World Wide Web (WWW), Всемирная паутина. Изначально идея разработки гипертекстовой навигационной системы заключалась в том, чтобы с ее помощью объединить все множество информационных ресурсов CERN в общую автоматизированную информационную систему.
Технология оказалась настолько удачной, что стала толчком к развитию одной из самых популярных в мире глобальных вычислительных систем – системе, которую сегодня называют Интернет.
Признание технологии WWW обусловлено двумя базовыми факторами:
- простота;
- применение протоколов межсетевого обмена семейства TCP/IP, (Transmission Control Protocol, протокол управления передачей/Internet Protocol, протокол Internet).
Эти два основных подхода и составляют основу глобальной вычислительной сети Интернет.[18]
С появлением и развитием всемирной компьютерной сети Интернет любой пользователь может проявить себя в качестве как создателей, так и читателей информационных материалов, опубликованных во всемирной паутине.
Сама популярность Интернет во многом обязана появлением WWW, которая является первой сетевой технологией, которая предложила пользователю простой современный интерфейс для доступа к самым разным сетевым ресурсам. Простота и удобство применения привели к увеличению количества пользователей Интернет, а также привлекли внимание коммерческих структур.
С тех пор процесс увеличения количества пользователей сети принял лавинообразный характер, таковым он является и в настоящее время Статистика роста пользователей Интернет в России представлена на рисунке 16.
Рисунок 16 – Рост количества пользователей Интернет в России
3.2 Разметка гипертекста
Язык разметки гипертекста Hyper Text Markup Language, иначе говоря - HTML является основным языком создания web-страниц.
На начальном этапе использования технология была чрезвычайно проста, и это имело аргументированное основание. Изначально специалистами было выдвинуто предположение, что при разработке различных элементов технологии (языка гипертекстовой разметки HTML, спецификации разработки прикладного программного обеспечения CGI, протокола обмена гипертекстовой информацией HTTP), что квалификация авторов информационных ресурсов и их оснащенность средствами вычислительной техники будут минимальными.
Язык гипертекстовой разметки HTML разработал Тим Бернерс - Ли Основой послужил стандарт языка разметки печатных документов Standard Generalized Markup Language - SGML - стандартный обобщенный язык разметки.
SGML является метаязыком, позволяющим определять язык разметки для документов.
Изначально этот язык создавался для совместного использования машинно-читаемых документов в крупных правительственных и аэрокосмических проектах. Его активно использовали в издательской и сфере печатной. Но повсеместному распространению SGML для повседневного использования препятствовала его сложность.
Основные части документа SGML:
- SGML-декларация служит для определения символов и ограничителей, которые могут быть использованы в приложении;
- DTD – Document Type Definition Document – компонент, определяющий синтаксис конструкций разметки. Этот компонент может включать дополнительные определения (например, символьные ссылки-мнемоники;
- спецификация семантики также имеет отношение к разметке, она описывает ограничения синтаксиса, которые нельзя выразить внутри DTD;
- содержимое SGML-документа – оно должно состоять как минимум по из корневого элемента. [11]
Пример синтаксиса SGML представлен на рисунке 17.
Рисунок 17 – Типичный синтаксис SGML
Язык SGML стандартизован международной организацией по стандартизации ISO в 1986 году.
Язык HTML базируется на синтаксисе SGML. Формальное описание синтаксиса HTML в терминах SGML было написано Дэниелом В. Конноли.
Разработчики HTML решили следующие задачи:
- предоставление дизайнерам гипертекстовых баз данных простого средства создания документов;
- доведение мощности средства до адекватного уровня отображения имевшихся на тот момент представления об интерфейсе пользователя гипертекстовых баз данных.
Простота языка HTML достигнута за счет использования теговой модели описания документа, которая имеет широкое применение в системах подготовки документов для печати (к примеру, язык разметки научных документов TeX).
Язык НТМL предоставляет пользователю возможность выполнять разметку электронного документа, который выводится на монитор с полиграфическим уровнем оформления. Язык разметки гипертекста НТМL позволяет в результирующем документе отображать самые разнообразные метки, иллюстрации, аудио- и видеофрагменты. В составе языка имеются развитые средства для формирования многоуровневых заголовков, выделений текстовых фрагментов различными способами, использования нумерованных и маркированных списков, таблиц и других возможностей.
Удачным решением разработчиков HTML, является выбором в качестве основы обычных текстовых файлов:
- текстовый файл может быть создан в произвольном текстовом редакторе, в среде любой операционной системы, на любой аппаратной платформе в среде какой угодно операционной системы;
- на момент создания HTML уже действовал американский стандарт разработки сетевых информационных систем, использующий в качестве единицы хранения обычный текстовый файл в кодировке, соответствующей соответствует ASCII.
Современная гипертекстовая база данных согласно концепции WWW представляет собой совокупность текстовых файлов, размеченных на языке HTML. При этом HTML-разметка определяет форму представления информации и структуру связей между отдельными файлами и иными информационными ресурсами (гипертекстовые ссылки).
Гипертекстовые ссылки устанавливают связь между различными текстовыми документами, а также документами, которые содержат графику, видео и текст. Появление возможности отображения и переходов между документами, содержащими разные виды информации, способствовало возникновению нового понятия — гипермедиа.
Функции интерпретатора языка разметки гипертекста HTML в WWW разделены между web-сервером гипертекстовой базы данных и интерфейсом пользователя, то есть отвечают архитектуре «клиент – сервер».
К настоящему времени разработано и стандартизировано несколько версий языка разметки гипертекста HTML (рисунок 18). Подготовкой и распространением документации на описание новых версий HTML занимается международная организация World Wide Web Consortium (W3C).
Рисунок 18 – Версии HTML
Каждая последующая версия языка получала развитие в виде новых возможностей по сравнению с предыдущей.
Современная версия HTML 5 отличается более строгой типизацией и валидацией кода (новые элементы форм), вводит новые семантические элементы (группировка контента, врезка, подпись к иллюстрации, «подвал» страницы, растровый холст) и предоставляет широкие возможности для создания анимированных элементов. Управление сценариями просмотра страниц сайтов применяют языки программирования – Java, JavaScript, JavaScript, VBScript, а также множество самых разных фреймворков.
На базе языка SGML основан еще один язык разметки - XML (Extensible Markup Language) - расширяемый язык разметки. Этот язык появился как развитие языка HTML по мере его усложнения. Язык XML относят к новому поколению языков разметки.
Принципиальное отличие XML от HTML состоит в том, что в XML отсутствуют предопределенные теги, разработчик имеет все возможности для создания собственных тегов.[8]
Языки гипертекстовой разметки продолжают развиваться в соответствии с тенденциями и потребностями информационного развития человечества. Эволюция языков разметки гипертекста представлена на рисунке 19.
Рисунок 19 - Эволюция языков разметки гипертекста
3.3 Основы языка HTML
Язык разметки гипертекста является основным языком формирования страниц сайтов.
HTML является описательным языком разметки документов, в нем используются теги - указатели разметки. Теговая модель описывает документ как набор контейнеров, каждый из которых открывается и закрывается тегами
Иначе говоря, документ НТМL является обычным АSСII - файлом, с добавленными в него управляющими тегами языка HTML.
Теги НТМL преимущественно интуитивно понятны и просты, так как образованы при помощи соответствующих слов английского языка, известных сокращений и обозначений.
Структура типичного HTML-документа представлена на рисунке 20.
Рисунок 20 - Структура типичного HTML-документа
В настоящее время при создании сайта принято разводить: