Файл: Языки гипертекстовой разметки (Понятие представления данных и обоснование проблемы).pdf

ВУЗ: Не указан

Категория: Курсовая работа

Дисциплина: Не указана

Добавлен: 28.06.2023

Просмотров: 57

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

ВВЕДЕНИЕ

Тема курсовой работы «Языки гипертекстовой разметки».

Достаточно часто программная документация имеет специфические особенности. Например, используются специальные для данной предметной области шаблоны описания, или есть существенные ограничения технологического процесса подготовки документации.

В данной работе рассматриваются различные системы документирования программного обеспечения, и делается выбор соответствующего инструментария. Также делается вывод о необходимости доработки готовой системы документирования и описываются разработанные для конкретных случаев технология и программные средства, которые позволяют решить поставленную задачу более экономичным образом.

Постановка задачи: Обосновать актуальность использования XML документов как универсального формата для передачи данных.

За пример обоснования взят достаточно большой по объему комплекс программного обеспечения входит подсистема «Быстрых отчетов», построенных на основе SQL- запросов. Подсистема должна иметь программную документацию. Количество отчетов - достаточно большое, несколько сотен, готовить и, тем более, сопровождать описание отчетов традиционными методами достаточно сложно и дорого.

Надо выбрать наиболее подходящий инструментарий для документирования программной подсистемы и, в случае необходимости, внести необходимые доработки в технологии и программные средства. Составление программной документации - очень важная составляющая разработки программного продукта [1].

Поскольку материал, из которого состоит техническая документация, - текст на естественном языке, применить к нему модульный подход оказывается сложнее, чем к исходному коду. В тексте документации достаточно особенностей, обусловленных лексическими и грамматическими особенностями, традициями, сложившимися мнениями стилистики и эстетики.

Принцип единого источника и технологии, позволяют применить модульный принцип к документированию [3]. Благодаря этому принципу мы можем несмотря на все своеобразие текста параметризировать почти одинаковое и формировать из этих блоков документы в том виде, в котором их предпочитает получать аудитория.

Понятие представления данных и обоснование проблемы


Данные в компьютере представляются в виде кода, который состоит из единиц и нулей в разной последовательности.

Код - набор условных обозначений для представления информации. Кодирование - процесс представления информации в виде кода.

Кодирование текстовой информации.

Кодовая таблица - это внутреннее представление символов в компьютере. Во всем мире в качестве стандарта принята таблица ASCII (American Standard Code for Information Interchange - Американский стандартный код для обмена информацией). Для хранения двоичного кода одного символа выделен 1 байт = 8 бит. Учитывая, что каждый бит принимает значение 0 или 1, количество их возможных сочетаний в байте равно 28 = 256. Значит, с помощью 1 байта можно получить 256 разных двоичных кодовых комбинаций и отобразить с их помощью 256 различных символов. Эти комбинации и составляют таблицу ASCII.

Для сокращения записей и удобства пользования кодами символов используют шестнадцатеричную систему счисления, состоящую из 16 символов - 10 цифр и 6 латинских букв: A,B,C,D,E,F. Так, буква S будет представлена в шестнадцатеричной системе по сравнению с двоичной более компактным кодом 53. Стандарт ASCII определяет первые 128 символов от 0 до 127: цифры, буквы латинского алфавита, управляющие символы. Первые 32 символа являются управляющими и предназначены в основном для передачи команд управления. Вторая половина таблицы от 128 до 255 – национальный алфавит[3].

Кодирование чисел.

Двоичная система счисления обладает такими же свойствами, что и десятичная, только для представления чисел используется не 10 цифр, а всего две. Соответственно и разряд числа называют не десятичным, а двоичным.

Для кодирования числа, участвующего в вычислениях, используется специальная система правил перевода из десятичной системы исчисления в двоичную. В результате число будет записано двоичным кодом, т.е. представлено различным сочетанием всего двух цифр - 0 и 1.

Кодирование графической информации.

Создавать и хранить графические объекты в компьютере можно двумя способами - как растровое изображение или как векторное изображение. Для каждого типа изображения используется свой способ кодирования.


Векторное изображение представляет собой графический объект, состоящий из элементарных отрезков и дуг. Положение этих элементарных объектов определяется координатами точек и длиной радиуса. Для каждой линии указывается ее тип (сплошная, пунктирная, штрих - пунктирная), толщина и цвет. Информация о векторном изображении кодируется как обычная буквенно-цифровая и обрабатывается специальными программами.

Кодирование звуковой информации.

Звуковая информация может быть представлена последовательностью элементарных звуков (фонем) и пауз между ними. Каждый звук кодируется и хранится в памяти. Вывод звуков из компьютера осуществляется синтезатором речи, который считывает из памяти хранящийся код звука[3].

Самой большой проблемой в представлении данных является разнообразие ПО с помощью которого эти данные кодируются в память ПК и отображаются пользователю. Для удобства работы необходимо представление данных, которое будет отображаться на любом устройстве без предварительной установки ПО.

Применение технологии единого источника требует подготовки. Сначала проектируется структура единого источника, разрабатываются шаблоны и стили оформления, устанавливается, и настраивается инструментарий для формирования документов. Эта стадия отнимает время в начале проекта и предъявляет достаточно высокие требования к квалификации разработчика технической документации. Но потом начинается рутинная работа по написанию текста и его загрузке в единый источник.

В любой момент на основе введенного текста можно сформировать документы, с большей или меньшей степенью готовности. На этой стадии мы получаем отдачу от сделанных вложений. Раздел, рисунок, таблица, абзац, любой другой фрагмент, который должен появляться в нескольких местах, при необходимости достаточно исправить однократно в едином источнике. Замечательно, что это касается не только текста, но и структурных решений.

Однократное внесение изменений в шаблон, допустим, руководства пользователя, достаточно, чтобы все документы этого типа после очередной автоматической обработки были изменены нужным образом. Принцип единого источника в документировании, как и модульный принцип в программировании, помогает организовать работу коллектива, распределив между ними более или менее изолированные подзадачи.

Таким образом, единственный источник - это не только техническое, но еще и организационное решение.


Языки гипертекстовой разметки. Обзор существующих технологий представления данных.

В 1989 году Тим Бернерс-Ли предложил руководству международного центра высоких энергий (CERN) проект распределенной гипертекстовой системы, которую он назвал World Wide Web (WWW), Всемирная паутина.

Первоначально идея системы состояла в том, чтобы при помощи гипертекстовой навигационной системы объединить все множество информационных ресурсов CERN в единую информационную систему. Технология оказалась настолько удачной, что дала толчок к развитию одной из самых популярных в мире глобальных информационных систем. Практически в сознании большинства пользователей глобальной компьютерной сети Internet сама эта сеть ассоциируется с тремя основными информационными технологиями:

• электронная почта (e-mail);

• файловые архивы FTP;

• World Wide Web.

Успех технологии World Wide Web определен двумя основными факторами: простотой и использованием протоколов межсетевого обмена семейства TCP/IP, (Transmission Control Protocol, протокол управления передачей/Internet Protocol, протокол Internet), которые являются основой Internet. Практически все пользователи Сети одновременно получили возможность попробовать себя в качестве создателей и читателей информационных материалов, опубликованных во Всемирной паутине. Но и популярность самого Internet во многом вызвана появлением World Wide Web, так как это первая сетевая технология, которая предоставила пользователю простой современный интерфейс для доступа к разнообразным сетевым ресурсам. Простота и удобство применения привели к росту числа пользователей WWW и привлекли внимание коммерческих структур.

Далее процесс роста числа пользователей стал лавинообразным, и так продолжается до сих пор. При этом сама технология на начальном этапе была чрезвычайно проста. Дело в том, что при разработке различных компонентов технологии (языка гипертекстовой разметки HTML (HyperText Markup Language, язык разметки гипертекста), протокола обмена гипертекстовой информацией HTTP, спецификации разработки прикладного программного обеспечения CGI и др.) предполагалось, что квалификация авторов информационных ресурсов и их оснащенность средствами вычислительной техники будут минимальными.

HTML, HyperText Markup Language - "язык разметки гипертекста", стандартный язык разметки документов во Всемирной паутине (Web, WWW). Является объектно-ориентированным декларативным языком, имеющим строгую объектную иерархию (DOM-модель, Document Object Model). Большинство веб-страниц создаются при помощи языка HTML (или XHTML). Язык HTML интерпретируется браузерами и отображается в виде документа, в удобной для человека форме. HTML является приложением ("частным случаем") SGML (стандартного обобщённого языка разметки) и соответствует международному стандарту ISO 8879. Расширенный HTML (eXtendable HTML, XHTML) является приложением XML.


Язык HTML был разработан британским учёным Тимом Бернерсом-Ли приблизительно в 1989-1991 годах в стенах Европейского совета по ядерным исследованиям в Женеве (Швейцария). HTML создавался как язык для обмена научной и технической документацией, пригодный для использования людьми, не являющимися специалистами в области вёрстки. HTML успешно справлялся с проблемой сложности SGML путём определения небольшого набора структурных и семантических элементов - дескрипторов. Дескрипторы также часто называют "тегами". С помощью HTML можно легко создать относительно простой, но красиво оформленный документ. Помимо упрощения структуры документа, в HTML внесена поддержка гипертекста. Мультимедийные возможности были добавлены позже.

HTML - теговый язык разметки документов. Любой документ на языке HTML представляет собой набор элементов, причём начало и конец каждого элемента обозначается специальными пометками - тегами. Элементы могут быть пустыми, то есть не содержащими никакого текста и других данных (например, тег перевода строки <br>). В этом случае обычно не указывается закрывающий тег. Кроме того, элементы могут иметь атрибуты, определяющие какие-либо их свойства (например, размер шрифта для элемента font). Атрибуты указываются в открывающем теге.

Изначально язык HTML был задуман и создан как средство структурирования и форматирования документов без их привязки к средствам воспроизведения (отображения). В идеале, текст с разметкой HTML должен был без стилистических и структурных искажений воспроизводиться на оборудовании с различной технической оснащённостью (цветной экран современного компьютера, монохромный экран органайзера, ограниченный по размерам экран мобильного телефона или устройства и программы голосового воспроизведения текстов). Однако современное применение HTML очень далеко от его изначальной задачи. Например, тег <TABLE>, несколько раз использованный для форматирования страницы, которую вы на даный момент читаете, предназначен для создания в документах самых обычных таблиц, но, как можно убедиться, здесь нет ни одной таблицы. С течением времени, основная идея платформонезависимости языка HTML была отдана в своеобразную жертву современным потребностям в мультимедийном и графическом оформлении.

Текстовые документы, содержащие разметку на языке HTML (такие документы традиционно имеют расширение .html или .htm), обрабатываются специальными приложениями, которые отображают документ в его форматированном виде. Такие приложения, называемые "браузерами" или "интернет-обозревателями", обычно предоставляют пользователю удобный интерфейс для запроса веб-страниц, их просмотра (и вывода на иные внешние устройства) и, при необходимости, отправки введённых пользователем данных на сервер. Наиболее популярными на сегодняшний день браузерами являются Internet Explorer, Mozilla Firefox, Apple Safari, Google Chrome и Opera.