Файл: Лекция 1 (03. 02. 2021) Тема 1 Основные сведения о геоинформационных системах (гис) Понятия информации и данных.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.11.2023

Просмотров: 105

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тип значений в ячейках растра определяется как реальным явлением, так и особенностями ГИС.

Угол между направлением на север и положением колонок растра.

Растр не требует предварительного знакомства с явлениями и пространственными объектами. Данные собираются с равномерно расположенной сети точек.

Растровые модели проще при обработке данных и этим обеспечивают более высокое быстродействие по сравнению с векторными моделями. Многие растровые модели позволяют вводить векторные данные, в то время как обратная процедура затруднительна.

Наиболее часто растровые модели применяют не только в ГИС, но и при помощи зондирования.

Недостатки:

- проблема низкой пространственной точности, которая уменьшает достоверность измерения площади и расстояний;

- необходимость большого объема памяти компьютера для хранения и обработки данных.

Методы сжатия растровых данных

  1. Групповое кодирование. В строку последовательно вводят значения атрибута и номер конечного столбца группы с одинаковыми атрибутами. Данные вводятся парой чисел: первое обозначает длину группы, второе значение.

  2. Метод цепочечного кодирования. Указываются координаты x и y начала, значения ячеек для всей области. А затем вектора направлений, показывающие куда двигаться дальше, где повернуть и как далеко идти. Обычно векторы описываются количеством ячеек и направлением в виде чисел 0,1,2,3, которые соответствуют движению вверх, вниз, вправо и влево.

  3. Квадродерево. Основано на квадратных группах ячеек растра. В этом случае вся карта последовательно делится на квадраты с одинаковым значением атрибута внутри, и квадрата, если один из них однороден, т.е. содержит ячейки с одним значением, то он записывается и больше не делится. Каждые оставшиеся квадраты проверяются на однородность => делятся (однородные), пока вся карта не будет записана как множество квадратных групп ячеек). Мельчайшим квадратом является ячейка растра. Система с переменным разрешением – система квадродерева.

  4. Векторный метод. Векторная модель данных показывает только геометрию объектов. Это цифровое представление точечных, линейных и полигональных объектов в виде набора координатных пар.

Векторно-нетопологическая модель (спагетти-модель). Число слоев может быть большим.

Векторно-топологическая модель. Топология описывается набором узлов и дуг. Узел – пересечение двух или более дуг. Каждая дуга начинается в точке пересечения узлов, не принадлежащих друг другу, в точке с другой дугой. Дуги образуются последов. отрезков, соседних промежутков. Каждая линия имеет 2 набора чисел. Каждая дуга имеет свой идентификационный номер. Области, ограниченные дугами, также имеют идентифицирующие их коды, которые используются для определения их отношений с дугами. Каждая дуга имеет информацию о номере областей слева и справа от нее. Это позволяет компьютеру знать действительное отношение между графическими объектами.


Векторная модель (TIN-модель) для представления поверхности. Каждая точка имеет свою высоту. Для описания рельефа.

Методы сжатия векторных данных

Цепочечные коды Фрэнсиса Гальтона и Фримена-Хофмана.

Форматы данные, используемые в ГИС

Растровые форматы:

TIFF – большая глубина цвета; PNG – лучше всего подходит для карт; JPEG, GIF – 8 бит на pix; BMP, WMF, PCX, GeoSpot, GeoTIFF, MrSID, F1M – роскартография; SYE – венно-топографическая служба; GeoJSON – открытый формат, предназначенный для хранения географических структур данных, основанных на JSON.

Основные обменные форматы:

SHP, EOO, GEN (ESPI), VEC (IDRISI), MIF (MapInfo Corp), DWG, DXF, WMF (Microsoft), DGN (Bentley)

Лекция №4 (17.03.2021)

Основы баз данных

База данных – совокупность данных некоторой предметной области, структурируемых и организованных по правилам, устанавливающих общие принципы описания, хранения и управления данными.

Ядром любой БД являются модели данных.

Модель данных – совокупность правил порождения структур данных в БД, операций над ними, а также ограничений целостности, определяющих допустимые связи и значения данных и последовательности их изменения.

Таким образом в модель данных входят 3 составляющие:

  1. Средство для организации данных

  2. Операции для обработки и манипулировании данными

  3. Ограничения, обеспечивающие целостность данных

Классификация моделей данных



В ГИС для организации пространственных данных применяются теоретико-графовые и теоретико-множественные модели.

Теоретико-графовые модели отражают совокупность объектов реального мира в виде графо-взаимосвязанных информационных объектов.

В зависимости от типа графа различают иерархическую и сетевую модели.

Иерархическая модель данных представляет собой совокупность элементов данных, расположенных в порядке их подчинения и образующих по структуре перевернутое дерево. К основным понятиям этой модели относится уровень, узел и связь.



Узел – совокупность атрибутов данных, описывающих информационный объект.



Иерархическая структура должна удовлетворять следующим требованиям:

- каждый узел на более низком уровне связан только с одним узлом, находящимся на более высоком уровне;

- существует только один корневой узел на самом верхнем уровне, не подчиненный никакому другому узлу;

- каждому узлу существует только один путь от корневого узла.

Атрибут (элемент данных, поле) – наименьшая неделимая единица данных, доступная пользователю.

Сетевая модель (ЧАРЛЬЗ БАХМАН)

Сетевая модель – это структура, каждый элемент которой может быть связан с любым другим элементом.



Сетевая модель основана на тех же понятиях, что и иерархическая модель – уровень, узел и связь.

Кроме данных, записи содержат указатели, определяющие местоположение других записей, связанных с ними.

Сетевые модели используют отношения многие ко многим, при котором один объект может иметь множество атрибутов, а каждый из них связан со множеством объектов. Такие модели трудно редактировать, например, удалять записи, так как вместе с данными нужно редактировать и указатели.

Реляционная модель данных - представляет собой совокупность множества взаимосвязанных «отношений».

Предложен Эдгаром Коддом в 1970 г.



Отношения в БД графически интерпретируются в виде таблицы, столбцы которой соответствуют атрибутам и называются полями. Строки соответствуют кортежам и называются записями.



Таблица – это совокупность записи одной структуры.

Запись (строка в таблице, кортеж) – совокупность логически связанных полей.

Поле (столбец в таблице, атрибут) – элементарная единица логической организации данных.

Для описания полей используются характеристики:

- имя;

- тип поля (символьный, логический, числовой, денежный, календарный);

- длина (в байтах или символах);

- точность (количество знаков после запятой).

Все таблицы характеризуются набором
свойств:

- в таблице нет двух одинаковых строк;

- все столбцы в таблице однородны (все элементы в столбце имеют одинаковую тип и длину);

- каждый атрибут в отношении имеют уникальное имя;

- порядок строк и столбцом в таблице произвольный.

Так как строки в реляционной таблице не упорядочены, то нельзя выбрать строку по ее порядковому номеру в таблице. Поэтому для однозначного определения записи в таблице все поля в таблице подразделяют на ключевые и описательные.

Ключевое поле (первичный ключ) – поле, каждое значение которого однозначно определяет соответствующую запись. Если в таблице имеет только одно ключевое поле, то такая таблица имеет простой ключ. Если записи однозначно определяются значениями нескольких полей, то такая таблица имеет составной ключ.

В силу того, что в таблицах реляционной БД допускается произвольный порядок столбцов, возникает необходимость в такой группировке полей, при которой обеспечивалось бы минимальное дублирование данных и упрощение процедур их обработки и управлений. Для этого используется аппарат нормализации отношений.

Нормализация отношений – механизм последовательного преобразования таблиц в совершенной нормальной форме.

Домен – множество значений, которые может принимать некоторый атрибут.

В БД связи между отношениями поддерживаются через наборы атрибутов, который называются внешними ключами или внешними ключевыми полями.

Внешний ключ – столбец одной таблицы, значения в котором совпадают со значениями столбца, являющегося первичным ключом для одной таблицы.

Связи 1:1 предполагают, что одной записи таблицы А, соответствуют не более одной записи таблицы B и наоборот.

При типе связей 1:М (ко многим) одной записи таблицы C соответствует 0, 1 или более записей таблицей B, но одна запись таблице B связана не более чем с одной записью таблицы C.

Связь М:М предполагает, что одной записи таблице C соответствует 0, 1 и более записей таблицы B и наоборот.

Достоинства и недостатки реляционных моделей

Достоинства реляционной модели:

* простота и доступность для понимания пользователем. Единственной используемой информационной конструкцией является "таблица";

* строгие правила проектирования, базирующиеся на математическом аппарате;

* полная независимость данных. Изменения в прикладной программе при изменении реляционной БД минимальны;

* для организации запросов и написания прикладного ПО нет необходимости знать конкретную организацию БД во внешней памяти.


Недостатки реляционной модели:

* далеко не всегда предметная область может быть представлена в виде "таблиц";

* в результате логического проектирования появляется множество "таблиц". Это приводит к трудности понимания структуры данных;

* БД занимает относительно много внешней памяти;

* относительно низкая скорость доступа к данным.

Система управления БД (СУБД)

Создание БД, её поддержка, обеспечение доступа пользователя к информации осуществляется с помощью специального инструмента, который называется СУБД.

Т.о. СУБД – комплекс программных и языковых средств, необходимых для создания БД, а также поддержания их в рабочем состоянии и организации поиска необходимой информации.

Современные СУБД классифицируется в соответствии с используемой моделью данных и в зависимости от объема, поддерживаемых БД и используемого числа пользователей.

СУБД подразделяются на высший уровень, средний, низший и настольные СУБД.

Высший уровень СУБД поддерживают крупные БД, сотни и тысячи Гб и более, обслуживающие тысячи пользователей.

Средний уровень поддерживают БД до нескольких сотен Гб и обслуживают сотни пользователей.

Нижний уровень составляют системы, которые поддерживают БД до 1 Гб и имеют менее 100 пользователей. Их используют в небольших подразделениях.

Настольные СУБД предназначены для 1 пользователя, применяются для ведения настольной БД. Они имеют ограниченные возможности по обработке данных и у них отсутствует возможность установки в сети.

Среди основных функций СУБД принято выделять следующие:

- управление данными во внешней памяти, структурируя ее как для хранения данных в БД, так и для служебных целей, например для убыстрения доступа к данным;

- управления буферами оперативной памяти, создаваемыми для устранения зависимости от скорости работы устройств внешней памяти;

- операции над БД заключающиеся в обеспечении эффективности управлениями транзакциями.

Транзакция – неделимая с точки зрения воздействия на БД последовательность операций манипулирования данными, рассматриваемая СУБД как единое целое.

- обеспечение надежности хранения данных в БД. Заключается в способности СУБД восстанавливать состояние после аппаратного или программного сбоя.

- поддержка специального языка управления БД.

Этапы проектирования базы данных

В процессе проектирования базы данных выделяют 3 основных этапа (уровня