-
Задачи кластеризации. Постановка
задачи, базовые алгоритмы решения,
достоинства и недостатки. Применение
задачи кластеризации в банковской
сфере.
Кластеризация - Разбиение множества
документов к некоторой категории
Методы:
Декомпозиция (разделение, k-клатеризация)
В этих методах изначально каждый
объект связан только с одной
группой-кластером
Иерархическая кластеризация
В этом случае каждая группа большего
размера состоит из групп меньшего
размера. Группы (кластеры) иерархически
связаны
-
Классификация – это отнесение
объекта к одному из заранее известных
классов (множеств, типов и т.д.)
-
Кластеризация – это разделение
множества исходных объектов на классы
(кластеры), число которых заранее не
определено.
Кластеризацию используют, когда
отсутствуют априорные сведения
относительно классов, к которым можно
отнести объекты исследуемого набора
данных, либо когда число объектов
велико, что затрудняет их ручной
анализ.
Постановка задачи кластеризации
сложна и неоднозначна, так как:
-
оптимальное
количество кластеров в общем случае
неизвестно;
-
выбор
меры «похожести» или близости свойств
объектов между собой, как и критерия
качества кластеризации, часто носит
субъективный характер
Цели:
-
Сжатие данных.
-
В случае, когда данные имеют большой
объем, кластеризация позволяет
сократить объем хранимых данных,
оставив по одному наиболее типичному
представителю от каждого кластера.
-
Прогнозирование.
имеющихся объектов, но и для распознавания
новых. Каждый новый объект относится
к тому кластеру, присоединение к
которому наилучшим образом удовлетворяет
критерию качества кластеризации.
Значит, можно прогнозировать поведение
объекта, предположив, что оно будет
схожим с поведением других объектов
кластера.
-
Обнаружение аномалий.
-
Кластеризация применяется для
выделения нетипичных объектов. Эту
задачу также называют обнаружением
аномалий (outlier detection).
-
Интерес здесь представляют кластеры
(группы), в которые попадает крайне
мало, скажем один-три, объектов
Цель кластеризации – построить
оптимальное разбиение объектов на
группы:
Алгоритмы:
-
Иерархические алгоритмы
-
Минимальное покрывающее дерево
-
k-Means
алгоритм (алгоритм k-средних)
-
Метод ближайшего соседа
-
Алгоритмы нечеткой кластеризации
-
Применение нейронных сетей
-
Генетические алгоритмы
-
Метод закалки
Применение:
-
Анализ данных (Data mining)
-
Группировка и распознавание объектов
-
Распознавание образов
-
Группировка объектов
-
Извлечение и поиск информации
2. Метод сетевого планирования.
Временные параметры работ. Диаграмма
Гантта. Профили ресурсов. Методика
разработки оптимального плана проекта.
Ориентированный
граф – множество
точек и ориентированных дуг, соединенных
между собой.
Сеть
– область ориентированного графа,
ограниченная точками.
Сетевая модель
– сеть, моделирующая определенный
процесс; направления дуг в ней
соответствуют логике процесса.
Событие
– получение результата.
Работа
– любая деятельность.
Основа метода сетевого
планирования и управления
- графоаналитический метод из
математики.
Основа построения
модели деятельности по проекту
- ориентированный граф, отражающий
определенный процесс в виде работ и
событий.
Граф
- множество точек и ориентированных
дуг, соединенных между собой.
Сетевая модель
(сценарий, топология) работ
– последовательность взаимосвязанных
работ и событий для достижения
поставленной цели проекта.
Существуют две
разновидности сетевой модели:
• сеть типа
«вершины-события»
• сеть типа
«вершины-работы»
Cеть типа «вершины-события»
Исходное событие –
событие, с которого начинается любой
комплекс работ.
Начальное событие –
событие, с которого начинается
элементарная работа.
Конечное событие –
событие, которым заканчивается
элементарная работа.
Завершающее событие
– событие, которым завершается любой
комплекс работ.
Параметры события
Раннее начало
(
) – дата, раньше которой работа не
может начаться.
Раннее окончание
(
) – дата, раньше которой работа не
может закончиться.
Позднее начало
(
) – дата, позже которой работа не может
начаться.
Позднее окончание
(
) – дата, позже которой работа не может
закончиться.
Продолжительность
( ti
) – время,
в течение которого выполняется работа
(i ).
Свободный резерв
работы ( ri
) – максимальное
время, на которое можно задержать
выполнение работы без нарушения
ранних сроков начал последующих
работ.
Полный резерв работы
(R)
– сумма всех свободных резервов
работ, которые следуют за данной
работой.
Полный резерв пути
( rп
) – сумма всех свободных резервов на
этом пути (разность между длительностями
критического пути и этого пути).
Запаздывание
(задержка) (+ z )
– время, на
которое можно задержать начало
выполнения следующей работы. Можно
увеличить длительность работы.
Опережение (
- z ) –
время, на которое можно раньше начать
следующую работу. Можно сделать
соединение двух работ «начало-начало»
с запаздыванием одной из них.
Диаграмма Гантта
служит для
графического отображения временных
параметров работ.
На диаграмме Гантта
в компьютерном варианте отображаются:
-
плановые и фактические
длительности на временной оси;
-
типы работ в разном
представлении;
-
временные резервы;
-
связи между работами;
-
запаздывание и
опережение;
-
ресурсы и пр.
Основные характеристики
ресурса:
-
наличное количество
(порог, доступность);
-
интенсивность
использования (% занятости);
-
стоимость (стандартная
ставка в ед. времени, ставка свехурочных);
-
стратегия оплаты
ресурса (в начале, в конце,
пропорциональное);
-
доступность ресурса
в соответствии с календарем и рабочим
временем;
-
отнесение ресурса к
определенной группе и пр.
Назначение ресурсов
работам – это
приписывание каждой работе конкретных
ресурсов для ее выполнения.
Назначение ресурсов
работам проекта
Назначение ресурсов
нескольким проектам
Особенности назначения
ресурсов
-
Назначение ресурсов
не влияет на длительность работ с
фиксированной длительностью.
-
Назначение ресурсов
влияет на длительность работ с
фиксированным объемом работ. Увеличение
количества ресурсов ведет к уменьшению
длительности работы, и наоборот.
Ресурсы, назначенные на подобные
работы, могут регулироваться
автоматическим способом.
-
Для составных работ
назначаются ресурсы, которые
непосредственно не участвуют в
процессе. Эти ресурсы автоматически
не регулируются.
Профиль ресурса.
Конфликт ресурса
Профиль ресурса –
отображение на диаграмме интенсивности
потребления ресурса на протяжении
всего времени выполнения проекта.
Порог
– наличное количество ресурсов,
отображаемое на диаграмме сплошной
линией.
Конфликт ресурсов
– это превышение количества назначенных
работе ресурсов над их наличием
(превышение порога).
Конфликты ресурсов
устраняются ручным или автоматическим
(заложенным в программе) способом.
Выравнивание загрузки
ресурсов –
процедуры устранения конфликтов и
недогрузки ресурсов и обеспечения
на протяжении всего времени постоянного
профиля ресурса (равномерности
загрузки ресурсов).
Диаграмма профиля
ресурса
Оптимальный план
проекта – план,
в котором обеспечено выполнение
критерия: минимизированы стоимость
и время выполнения проекта, спланирована
равномерная и максимальная загрузка
ресурсов, соблюдены требования по
качеству продукции проекта.
Разработка оптимального
плана – итерационный процесс.
Разрабатывается несколько вариантов
плана проекта. Результаты заносятся
в матрицу принятия решения. Далее
проводится сопоставительный анализ
результатов по всем вариантам и
выбирается из них с точки зрения
поставленного критерия наиболее
приемлемый.
Матрица принятия
решений
Стратегии планирования
-
Ограничения на сроки
выполнения работ и, как следствие,
на дату окончания. Возможно появление
конфликтов ресурсов, которые
устраняются различными методами.
-
Ограничения на наличные
ресурсы. Планирование ведется без
учета ограничений на время окончания.
Устранение конфликтов за счет
разнесения во времени параллельных
работ.
-
Комбинированное
использование первых двух стратегий.
Методы автоматического
устранения конфликтов ресурсов для
параллельных работ фиксированного
объема
-
Автоматический –
отнесение срока окончания проекта
на более поздний.
-
По резерву
(полуавтоматический) – использование
резерва на некритическом пути при
сохранении установленного срока
окончания проекта.
Методы эвристического
(ручного) выравнивания загрузки
ресурсов для параллельных работ
фиксированного объема
-
Использование гибкой
связи за счет резерва времени.
Жесткая связь –
соединение концов или начал работ.
Гибкая связь – соединение концов или
начал работ с использованием задержки
или опережения. Разнесение конфликтующих
работ во времени за счет задержки или
опережения, резервов работ.
-
Увеличение интенсивности
использования ресурсов.
Использование
дополнительных ресурсов. Время
выполнения работы уменьшается.
Уменьшение интенсивности использования
ресурсов.
Снятие с работы ресурсов
при условии, что имеются резервы
работ. Время выполнения работы
увеличивается.
-
Перераспределение
взаимозаменяемых ресурсов.
Ресурсы, превышающие
порог, снимаются с работы. Назначается
соответствующее количество
взаимозаменяемых ресурсов.
-
Определение фоновых
работ.
Разделение работы на
части и ее выполнение по мере
освобождения ресурсов.
-
Задание приоритетов.
Порядок очередности
использования недостающих ресурсов
определяется назначенным работе
приоритетом.
3. Реализовать просмотр
данных из таблиц базы данных, связанных
отношениями «один-ко-многим».
SqlConnection
cnn
=new
SqlConnection(@"СТРОКА
ПОДКЛЮЧЕНИЯ");
DataSet
ds
=
new
DataSet();
SqlDataAdapter
daEmp
=
new
SqlDataAdapter();
SqlDataAdapter
daSal
= new
SqlDataAdapter();
private
void Form9
Load(object sender, EventArgs
e)
{
//СОЗДАЙТЕ
АДАПТЕРЫ
ДАННЫХ:
daEmp.SelectCommand
= new
SqlCommand("select
* from Employees", cnn);
daSal.SelectCommand
=
new
SqlConmand("select
* from Salaries", cnn);
//В
ФОРМЕ РАЗМЕСТИТЕ ЭЛЕМЕНТЫ УПРАВЛЕНИЯ
DataGridViewl
и DataGridView2
//и
ЭЛЕМЕНТЫ, ПОДДЕРЖИВАКЩ1Е СВЯЗИ МЕЖДУ
НИМИ BindingSourcel
и BindingSource2.
//УКАЖИТЕ
ИСТОЧНИКИ ДАННЫХ ДЛЯ ЭТИХ ЭЛЕМЕНТОВ:
dataGridViewl.DataSource
= bindingSourcel; dataGridView2.DataSource =
bindingSource2;
//ВЫЗОВИТЕ
МЕТОД FILLQ
ДЛЯ ЗАПОЛНЕНИЯ DataSet
daEmp.Fill(ds,
"Employees");
daSal.Fill(ds,
"Salaries");
//УСТАНОВИТЕ
СВЯЗЬ
МЕЖДУ
ЗАГРУЖЕННЫМИ
ТАБЛИЦАМИ
ds.Relations.Add("E_S“,
ds.Tables["Employees"].Columns["EmpId"],
ds.Tables["Salaries"].Columns["EmpId"]);
//УСТАНОВИТЕ
СВЯЗИ
ДЛЯ
ЭЛЕМЕНТОВ
Binding bindingSourcel.DataSource
=
ds.Tables["Employees"];
bindingSource2.0ataSource
= bindingSourcel; bindingSource2.DataMember="E_S“;
}
|