ВУЗ: Омский государственный технический университет
Категория: Книга
Дисциплина: Методы оптимальных решений
Добавлен: 12.02.2019
Просмотров: 13047
Скачиваний: 110
211
Крантц [86] аксиоматизировал альтернативные процессы, связывающие стимулы
с суждениями, и получил теоремы существования для шкал отношений. Подобная
аксиоматизация не была распространена на иерархии шкал отношений.
Некоторые исследователи подошли к проблеме шкалирования так, как если бы
познавательное пространство стимулов было бы по существу многомерным, однако
вместо этого мы выбираем иерархическую декомпозицию этой многомерной структу-
ры, чтобы установить количественные, а также качественные отношения между ве-
личинами. Отдельные величины в решениях многомерного шкалирования функцио-
нально напоминают отдельные собственные векторы на каждом уровне нашей ие-
рархии.
Формально задача построения шкалы в виде нормализованного собственного
вектора
ω
в уравнении
A
ω λω
=
(для максимального
λ
) подобна выделению пер-
вой главной компоненты. Когда экспертов просят заполнить клетки только одной
строки или одного столбца, а другие клетки вычисляются по ним (для обеспечения
«совершенной согласованности»), первое собственное значение
n
воспроизводит,
100% изменения матрицы. Если «совершенная согласованность» накладывается на
данные за исключением того, что к каждой клетке матрицы добавляется нормально
распределенная случайная компонента, то теория приводит к анализу главных фак-
торов, и получится «однофакторное» решение. Следовательно, если совершенная
согласованность навязывается экспериментатором, то получается неинтересный ре-
зультат точного шкалирования, которое было гарантировано, когда эксперимент
представлялся в виде одного сравнения. В действительности можно убедиться, что
если субъект заполняет только одну строку или столбец матрицы и если задачей
субъекта является генерация отношений между парами стимулов, то процедура
формально эквивалентна тому, как если бы субъекты располагали каждый стимул
вдоль полупрямой с нулём на одном конце: это и есть метод «непосредственной ин-
тенсивности» психофизического шкалирования.
Не существует простого взаимоотношения между решением, полученным с по-
мощью собственного значения, и решениями, полученными методом наименьших
квадратов, хотя имеются статьи (например, [31, 72, 80]), в которых рассматривается
аппроксимация матрицы данных матрицей более низкого ранга, минимизирующей
сумму квадратов разностей. В общем случае оба решения одинаковы при наличии
согласованности. Общепринятого критерия сравнения не существует. Следователь-
но, неясно, какой из методов лучше. Повторные применения процедуры нахождения
собственного значения помогают достичь согласованности, которая является наибо-
лее предпочтительным для нас критерием.
В [164] предлагается метод «определения параметров функционального отноше-
ния посредством факторного анализа». Однако утверждается, что «задача вращения
осей остается нерешённой...», т. е. факторный анализ определяет параметры только
в пределах линейного преобразования. В [24] обсуждаются методы определения та-
ких преобразований, где априорный теоретический анализ или наблюдаемые вели-
чины позволяют сформулировать критерий, по отношению к которому происходит
вращение решения относительно произвольного фактора.
Иерархическая композиция является индуктивным обобщением следующей идеи.
Заданы веса независимых элементов одного уровня. По отношению к каждому эле-
менту заданного уровня формируется матрица собственных векторов-столбцов эле-
ментов уровня, находящегося непосредственно ниже заданного. Затем вектор весов
элементов этого уровня используется для взвешивания соответствующих собствен-
ных векторов-столбцов. Умножая матрицу собственных векторов на вектор-столбец
весов, получаем составной вектор весов элементов нижнего уровня.
Так как матрица собственных векторов не является ортогональным преобразова-
нием, в общем случае результат не может быть интерпретирован как вращение. В
действительности, вектор в единичном
n
-мерном симплексе умножается на стохас-
тическую матрицу. В результате получаем другой вектор в единичном симплексе.
212
Алгебраисты часто указывают на отличие задач, в которых алгебра имеет структур-
ную геометрическую интерпретацию, от задач, в которых она служит удобным мето-
дом проведения вычислений. Статистические методы имеют удобную геометриче-
скую интерпретацию в отличие от методов возмущений, которые часто ею не обла-
дают.
В работе [61] проявлен интерес к поведению экспертов в ситуациях, включаю-
щих как линейные, так и нелинейные отношения между стимулами, после чего де-
лается заключение, что процесс индуктивного вывода в основном линейный. В на-
шей модели реакция экспертов на линейные и нелинейные сигналы кажется адек-
ватно отраженной в описанном в этой книге методе парного шкалирования с при-
влечением подхода иерархической декомпозиции для агрегирования элементов, по-
падающих в сравнимые классы в соответствии с возможным диапазоном шкалы
сравнений.
Отметим, что мы подходим к решению проблемы интеграции информации, кото-
рая обсуждалась в [4], путем формулирования задачи о собственном значении,
имеющей линейную структуру. Однако сама шкала, определяемая собственным век-
тором, является в значительной степени нелинейной функцией данных. Процесс по-
строения собственного вектора включает сложные операции, состоящие из сложе-
ния, умножения и усреднения. Чтобы ощутить эту сложность, можно проверить спо-
соб получения собственного вектора как предельного решения нормализованных
строчных сумм степеней матрицы.
В [4] также акцентируется внимание на том, что принятая шкала реакции долж-
на удовлетворять критерию, который налагает алгебраическая модель суждений.
Таким критерием в нашем случае вновь оказывается согласованность.
Наконец, может быть полезным краткое рассмотрение графо-теоретического
подхода к согласованности. Направленный граф с
n
вершинами, который предпола-
гается полным (так как любая пара его вершин соединяется направленной дугой),
называется турниром. Его можно использовать для представления доминантных
парных сравнений между
n
объектами, тогда контуры будут представлять нетранзи-
тивность. Например, каждые три вершины определяют треугольник, но не все тре-
угольники образуют 3-контуры. Число контуров заданной длины используется для
определения индекса нетранзитивности данного порядка, например тройки или чет-
вёрки. Несогласованность определяется (см. [100]) в зависимости от отношения
числа трех, четырех или более контуров в заданном графе к максимальному числу
контуров данного порядка. Для 3-контуров максимальное число будет
(
)
3
24
n
n
−
для нечетного
n
и
(
)
3
4
24
n
n
−
– для четного
n
; для 4-контуров оно будет
(
)
(
)
3
3 48
n
n n
−
−
для нечетного
n
и
(
)
(
)
3
4
3 48
n
n n
−
−
для четного
n
. Эти резуль-
таты не были обобщены на
k
-контуры. Тем не менее среднее число
k
-контуров для
случайной ориентации дуг полного графа –
(
)
( )
( )
1 !
1 2
k
n
k
k
−
. До сих пор не найдена
зависимость между этим определением несогласованности и нашим, относящимся к
собственному значению. Непохоже, что зависимость будет найдена. Приведённый
выше результат для 3-контуров вместе с его статистическими следствиями принад-
лежит Кендаллу. Он подробно обсуждается в обычной статистической справочной
литературе (см., например, [108]).
Выше мы ссылались на анализ главных компонент. Обсудим кратко эту процеду-
ру.
Рассмотрим случайный вектор
X
с
p
компонентами, вектор с нулевым средним
и ковариационной матрицей
C
. Распределение
X
неизвестно. Пусть
b
есть
p
-
213
компонентный вектор-столбец,
1
T
b b
=
; тогда
( )
(
)
2
T
T
T
T
E b X
E b XX b
b Cb
=
=
обозна-
чает операцию математического ожидания.
Нормализованные линейные комбинации
T
b X
с максимальной дисперсией при
условии
1
T
b b
=
получаются из функции Лагранжа, определенной в виде
(
)
1
T
T
b Cb
b b
λ
=
−
,
где
λ
– множитель Лагранжа.
Приравнивая производную по
b
нулю, получаем уравнение
(
)
C
I b O
λ
−
=
,
нетривиальным решением которого будет
λ
– собственное значение
C
.
Если умножить эти выражения на
T
b
и использовать условие ограничения, то
получим
T
T
b Cb
b b
λ
λ
=
=
. Это показывает, что
λ
является дисперсией величины
T
b X
. Поэтому в качестве максимальной дисперсии нам следует использовать
max
λ
.
Если нормализовать соответствующее решение
1
b
, разделив его на сумму квадратов
коэффициентов, то получим
1
T
b X
в качестве нормализованной линейной комбина-
ций с максимальной дисперсией. Затем получаем новую нормализованную комбина-
цию
T
b X
с максимальной дисперсией всех линейных комбинаций, некоррелирован-
ных с
T
b X
, т. е.
(
) (
)
1
1
1
max
1
0
T
T
T
T
T
T
E b Xb X
E b XX b
b Cb
b b
λ
=
=
=
=
.
Однако
max
max 1
Cb
b
λ
=
и, следовательно,
T
b X
ортогонально к
max
T
b X
. Используя
1
0
T
b b
=
в качестве нового ограничения, образуем новую функцию Лагранжа.
(
)
(
)
1
1
2
T
T
T
b Cb
b b
b Cb
α
β
=
− −
с множителями Лагранжа
α
и
β
. Действуя таким образом, можно показать, что
0
β
=
и
α
будет вторым наибольшим собственным значением
C
. (Отметим, что по-
скольку
C
как ковариационная матрица симметрична, все её собственные значения
деиствительны). Действуя как и прежде, теперь получим соответствующий собст-
венный вектор при условии, что
T
b X
имеет максимальные дисперсии из всех нор-
мализованных линейных комбинаций, не коррелированных с
1
T
b X
и
2
T
b X
и т. д.
Когда собственные векторы получены таким образом, отношение каждого собст-
венного значения ко всей сумме собственных значений представляет долю всей
дисперсии, отраженную в соответствующих компонентах. Поэтому первым (и прак-
тически важным) приближением считают главную компоненту и ищут изменения в
условиях, ведущих к изменениям в выражении
1
T
b X
.
В [115] сделана попытка определить влияние отдельных журналов, проверяя
число цитирований. Устанавливается матрица цитирования числа статей из каждого
журнала, упомянутого в каждом источнике. Столбцы затем нормализуются, чтобы
принять во внимание различные размеры журналов. Далее следует вычисление ве-
сов влияние в соответствии с разработанной ими процедурой нахождения собствен-
ного вектора общей матрицы (которая не ориентирована на шкалу отношений).
214
9.5. ПОДХОД, ОСНОВАННЫЙ НА ВОЗМУЩЕНИЯХ:
МЕТОД ЛОГАРИФМИЧЕСКИХ НАИМЕНЬШИХ КВАДРАТОВ
В случае несогласованности задачу можно поставить следующим образом:
определить такие
1
2
,
,
,
n
ω ω
ω
…
, чтобы
(
)
( )
,
; ,
;
,
,
i
ij
ij
i
j
i
j
i
j
ij
j
a
f
g
ω
ω ω α α
ω ω
ω
−
=
⋅
…
,
где для параметров возмущения имеем
( )
lim
1
ij
g
⋅ =
.
Здесь аргумент в
( )
ij
g
⋅
включает те же самые переменные и параметры, что и
ij
f
. Отметим, например, что мультипликативный параметр следует устремить к еди-
нице, а аддитивный параметр – к нулю. Другими словами, если есть надежда вос-
становить хорошие оценки
i
j
ω ω
из
ij
a
, то возмущения должны быть малы. Отме-
тим, например, что
1
1
i
i
i
i
i
i
i
i
ij
j
j
j
j
j
i
i
i
a
α ω
ω α
α ω
α ω
ω α
α ω
+ ω
+ ω
=
=
+ ω
+ ω
(9.1)
Можно зависать (9.1) в виде
ij
j
i
ij
a
g
ω ω
=
. (9.2)
Это основная, недоопределённая система
2
n
уравнений с
2
n
n
+
переменными
j
ω
и
ij
g
, требуется
n
дополнительных уравнений относительно
ij
g
, чтобы система
стала разрешимой. Выбор этих отношений может быть свободным. Тем не менее
оказывается, что эти
n
отношений могут быть получены, если основываться на вы-
ходе, связанном с возмущением рассмотренного выше идеального случая. Исходя из
соображений о генераторе бесконечно малых величин требуем, чтобы следующая
система соотношений всегда выполнялась:
max
1
n
ij
j
g
λ
=
=
∑
,
1,
,
i
n
= …
,
и множество этих условий зависит от
( )
ij
A
a
=
.
Задача 1: Найти
i
ω
,
1,
,
i
n
= …
, которые удовлетворяют
max
1
n
ij
j
i
j
a
ω
α ω
=
=
∑
,
1,
,
i
n
= …
. (9.3)
Системы соотношений (9.2), а также (9.3), часто используются в качестве необ-
ходимых условий, возникающих при решении задачи оптимизации. Например, (9.2)
можно записать в виде
(
)
log
log
ij
j
i
ij
a
g
ω ω
=
; возводя в квадрат обе стороны этого
равенства и суммируя по
i
и
j
, получим задачу минимизации ошибки относительно
i
ω
,
1,
,
i
n
= …
.
Задача 2 заключается в нахождении
i
ω
, которые минимизируют
(
)
(
)
2
2
, 1
,
1
log
log
log
n
n
ij
j
i
ij
i j
i j
a
g
ω ω
=
=
−
=
∑
∑
.
Это – задача логарифмических наименьших квадратов. Однако она имеет точно
такое же решение
215
1/
1/
1/
1
1
1
n
n
n
n
n
n
i
ij
j
ij
j
j
j
a
a
ω
ω
=
=
=
=
=
∑
∏
∏
, если
1
ji
ij
a
a
=
,
которое получается при рассмотрении произведения по
j
в обеих частях (9.2) при
условии
1
1
n
ij
j
g
=
=
∑
– системы
n
условий, не зависимых от
( )
ij
A
a
=
. Это решение мо-
жет быть интерпретировано как решение, порождающее ближайшую согласованную
матрицу к заданной матрице в смысле логарифмических наименьших квадратов.
В статистике анализ главных компонент использует систему (9.3) в качестве не-
обходимых условий для задачи оптимизации следующего типа. Минимизировать
квадратическую форму
(
)
1
,
1
,
,
n
n
ij
i
j
i j
f
a
ω
ω
ω ω
=
=
∑
…
,
ji
ij
a
a
=
,
при условии
(
)
2
1
1
,
,
1
n
n
i
i
g
ω
ω
ω
=
=
=
∑
…
.
Лагранжиан этой задачи будет
(
)
(
)
1
,
,
;
1
n
L
f
g
ω
ω λ
λ
≡ −
−
…
.
Параметр
λ
появляется в задаче как множитель Лагранжа (который также явля-
ется параметром возмущения в задаче оптимизации), а не как собственно параметр,
как в (9.3). Действительно, можно построить широкий класс задач оптимизации, ис-
пользуя (9.2) или (9.3) в качестве системы необходимых условий.
Полезно взять уравнения возмущений (9.2) и создать таблицу условий, налагае-
мых на различные методы вместе с соответствующими решениями. Назовём левый
собственный вектор, который является решением задачи, сформулированной в тер-
минах гармонического среднего, вектором антиприоритетов. Он представляет меру
того, насколько элемент доминируется другими элементами того же уровня. Соот-
ветствующий вектор, полученный посредством иерархической композиции, измеряет
воздействие иерархии на каждый элемент уровня (см. табл. 9.1).
Замечание. Решения задачи логарифмических наименьших квадратов, связан-
ной с двумя матрицами оптического примера из гл. 2, будут (0,61; 0,24; 0,10; 0,05)
и (0,61; 0,23; 0,10; 0,06).
Если связать арифметические, геометрические и гармонические средние в нашей
задаче шкалирования, то табл. 9.1 легко объясняется.