ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.11.2020
Просмотров: 2502
Скачиваний: 17
170
Глава 4. Статистические методы в политическом анализе
ных вопросов повестки дня на голосование выносятся: а) законопро
ект, предлагающий восстановить памятник В.И. Ленину на централь
ной площади города — административного центра региона; б) обра
щение к Президенту РФ с требованием вернуть в государственную
собственность все стратегические производства. Матрица сопряжен
ности показывает следующее распределение голосов депутатов:
Памятник Ленину
(за)
Памятник Ленину
(против)
Обращение к Президенту
(за)
49
4
Обращение к Президенту
(против)
6
41
Очевидно, что голосования статистически связаны: подавляющее
большинство депутатов, поддерживающих идею восстановления па
мятника Ленину, поддерживают и возвращение в государственную соб
ственность стратегических предприятий. Аналогичным образом боль
шинство противников восстановления памятника являются в то же
время и противниками возврата предприятий в госсобственность. При
этом тематически голосования между собой совершенно не связаны.
Логично предположить, что выявленная статистическая связь
обусловлена существованием некоторого скрытого (латентного) фак
тора. Законодатели, формулируя свою точку зрения по самым разно
образным вопросам, руководствуются ограниченным, небольшим на
бором политических позиций. В данном случае можно предположить
наличие скрытого раскола депутатского корпуса по критерию под
держки/отвержения консервативно-социалистических ценностей.
Выделяется группа «консерваторов» (согласно нашей таблице сопря
женности — 49 депутатов) и их оппонентов (41 депутат). Выявив такие
расколы, мы сможем описать большое число отдельных голосований
через небольшое число факторов, которые являются латентными в
том смысле, что мы не можем их обнаружить непосредственно: в на
шем гипотетическом парламенте ни разу не проводилось голосова
ние, в ходе которого депутатам предлагалось бы определить свое от
н о ш е н и е к к о н с е р в а т и в н о - с о ц и а л и с т и ч е с к и м ц е н н о с т я м . Мы
обнаруживаем наличие данного фактора, исходя из содержательного
анализа количественных связей между переменными
1
. Причем, если
в нашем примере сознательно взяты номинальные переменные —
поддержка законопроекта с категориями «за» (1) и «против» (0), — то
Более подробно об использовании факторного анализа в исследовании парламент
ских голосований см.:
Сатаров, Г. А,
Российские съезды // Российский монитор
1992-1993. № 1 - 3 .
4.8. Факторный анализ
171
в действительности факторный анализ эффективно обрабатывает ин
тервальные данные.
Факторный анализ очень активно используется как в политической
науке, так и в «соседних» социологии и психологии. Одна из важных
причин большой востребованности данного метода состоит в разнооб
разии задач, которые можно решать с его помощью. Так, выделяются
по крайней мере три «типовые» цели факторного анализа:
'уменьшение размерности (редукция) данных.
Факторный анализ,
выделяя узлы взаимосвязанных признаков и сводя их к неким обоб
щенным факторам, уменьшает исходный базис признаков описания.
Решение этой задачи важно в ситуации, когда объекты измерены боль
шим числом переменных и исследователь ищет способ сгруппировать
их по смысловому признаку. Переход от множества переменных к не
скольким факторам позволяет сделать описание более компактным,
избавиться от малоинформативных и дублирующих переменных;
•выявление структуры объектов или признаков (классификация).
Эта задача близка к той, которая решается методом кластер-анализа.
Но если кластер-анализ принимает за «координаты» объектов их зна
чения по нескольким переменным, то факторный анализ определяет
положение объекта относительно факторов (связанных групп пере
менных). И н ы м и словами, с помощью факторного анализа можно
оценить сходство и различие объектов в пространстве их корреляци
онных связей, или в факторном пространстве. Координатными осями
факторного пространства выступают полученные латентные пере
менные, на эти оси проецируются рассматриваемые объекты, что по
зволяет создать наглядное геометрическое представление изучаемых
данных, удобное для содержательной интерпретации;
• косвенное измерение.
Факторы, являясь латентными (эмпиричес
ки не наблюдаемыми), не поддаются непосредственному измерению.
Однако факторный анализ позволяет не только выявить латентные
переменные, но и оценить количественно их значение для каждого
объекта.
Рассмотрим алгоритм и интерпретацию статистики факторного
анализа на примере данных о результатах парламентских выборов в
Рязанской области 1999 г. (общефедеральный округ). Для упрощения
примера возьмем электоральную статистику только по тем партиям,
которые преодолели 5%-ный барьер. Данные взяты в разрезе террито
риальных избирательных комиссий (по городам и районам области).
Первым шагом будет
стандартизация данных
путем перевода их в
стандартные баллы (так называемые ^-баллы, рассчитываемые с по
мощью ф у н к ц и и нормального распределения).
172
Глава 4. Статистические методы в политическом анализе
ТИК
(территориальная
избирательная комиссия)
«Ябло
ко»
«Единст
во»
Блок
Жириновского
(БЖ)
ОВР КПРФ СПС
Ермишинская
1,49
35,19
6,12
5,35
31,41
2,80
Захаровская
2,74
18,33
7,41
11,41 31,59 ^ б з "
Кадомская
1,09
29,61
8,36
5,53
35,87
1,94
Касимовская
1,30
39,56
5,92
5,28
29,96 2,37
Касимовская городская 3,28
39,41
5,65
6,14
24,66 4,61
То же в стандартизированных баллах (г-баллах)
Ермишинская
-0,83
1,58
-0,25
-0,91 -0,17 -0,74
Захаровская
-0,22
-1,16
0,97
0,44
-0,14
0,43
Кадомская
-1,03
0,67
1,88
-0,87
0,59
-1,10
Касимовская
-0,93
2,29
-0,44
-0,92 -0,42 -0,92
Касимовская городская 0,04
2,26
-0,70
-0,73 -1,32
0,01
И т.д. (всего 32 случая)
Далее на стандартизированных данных рассчитывается матрица
парных корреляций (интеркорреляций):
«Яблоко» «Единство»
Б Ж
ОВР
К П Р Ф
С П С
«Яблоко»
«Единство»
-0,55
Б Ж
-0,47
0,27
ОВР
0,60
-0,72
-0,47
К П Р Ф
-0,61
0,01
0,10
-0,48
С П С
0,94
-0,45
-0,39
0,52
-0,67
Уже визуальный анализ матрицы парных корреляций позволяет
сделать предположения о составе и характере корреляционных плеяд.
К примеру, положительные корреляции обнаруживаются для «Союза
правых сил», «Яблока» и блока «Отечество — вся Россия» (пары «Яб
локо» - ОВР, «Яблоко» - С П С и ОВР - С П С ) . Одновременно эти
три переменные отрицательно коррелируют с К П Р Ф (поддержка
К П Р Ф ) , в меньшей степени — с «Единством» (поддержка «Един
ства») и в еще меньшей — с переменной БЖ (поддержка «Блока Жи
риновского»). Таким образом, предположительно мы имеем две выра
женные корреляционные плеяды:
• («Яблоко» + ОВР + СПС) — К П Р Ф ;
• («Яблоко» + О В Р + СПС) - «Единство».
4.8. Факторный анализ
173
Это две разные плеяды, а не одна, так как между «Единством» и
К П Р Ф связи нет (0,01). Относительно переменной БЖ предположе
ние сделать сложнее, здесь корреляционные связи менее выражены.
Чтобы проверить наши предположения, необходимо вычислить
собственные значения факторов (eigenvalues), факторные значения
(factor scores) и факторные нагрузки (factor loadings) для каждой пере
менной. Такие расчеты достаточно сложны, требуют серьезных навы
ков работы с матрицами, поэтому здесь мы не станем рассматривать
вычислительный аспект. Скажем лишь, что эти вычисления могут
осуществляться двумя путями: методом главных компонент (principal
components) и методом главных факторов (principal factors). Метод
главных компонент более распространен, статистические программы
используют его «по умолчанию».
Остановимся на интерпретации собственных значений, фактор
ных значений и факторных нагрузок.
Собственные значения факторов для нашего случая таковы:
Фактор
Собственное значение
% общей вариации
1
3,52
58,75
2
1,14
19,08
3
0,76
12,64
4
0,49
S.22
5
0,05
0.80
6
0,03
0,51
Всего
6
100%
Чем больше собственное значение фактора, тем больше его объяс
нительная сила (максимальное значение равно количеству перемен
ных, в нашем случае 6). Одним из ключевых элементов статистики
факторного анализа является показатель «% общей вариации» (% total
variance). Он показывает, какую долю вариации (изменчивости) пере
менных объясняет извлеченный фактор. В нашем случае вес первого
фактора превосходит вес всех остальных факторов, вместе взятых: он
объясняет почти 59% общей вариации. Второй фактор объясняет 19%
вариации, третий — 12,6% и т.д. по убывающей.
Имея собственные значения факторов, мы можем приступить к
решению задачи сокращения размерности данных. Редукция про
изойдет за счет исключения из модели факторов, обладающих на
именьшей объяснительной силой. И здесь ключевой вопрос состоит в
том, сколько факторов оставить в модели и какими критериями при
174
Глава 4. Статистические методы в политическом анализе
этом руководствоваться. Так, явно л и ш н и м и являются факторы 5 и 6,
в совокупности объясняющие чуть более 1% всей вариации. А вот
судьба факторов 3 и 4 уже не столь очевидна.
Как правило, в модели остаются факторы, собственное значение
которых превышает единицу (критерий Кайзера). В нашем случае это
факторы 1 и 2. Однако полезно проверить корректность удаления че
тырех факторов с помощью других критериев. Одним из наиболее
широко используемых методов является анализ «графика осыпи»
(scree plot). Для нашего случая он имеет вид:
1 2 3 4 5 6 7
График получил свое название из-за сходства со склоном горы.
«Осыпь» — геологический термин, обозначающий обломки горных
пород, скапливающиеся в нижней части скалистого склона. «Ска
ла» — это по-настоящему влиятельные факторы, «осыпь» — статисти
ческий шум. Образно говоря, нужно найти место на графике, где кон
чается «скала» и начинается «осыпь» (где убывание собственных
значений слева направо сильно замедляется). В нашем случае выбор
нужно сделать из первого и второго перегибов, соответствующих двум
и четырем факторам. Оставив четыре фактора, мы получим очень вы
сокую точность модели (более 98% общей вариации), но сделаем ее до
статочно сложной. Оставив два фактора, мы будем иметь значитель
ную необъясненную часть вариации (около 22%), но модель станет
лаконичной и удобной в анализе (в частности, визуальном). Таким об
разом, в данном случае лучше пожертвовать некоторой долей точнос
ти в пользу компактности, оставив первый и второй факторы.
Проверить адекватность полученной модели можно с помощью
специальных матриц воспроизведенных корреляций (reproduced corre
lations) и остаточных коэффициентов (residual correlations). Матрица
4.8. Факторный анализ
175
воспроизведенных корреляций содержит коэффициенты, которые
удалось восстановить по двум оставленным в модели факторам. Осо
бое значение в ней имеет главная диагональ, на которой расположены
общности переменных
(в таблице выделены курсивом), которые пока
зывают, насколько точно модель воспроизводит корреляцию перемен
ной с той же переменной, которая должна составлять единицу.
Матрица остаточных коэффициентов содержит разность между
исходным и воспроизведенным коэффициентами. Например, вос
произведенная корреляция между переменными С П С и «Яблоко» со
ставляет 0,88, исходная - 0,94. Остаток = 0,94 - 0,88 = 0,06. Чем ни
же значения остатков, тем выше качество модели.
Воспроизведенные корреляции
«Яблоко» «Единство»
БЖ
ОВР
КПРФ
СПС
«Яблоко»
0,89
«Единство»
-0,53
0,80
БЖ
-0,47
0,59
0,44
ОВР
0,73
-0,72
-0,56
0,76
КПРФ
-0,70
0,01
0,12
-0,34
0,89
СПС
0,88 -0,43
-0,40
0,66
-0,77
0,88
Остаточные коэффициенты
«Яблоко» «Единство»
БЖ
ОВР
КПРФ
СПС
«Яблоко»
0,11
«Единство»
-0,02
0,20
БЖ
0,00
-0,31
0,56
ОВР
-0,13
-0,01
0,09
0,24
КПРФ
0,09
0,00
-0,02
-0,14
0,11
СПС
0,06
-0,03
0,01
-0,14
0,10
0,12
Как видно из матриц, двухфакторная модель, будучи в целом адек
ватной, плохо объясняет отдельные связи. Так, очень низкой является
общность переменной БЖ (всего 0,56), слишком велико значение ос
таточного коэффициента связи БЖ и «Единства» (-0,31).
Теперь необходимо решить, насколько важным для данного кон
кретного исследования является адекватное представление перемен
ной БЖ. Если важность высока (к примеру, если исследование посвя
щено анализу электората именно этой партии), корректно вернуться
к четырехфакторной модели. Если нет, можно оставить два фактора.
176
Глава 4. Статистические методы в политическом анализе
Принимая во внимание учебный характер наших задач, оставим более
простую модель.
^л
К
л°
РНЫе
1
Н<
1
Че
"
ия
значения факторной переменной
для каждого случая (наблюдения).
В нашем примере факторов два со
ответственно и факторных значений для каждого случая два- '
ТИК (территориальная
избирательная комис
сия)
', «Яблоко
»
«Единство
»
Он
1
О
1
* КПР
Ф
СП
С
Факто
р 1
Факто
р 2
Ермишинская
-0,83
1,58 -0,25 -0,91 -0,17 -0,74 0,85 0,79
Захаровская
-0,22 -1,16
0,97
0,44
-0,14
0,43
-0,24 -0,25
j
Кадомская
I/- ~~
-1,03
0,67
I
1,88 -0,87 0,59 -1,10 1,29 0,40
(Касимовская
-0,93
2,29
-0,44 -0,92 -0,42 -0,92 0,98
1,21
Касимовская городская 0,04
2,26
-0,70 -0,73 -1,32
ОдТГ
0,23
1.96
И т.д. (всего 32 случая), все данные в г-баллах
Факторные нагрузки можно представить как коэффициен
ты корреляции каждой переменной с каждым из выявленных факторов
1ак, корреляция между значениями первой факторной переменной и
значениями переменной «Яблоко» составляет -0,93 Все факторные
нагрузки приводятся в
матрице факторного отображения-
Переменные
Нагрузки на фактор 1 Нагрузки на фактор 2
«Яблоко»
-0,93
0,14
«Единство»
0,66
0,6
БЖ
0,56
0,35
ОВР
-0,82
-0,28
КПРФ
0,64
-0,6
СПС
-0,89
0,27
Чем теснее связь переменной с рассматриваемым фактором, тем
выше значение факторной нагрузки. Положительный знак фактор
ной нагрузки указывает на прямую, а отрицательный знак — на обрат
ную связь переменной с фактором.
Имея значения факторных нагрузок, мы можем построить геомет
рическое представление результатов факторного анализа. По оси
X
4.8. Факторный анализ
177
отложим нагрузки переменных на фактор 1, по оси
Y—
нагрузки пе
ременных на фактор 2 и получим
двухмерное факторное пространство.
«Единство»
СПС
о
«Яблоке
БЖ
СПС
о
«Яблоке
О
СПС
о
«Яблоке
("1С
•р.. „„„,
о
г
1
.- .
i
КПРФ
-1,2 -0,8 -0,4 -0,0
0,4 0.8
Фактор 1
Перед тем как приступить к содержательному анализу полученных
результатов, осуществим еще одну операцию —
вращение
(rotation).
Важность этой операции продиктована тем, что существует не один, а
множество вариантов матрицы факторных нагрузок, в равной степе
ни объясняющих связи переменных (матрицу интеркорреляций). Не
обходимо выбрать такое решение, которое проще интерпретировать
содержательно. Таковым считается матрица нагрузок, в которой зна
чения каждой переменной по каждому фактору максимизированы
или минимизированы (приближены к единице или к нулю).
Рассмотрим схематичный пример. Имеется четыре объекта, рас
положенных в факторном пространстве следующим образом:
Нагрузки на оба фактора для всех объектов существенно отличны
от нуля, и мы вынуждены привлекать оба фактора для интерпретации
положения объектов. Но если «повернуть» всю конструкцию по часо
вой стрелке вокруг пересечения осей координат, получим следующую
картинку:
1 2 - 3 8 6 3
178
Глава 4. Статистические методы в политическом анализе
В данном случае нагрузки на фактор 1 будут близки к нулю, а на
грузки на фактор 2 — к единице
(принцип простой структуры).
Соот
ветственно, для содержательной интерпретации положения объектов
мы будем привлекать только один фактор — фактор 2.
Существует довольно большое количество методов вращения фак
торов. Так, группа методов
ортогонального вращения
всегда сохраняет
прямой угол между координатными осями. К таковым относятся
vari-
тах
(минимизирует количество переменных с высокой факторной
нагрузкой),
quartimax
(минимизирует количество факторов, необхо
димых для объяснения переменной),
equamax
(сочетание двух преды
дущих методов). Методы
косоугольного вращения
не обязательно со
храняют прямой угол между осями (например,
direct oblimin).
Метод
promax
представляет собой сочетание ортогонального и косоугольно
го методов вращения. В большинстве случаев используется метод vari-
max, который дает хорошие результаты применительно и к большин
ству задач политических исследований. Кроме того, как и в процессе
применения многих других методов, рекомендуется поэксперименти
ровать с различными техниками вращения.
В нашем примере после вращения методом varimax получаем сле
дующую матрицу факторных нагрузок:
Переменные
Нагрузки на фактор 1 Нагрузки на фактор 2
«Яблоко»
0,77
0,55
«Единство»
-0,05
-0,89
БЖ
-0,15
-0,65
ОВР
0,39
0,78
КПРФ
-0,94
0,04
СПС
0,84
0,43
Соответственно, геометрическое представление факторного про
странства будет иметь вид:
4.8. Факторный анализ
179
Теперь можно приступить к содержательной интерпретации полу
ченных результатов. Ключевую оппозицию —
электоральный раскол —
по первому фактору формируют К П Р Ф с одной стороны и «Яблоко»
и С П С (в меньшей степени ОВР) — с другой. Содержательно — исхо
дя из специфики идеологических установок названных субъектов из
бирательного процесса — мы можем интерпретировать данное разме
жевание как «лево-правый» раскол, являющийся «классическим» для
политической науки.
Оппозицию по фактору 2 формируют ОВР и «Единство». К послед
нему примыкает «Блок Жириновского», но достоверно судить о его по
ложении в факторном пространстве мы не можем в силу особенностей
модели, которая плохо объясняет связи именно этой переменной. Что
бы объяснить такую конфигурацию, необходимо вспомнить политиче
ские реалии избирательной кампании 1999 г. Тогда борьба внутри поли
тической элиты привела к формированию двух эшелонов «партии
власти» — блоков «Единство» и «Отечество — вся Россия». Различие
между ними не носило идеологического характера: фактически населе
нию предложили выбирать не из двух идейных платформ, а из двух
элитных групп, каждая из которых располагала существенными власт
ными ресурсами и региональной поддержкой. Таким образом, этот рас
кол можно интерпретировать как «властно-элитный» (или, несколько
упрощая, «власть — оппозиция»).
В целом мы получаем геометрическое представление некоего элек
торального пространства Рязанской области для данных выборов, ес
ли понимать электоральное пространство как пространство электо
рального выбора, структуру ключевых политических альтернатив
(«расколов»). Комбинация именно этих двух расколов была очень ти
пична для парламентских выборов 1999 г.
1
Сопоставляя результаты факторного анализа для одного и того же
региона на разных выборах, мы можем судить о наличии преемственно
сти в конфигурации пространства электорального выбора территории.
К примеру, факторный анализ федеральных парламентских выборов
(1995, 1999 и 2003 гг.), проходивших в Татарстане, показал устойчивую
конфигурацию электорального пространства. Для выборов 1999 г. в мо
дели оставлен всего один фактор с объяснительной силой 83% вариа
ции, что сделало невозможным построение двухмерной диаграммы.
В соответствующем столбце приведены факторные нагрузки.
1
Более п о д р о б н о об этом см.:
Ахременко, А. С.
Структурирование электорапьного
пространства в р о с с и й с к и х регионах: ф а к т о р н ы й анализ парламентских выборов
1995-2003 гг. // П о л и с . 2005. № 2.
12-