Файл: Ю. Н. Толстова измерение в социологии курс лекций.doc

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 26.10.2023

Просмотров: 349

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


При определенных статистических предположениях о харак­тере распределений наблюдаемых признаков и факторов квад­раты нагрузок можно рассматривать как доли дисперсии соот­ветствующего наблюдаемого признака, объясняемые действием отвечающих нагрузкам факторов. Именно в такой интерпрета­ции фактор приобретает смысл латентной переменной, детер­минирующей значения наблюдаемых признаков и обусловлива­ющей наличие корреляции между ними. Тогда графически взаи­моотношения между наблюдаемыми признаками и факторами можно изобразить с помощью схемы, где стрелками обозначе­ны напоавления связи (dhc. 7.1).

Заметим, что приведенная схема соответствует предельному случаю, когда общими факторами нагружены все наблюдаемые


4 Измерение в социологии


признаки. В практических случаях обычно'часть факторных нагру­зок равна нулю или близка к этому. Тогда факторы, имеющие такие нагрузки, превращаются из общих в групповые. Именно в этом смысле мы выше говорили о том, что каждый латентный фактор "стоит"за своей группой наблюдаемых признаков (тако­выми являются признаки, имеющие высокие нагрузки, отвеча­ющие этому фактору и в силу этого связанные друг с другом).

Отметим еще один момент, связывающий наши рассмотре­ния с общетеоретическими взглядами социолога [Статистичес­кие методы,..., с. 213—215]. А именно, отметим связь между схе­мой, изображенной на рис. 7.1, и известной схемой, отражаю­щей соотношение между теоретическими понятиями и эмпири­ческими индикаторами (рис. 7.2).



Отличие рис. 7.1 от рис. 7.2 состоит в том, что: 1) на рис. 7.1 присутствуют специфические факторы; 2) на рис. 7.2 каждое понятие связано со "своей" группой наблюдаемых признаков; 3) на рис. 7.1 каждой стрелке неявно приписывается вес (нагруз­ка). Нетрудно видеть, что все это связано лишь с некоторой приблизительностью рассуждений, приводящих к схеме на рис. 7.2. "Действительно, при более внимательном рассмотрении про­цедуры "эмпирической интерпретации" теоретических понятий... можно предположить, что в ней существуют все те три дополне­ния, которые вводятся в моделях ФА. Это, в частности, и инди­видуальные вариации каждого вопроса, эксплицирующего дан­ное понятие (в частности, ошибки измерения), т.е. специфичес­кий фактор, и возможность включения в анкету некоторых воп­росов, служащих "эмпирической интерпретацией" одновременно нескольких теоретических понятий, и, наконец, интуитивное ощущение того факта, что не все выбранные эмпирические индикаторы равноценны с точки зрения равной выраженности в них эксплицируемого понятия, т.е. что в каждом эмпиричес­ком признаке присутствуют веса факторов.

Из выявленной аналогии между структурными схемами модели ФА и эмпирической интерпретацией теоретических понятий не следует, однако, делать вывод о полной смысловой идентичности этих схем... Возникающие здесь различия могут быть обусловлены, в частности, нечеткостью определения процедуры перехода от по­нятий к их операциональным представлениям, что, в частности, вызывается слишком большой "дистанцией" между уровнем общ­ности понятий и их эмпирической реализацией. В последнем случае общие факторы могут служить основой для формулировки поня­тий некоторого "среднего" уровня".

Сказанное относительно связи ФА с процессом формирова­ния теоретических понятий имеет самое непосредственное от­ношение к тем методам социологического шкалирования, о ко­торых пойдет речь ниже.
7.2.4. ПроблемыиспользованияФАвсоциологии
История применения факторного анализа в социологии очень показательна.

Обратимся к советской социологии. Математические методы начали широко использоваться советскими исследователями прак­тически с самого начала возрождения отечественной социологии в 60-х годах. И факторный анализ сразу стал популярным. Было получено много результатов, как содержательных, так и методи­ческих, касающихся совершенствования аппарата факторного ана­лиза применительно к специфике социологических задач, разра­ботки приемов его использования в комплексе с другими метода­ми (см., например, [Жуковская и Мучник, 1976; Заславская и Мучник, 1974; Мучник И., Мучник М., Ослон, 1980; Примене­ние факторного и классификационного..., 1976]). Считалось, что ФА может способствовать успешному решению практически лю­бой социологической задачи. Потом энтузиазм резко уменьшился. Начались разговоры о том, что этот метод не приспособлен для решения социологических задач. Из одной крайности преувели­чения возможностей метода исследователи перешли в другую край­ность — почти полное отрицание его полезности для социологии.

Упомянутые крайности, на наш взгляд, возможны по одной причине: из-за отсутствия внимания исследователя к анализу той модели, которая заложена в методе. Пока эта модель адекват­на реальности, его использование полезно. Но как только метод начинает применять исследователь, не дающий себе отчета в том, что за формализмом стоит некоторая модель (и в силу этого не обеспечивающий адекватности этой модели), применение метода перестает приносить пользу. Более того, оно зачастую становится вредным.

Назовем основные причины, мешающие, на наш взгляд, эф­фективности применения ФА в социологии.

Во-первых, ФА рассчитан на количественные данные (ори­гинальный подход к реализации идей ФА применительно к ка­чественным данным предложен, например, в [Трофимов, 1982]).

Во-вторых, социолог зачастую не имеет заранее, в частно­сти, на этапе формирования анкеты, в своем сознании никаких гипотез, связанных с основной сутью модели ФА. Поясним это более подробно.

Основным элементом модели, заложенной в ФА, является априорное предположение о наличии латентных факторов, сто­ящих за наблюдаемыми переменными, объясняющих связи между последними (это предположение, правда, не означает, что ко­личество и сущность этих факторов заранее точно определены; предварительная гипотеза в процессе факторного анализа дан­ных может быть скорректирована и даже вообще отвергнута). Анкета же зачастую составляется из соображений, не имеющих никакого отношения к такому предположению. И только на эта­пе анализа данных приходит мысль использовать ФА. Естествен­но, что в таком случае попытка разумно интерпретировать по­лученные с помощью ФА результаты (следует иметь в виду, что, механически применяя любую математическую технику, мы все­гда что-то получим!) кончается крахом — в найденные факторы не удается вложить какой бы то ни было удобоваримый смысл. В таких случаях обычно уровень объяснимой факторами диспер­сии бывает малым, факторные нагрузки — низкими.

В-третьих, как уже было отмечено, социолог чаще всего ра­ботает не с отдельными респондентами, а с большими их сово­купностями и поэтому не может позволить себе задать респон­денту несколько сот вопросов (что, как правило, делает психо­лог). Из-за этого оказывается невозможным измерение такого количества наблюдаемых признаков, которого было бы доста­точно для того, чтобы из них могли быть получены близкие к истине значения латентных факторов. А это очень важно. Навер­ное (применительно к рассмотренной в п. 7.2.1 задаче), мы вряд ли сочтем человека обладающим высокими логическими спо­собностями на основе решенных им логических задач, если коли­чество предложенных задач было очень малым (одна, две, три).

Позволим себе здесь привести цитату из работы [Лазарсфельд, 1972, с. 141], относящуюся к латентно-структурному анализу (ЛСА), заметив предварительно, что ЛСА по своей сути тожде­ствен ФА, однако в цитате речь идет о номинальном латентном факторе, и поэтому приписывание респонденту значения латен­тной переменной отождествляется с отнесением его к одному из латентных классов, с "положением в классификации": "Показа­тели индивида по отдельному индикатору (т.е. значения нашей наблюдаемой переменной. —
1   2   3   4   5   6   7   8   9   ...   14

Ю.Т.) могут случайно измениться, но его основное положение в классификации останется неизмен­ным. Или же, наоборот, меняется основное положение, а показа­тели по каким-то индикаторам случайно остаются теми же. Но если для шкалы или индекса имеется много индикаторов, крайне мало вероятно, чтобы значительное их число случайно измени­лось в одном направлении, в то время как изучаемый индивид фактически сохранял бы свое основное положение неизменным".

(Лазарсфельд — известный американский социолог, руково­дитель нескольких крупнейших эмпирических исследований, один из ведущих специалистов в области методологии соци­альных наук и, в частности, в области использования математи­ки в социальном познании — глубоко проанализировал про­цесс формирования эмпирических референтов латентных свойств. Его творчество содержит массу и теоретических и практических рекомендаций по формированию анкеты, предназначенной для измерения латентных переменных).

Отметим, что проблеме операционализации понятий, фор­мирования показателей и индексов уделялось много внимания м в советской социологической литературе. Например, [Воронов, Ершова, 1969; Кабыща, 1978; Социальные исследования: пост­роение..., 1978].

В-четвертых, коснемся, пожалуй, самого тонкого момента, связанного с самим существованием латентных факторов.

Приведем еще одну цитату [Интерпретация и анализ..., гл. 9, с. 224—225; автор главы — В.И.Викторов]. "Аппарат ФА истори­чески формировался на основе статистической интерпретации факторной модели, когда корреляционная связь между двумя переменными обусловливается не их непосредственным взаи­модействием, а существованием некоторой третьей переменной, взаимодействующей с каждой из двух первых... Такая точка зре­ния побуждает к интерпретации фактора как некоторого латен­тного свойства, более общего, чем те, которые фиксируются параметрами, и даже "наиболее существенного" свойства. Отсю­да идет традиция считать, что описание объекта в терминах фак­торов в большей степени раскрывает сущность изучаемого явле­ния, чем описание его в терминах исходных параметров, т.е. фактору априори приписывается онтологический статус.

Однако описание объектов в терминах факторов по сути дела представляет собой математическую модель взаимосвязей, су­ществующих между исходными параметрами. Эти взаимосвязи могут быть обусловлены самыми разными причинами. В моделях факторного анализа самих по себе, в математических построе­ниях, на которых базируются вычислительные процедуры, не содержатся представления о причинности. Это представление вно­сится исследователем при интерпретации".



Приведенная цитата развивает высказанное нами в главе 3 соображение о том, что в научном исследовании мы постоянно, хотим того или не хотим, имеем дело с моделями реальности. И все время нас должен "преследовать" вопрос об их адекватности. Особенно остро этот вопрос стоит при использовании матема­тических моделей. Это касается и изучения причин каких-либо явлений на базе анализа статистических связей. В силу того что причинно-следственные отношения в принципе не формализу­ются, мы можем искать онтологический смысл там, где его нет.

Даже разрабатывая анкету специально "под" факторный ана­лиз, включая в нее довольно большое количество наблюдаемых индикаторов, социологи иногда некорректно ставят задачу. Ситу­ация переворачивается "вверх ногами". Гипотетический латент­ный фактор (существование которого априори постулируется) в действительности может не являться причиной, обусловливаю­щей изменения наблюдаемых индикаторов; может быть следстви­ем таких изменений, а может и вообще к таким изменениям не иметь отношения. Фиксация его значений в таких случаях может не приводить к исчезновению связей между наблюдаемыми при­знаками. Исследователь же, не зная об этом и механически при­менив технику факторного анализа, либо получает очень плохую модель (вследствие того что его гипотеза об адекватности фактор­ной модели не отвечает реальности), либо пытается искать интер­претацию найденного более или менее сносного латентного фак­тора на неправильном пути, полагая, что этот фактор тождествен той самой несостоятельной латентной переменной.

В силу указанных причин интерпретацию результатов ФА иног­да имеет смысл расценивать не как финальный этап исследова­ния, а как этап выдвижения гипотез. "Такая точка зрения допол­няет представление о ФА как об аппарате проверки гипотез, касающихся детерминации наблюдаемых переменных." [Интер­претация и анализ..., 1987, с. 238].

В-пятых, интерпретация результатов ФА часто бывает зат­руднена их принципиальной неоднозначностью. При той поста­новке задачи, которая послужила основой для разработки аппа­рата ФА, факторы в принципе не могут быть определены одно­значно. Множество одинаково "хороших" факторных моделей может быть получено путем ротации некоторого первичного ре­шения. Подчеркнем, что это отнюдь не должно расцениваться как недостаток метода. Напротив, в этом состоит достоинство ФА: постановка задачи была обусловлена жизненной ситуаци­ей; и здесь мы снова сталкиваемся с той принципиальной не­возможностью однозначно описать социальные явления фор­мальными методами, о которой говорили в п. 3.3. На практике большинство моделей, полученных с помощью ФА, оказыва­ются несостоятельными (факторы не удается проинтерпретиро­вать). Но бывает и так, что исследователь получает хорошую ин­терпретацию при нескольких поворотах осей. И это обогащает его представления о реальности. Пример можно найти в [Интер­претация и анализ..., 1987, гл. 9] (автор главы — В.И.Викторов; факторный анализ в этой работе применен к данным, получен­ным с помощью метода семантического дифференциала). Автору удалось выделить две группы латентных факторов, примерно одинаково хорошо описывающих связи между наблюдаемыми переменными (это подтверждает наше положение о том, что многовариантность моделей является существенным свойством использования математического аппарата в социологии).


Несмотря на все сказанное, тестовая традиция в социологии работает.

И в наше время успешно используется как сам факторный анализ (см., например, [Данилова, Ядов, 1993]; другие примеры будут названы в главе 8), так и некоторые такие приемы, кото­рые, будучи близки по своей логике к этому анализу, все же от него отличаются, являя собой по существу некоторый суррогат тестовой традиции, используемый именно с целью совместить ее с потребностями социологии. Мы имеем в виду в первую очередь известные шкалы Лайкерта и Гуттмана (п. 7.5). Сюда же можно отнести и разработанный Лазарсфельдом на* базе тех же идей, но с учетом потребностей именно социологии латентно-структур­ный анализ (ЛСА). Лазарсфельдовские концепции, подхваченные рядом ученых-математиков, привели к развитию широкого на­правления, включившего в себя факторный анализ как частный случай (это еще один пример "взаимодействия"социологии и ма­тематики, о котором мы говорили в п. 3.3).

Перейдем к описанию некоторых методов социологического шкалирования, основанных на тестовой традиции.

7.3. Социологические индексы. Проблемы их построения

7.3.1. Расчетиндексаспособизмерениялатентнойпеременной
В социологии рассматриваемая традиция нередко проявляется в виде стремления социолога к построению так называемых ин­дексов для измерения латентной установочной переменной. Со­ответствующая процедура сводится к следующему.

Социолог, понимая, что "лобовой" вопрос в анкете не рабо­тает (что и означает латентность переменной), но что в то же время соответствующее состояние респондента может выражаться в разных аспектах его вербального поведения, задает респонден­ту серию косвенных вопросов, "вращающихся" как бы "вокруг да около" того, что исследователя в действительности интересу­ет. Каждому из этих вопросов отвечает своя наблюдаемая пере­менная. Значение латентного признака для конкретного респон­дента обычно получается в результате суммирования ответов этого респондента на указанные вопросы, т.е. суммирования значений наблюдаемых переменных.

Например, применительно к уже рассматриваемой нами ла­тентной переменной "удовлетворенность работой" описанная про­цедура будет означать обращение к респонденту с просьбой ска­зать, устраивает ли его зарплата, симпатичны ли ему товарищи по работе, авторитетен ли для него непосредственный начальник и т.д. Другими словами, одну "большую" удовлетворенность мы как бы "разлагаем" на много "маленьких". Каждый вопрос в та­ких случаях чаще всего сопровождается веером возможных отве­тов, соответствующих, скажем, традиционной пятибалльной шка­ле от "полностью устраивает" до "совершенно не устраивает" и т.д. (вместо баллов от I до 5 могут использоваться баллы от 5 до 1, от — 2 до +2, от 1 до 3, от 1 до 7 и т.д.). Баллы, соответствующие ответам одного респондента, суммируются. Считается, что полученное число можно интерпретировать как результат измерения "общей" удов­летворенности этого респондента. Далее мы полагаем, что макси­мальной удовлетворенности работой отвечает совокупность макси­мальных баллов-ответов по всем вопросам, минимальной удовлет­воренности — совокупность минимальных баллов-ответов, а в про­межуточном случае — удовлетворенность тем больше, чем больше суммарный балл. Сумма "маленьких" удовлетворенностей состав­ляет одну "большую".


(Отметим очевидный, но иногда не замечаемый исследовате­лем момент: используя обсуждаемый способ шкалирования, мы тем самым полагаем, что, скажем, максимальные значения от­ветов на все рассматриваемые вопросы анкеты говорят о состо­янии удовлетворенности работой, а минимальные — о состоя­нии неудовлетворенности; так что если в анкету включены од­новременно вопросы типа: "Часто ли Вам задерживают зарпла­ту?" и "Часто ли Вы получаете премию?", оба — с веером отве­тов от "Очень часто" до "Крайне редко", то в первом случае мы должны приписать перечисленным вариантам ответов баллы от 1 до 5, а во втором — от 5 до 1.)
7.3.2. Индексыдляноминальныхданных ("логическийквадрат")

Для номинальных данных рассматриваемая процедура имеет свою специфику, в этом случае ее иногда называют методом "логического квадрата (куба и т.д.)". Впервые этот термин был использован в книге [Человек и его работа, 1967]. Поясним на примере, что он означает.

Предположим, что мы хотим измерить уровень культурного развития респондента на базе его ответов на вопросы типа: "Ка­кие книги Вы предпочитаете читать (варианты ответов: боеви­ки, приключенческую литературу, любовные романы, научно-популярную литературу, русскую классику и т.д.)"? "Какие уч­реждения Вы посещали за последние два месяца в свободное от работы время (кино, театр, дискотека, бар, ночной клуб, биб­лиотека и т.д.)"? "Чем Вы занимаете Ваших детей-дошкольни­ков после их возвращения из детского сада (шахматы; домино;

читаю детям книжки; дети сами находят,'чем заниматься; выго­няю детей на улицу; дети смотрят телевизор)"?

Значения нового признака-индекса определяем, например, следующим образом: значению 1 отвечают наборы ответов (бо­евики, ночной клуб, выгоняю детей на улицу), (любовные ро­маны; бар; дети сами находят, чем заниматься); 2 — (любовные романы, дискотека, дети смотрят телевизор), 3 — (приключен­ческая литература, кино, домино); 4 — (русская классика, шах­маты, театр); 5 — (научно-популярная литература, библиотека, читаю детям книжки). Ясно, что значения, отвечающие выпи­санным нами наборам, вполне можно считать определенными по порядковой шкале — чем больше значение, тем выше куль­турный уровень респондента. Конечно, многие сочетания отве­тов вызовут определенные трудности при определении того, какому значению такого порядкового признака они отвечают. Многие оказываются несравнимыми. Тем не менее более или менее приемлемый признак обычно удается построить. В нашем примере мы использовали "логический куб", поскольку инфор­мация была как бы трехмерной.