ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 26.10.2023
Просмотров: 349
Скачиваний: 5
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
При определенных статистических предположениях о характере распределений наблюдаемых признаков и факторов квадраты нагрузок можно рассматривать как доли дисперсии соответствующего наблюдаемого признака, объясняемые действием отвечающих нагрузкам факторов. Именно в такой интерпретации фактор приобретает смысл латентной переменной, детерминирующей значения наблюдаемых признаков и обусловливающей наличие корреляции между ними. Тогда графически взаимоотношения между наблюдаемыми признаками и факторами можно изобразить с помощью схемы, где стрелками обозначены напоавления связи (dhc. 7.1).
Заметим, что приведенная схема соответствует предельному случаю, когда общими факторами нагружены все наблюдаемые
4 Измерение в социологии
признаки. В практических случаях обычно'часть факторных нагрузок равна нулю или близка к этому. Тогда факторы, имеющие такие нагрузки, превращаются из общих в групповые. Именно в этом смысле мы выше говорили о том, что каждый латентный фактор "стоит"за своей группой наблюдаемых признаков (таковыми являются признаки, имеющие высокие нагрузки, отвечающие этому фактору и в силу этого связанные друг с другом).
Отметим еще один момент, связывающий наши рассмотрения с общетеоретическими взглядами социолога [Статистические методы,..., с. 213—215]. А именно, отметим связь между схемой, изображенной на рис. 7.1, и известной схемой, отражающей соотношение между теоретическими понятиями и эмпирическими индикаторами (рис. 7.2).
Отличие рис. 7.1 от рис. 7.2 состоит в том, что: 1) на рис. 7.1 присутствуют специфические факторы; 2) на рис. 7.2 каждое понятие связано со "своей" группой наблюдаемых признаков; 3) на рис. 7.1 каждой стрелке неявно приписывается вес (нагрузка). Нетрудно видеть, что все это связано лишь с некоторой приблизительностью рассуждений, приводящих к схеме на рис. 7.2. "Действительно, при более внимательном рассмотрении процедуры "эмпирической интерпретации" теоретических понятий... можно предположить, что в ней существуют все те три дополнения, которые вводятся в моделях ФА. Это, в частности, и индивидуальные вариации каждого вопроса, эксплицирующего данное понятие (в частности, ошибки измерения), т.е. специфический фактор, и возможность включения в анкету некоторых вопросов, служащих "эмпирической интерпретацией" одновременно нескольких теоретических понятий, и, наконец, интуитивное ощущение того факта, что не все выбранные эмпирические индикаторы равноценны с точки зрения равной выраженности в них эксплицируемого понятия, т.е. что в каждом эмпирическом признаке присутствуют веса факторов.
Из выявленной аналогии между структурными схемами модели ФА и эмпирической интерпретацией теоретических понятий не следует, однако, делать вывод о полной смысловой идентичности этих схем... Возникающие здесь различия могут быть обусловлены, в частности, нечеткостью определения процедуры перехода от понятий к их операциональным представлениям, что, в частности, вызывается слишком большой "дистанцией" между уровнем общности понятий и их эмпирической реализацией. В последнем случае общие факторы могут служить основой для формулировки понятий некоторого "среднего" уровня".
Сказанное относительно связи ФА с процессом формирования теоретических понятий имеет самое непосредственное отношение к тем методам социологического шкалирования, о которых пойдет речь ниже.
7.2.4. ПроблемыиспользованияФАвсоциологии
История применения факторного анализа в социологии очень показательна.
Обратимся к советской социологии. Математические методы начали широко использоваться советскими исследователями практически с самого начала возрождения отечественной социологии в 60-х годах. И факторный анализ сразу стал популярным. Было получено много результатов, как содержательных, так и методических, касающихся совершенствования аппарата факторного анализа применительно к специфике социологических задач, разработки приемов его использования в комплексе с другими методами (см., например, [Жуковская и Мучник, 1976; Заславская и Мучник, 1974; Мучник И., Мучник М., Ослон, 1980; Применение факторного и классификационного..., 1976]). Считалось, что ФА может способствовать успешному решению практически любой социологической задачи. Потом энтузиазм резко уменьшился. Начались разговоры о том, что этот метод не приспособлен для решения социологических задач. Из одной крайности преувеличения возможностей метода исследователи перешли в другую крайность — почти полное отрицание его полезности для социологии.
Упомянутые крайности, на наш взгляд, возможны по одной причине: из-за отсутствия внимания исследователя к анализу той модели, которая заложена в методе. Пока эта модель адекватна реальности, его использование полезно. Но как только метод начинает применять исследователь, не дающий себе отчета в том, что за формализмом стоит некоторая модель (и в силу этого не обеспечивающий адекватности этой модели), применение метода перестает приносить пользу. Более того, оно зачастую становится вредным.
Назовем основные причины, мешающие, на наш взгляд, эффективности применения ФА в социологии.
Во-первых, ФА рассчитан на количественные данные (оригинальный подход к реализации идей ФА применительно к качественным данным предложен, например, в [Трофимов, 1982]).
Во-вторых, социолог зачастую не имеет заранее, в частности, на этапе формирования анкеты, в своем сознании никаких гипотез, связанных с основной сутью модели ФА. Поясним это более подробно.
Основным элементом модели, заложенной в ФА, является априорное предположение о наличии латентных факторов, стоящих за наблюдаемыми переменными, объясняющих связи между последними (это предположение, правда, не означает, что количество и сущность этих факторов заранее точно определены; предварительная гипотеза в процессе факторного анализа данных может быть скорректирована и даже вообще отвергнута). Анкета же зачастую составляется из соображений, не имеющих никакого отношения к такому предположению. И только на этапе анализа данных приходит мысль использовать ФА. Естественно, что в таком случае попытка разумно интерпретировать полученные с помощью ФА результаты (следует иметь в виду, что, механически применяя любую математическую технику, мы всегда что-то получим!) кончается крахом — в найденные факторы не удается вложить какой бы то ни было удобоваримый смысл. В таких случаях обычно уровень объяснимой факторами дисперсии бывает малым, факторные нагрузки — низкими.
В-третьих, как уже было отмечено, социолог чаще всего работает не с отдельными респондентами, а с большими их совокупностями и поэтому не может позволить себе задать респонденту несколько сот вопросов (что, как правило, делает психолог). Из-за этого оказывается невозможным измерение такого количества наблюдаемых признаков, которого было бы достаточно для того, чтобы из них могли быть получены близкие к истине значения латентных факторов. А это очень важно. Наверное (применительно к рассмотренной в п. 7.2.1 задаче), мы вряд ли сочтем человека обладающим высокими логическими способностями на основе решенных им логических задач, если количество предложенных задач было очень малым (одна, две, три).
Позволим себе здесь привести цитату из работы [Лазарсфельд, 1972, с. 141], относящуюся к латентно-структурному анализу (ЛСА), заметив предварительно, что ЛСА по своей сути тождествен ФА, однако в цитате речь идет о номинальном латентном факторе, и поэтому приписывание респонденту значения латентной переменной отождествляется с отнесением его к одному из латентных классов, с "положением в классификации": "Показатели индивида по отдельному индикатору (т.е. значения нашей наблюдаемой переменной. —
1 2 3 4 5 6 7 8 9 ... 14
Ю.Т.) могут случайно измениться, но его основное положение в классификации останется неизменным. Или же, наоборот, меняется основное положение, а показатели по каким-то индикаторам случайно остаются теми же. Но если для шкалы или индекса имеется много индикаторов, крайне мало вероятно, чтобы значительное их число случайно изменилось в одном направлении, в то время как изучаемый индивид фактически сохранял бы свое основное положение неизменным".
(Лазарсфельд — известный американский социолог, руководитель нескольких крупнейших эмпирических исследований, один из ведущих специалистов в области методологии социальных наук и, в частности, в области использования математики в социальном познании — глубоко проанализировал процесс формирования эмпирических референтов латентных свойств. Его творчество содержит массу и теоретических и практических рекомендаций по формированию анкеты, предназначенной для измерения латентных переменных).
Отметим, что проблеме операционализации понятий, формирования показателей и индексов уделялось много внимания м в советской социологической литературе. Например, [Воронов, Ершова, 1969; Кабыща, 1978; Социальные исследования: построение..., 1978].
В-четвертых, коснемся, пожалуй, самого тонкого момента, связанного с самим существованием латентных факторов.
Приведем еще одну цитату [Интерпретация и анализ..., гл. 9, с. 224—225; автор главы — В.И.Викторов]. "Аппарат ФА исторически формировался на основе статистической интерпретации факторной модели, когда корреляционная связь между двумя переменными обусловливается не их непосредственным взаимодействием, а существованием некоторой третьей переменной, взаимодействующей с каждой из двух первых... Такая точка зрения побуждает к интерпретации фактора как некоторого латентного свойства, более общего, чем те, которые фиксируются параметрами, и даже "наиболее существенного" свойства. Отсюда идет традиция считать, что описание объекта в терминах факторов в большей степени раскрывает сущность изучаемого явления, чем описание его в терминах исходных параметров, т.е. фактору априори приписывается онтологический статус.
Однако описание объектов в терминах факторов по сути дела представляет собой математическую модель взаимосвязей, существующих между исходными параметрами. Эти взаимосвязи могут быть обусловлены самыми разными причинами. В моделях факторного анализа самих по себе, в математических построениях, на которых базируются вычислительные процедуры, не содержатся представления о причинности. Это представление вносится исследователем при интерпретации".
Приведенная цитата развивает высказанное нами в главе 3 соображение о том, что в научном исследовании мы постоянно, хотим того или не хотим, имеем дело с моделями реальности. И все время нас должен "преследовать" вопрос об их адекватности. Особенно остро этот вопрос стоит при использовании математических моделей. Это касается и изучения причин каких-либо явлений на базе анализа статистических связей. В силу того что причинно-следственные отношения в принципе не формализуются, мы можем искать онтологический смысл там, где его нет.
Даже разрабатывая анкету специально "под" факторный анализ, включая в нее довольно большое количество наблюдаемых индикаторов, социологи иногда некорректно ставят задачу. Ситуация переворачивается "вверх ногами". Гипотетический латентный фактор (существование которого априори постулируется) в действительности может не являться причиной, обусловливающей изменения наблюдаемых индикаторов; может быть следствием таких изменений, а может и вообще к таким изменениям не иметь отношения. Фиксация его значений в таких случаях может не приводить к исчезновению связей между наблюдаемыми признаками. Исследователь же, не зная об этом и механически применив технику факторного анализа, либо получает очень плохую модель (вследствие того что его гипотеза об адекватности факторной модели не отвечает реальности), либо пытается искать интерпретацию найденного более или менее сносного латентного фактора на неправильном пути, полагая, что этот фактор тождествен той самой несостоятельной латентной переменной.
В силу указанных причин интерпретацию результатов ФА иногда имеет смысл расценивать не как финальный этап исследования, а как этап выдвижения гипотез. "Такая точка зрения дополняет представление о ФА как об аппарате проверки гипотез, касающихся детерминации наблюдаемых переменных." [Интерпретация и анализ..., 1987, с. 238].
В-пятых, интерпретация результатов ФА часто бывает затруднена их принципиальной неоднозначностью. При той постановке задачи, которая послужила основой для разработки аппарата ФА, факторы в принципе не могут быть определены однозначно. Множество одинаково "хороших" факторных моделей может быть получено путем ротации некоторого первичного решения. Подчеркнем, что это отнюдь не должно расцениваться как недостаток метода. Напротив, в этом состоит достоинство ФА: постановка задачи была обусловлена жизненной ситуацией; и здесь мы снова сталкиваемся с той принципиальной невозможностью однозначно описать социальные явления формальными методами, о которой говорили в п. 3.3. На практике большинство моделей, полученных с помощью ФА, оказываются несостоятельными (факторы не удается проинтерпретировать). Но бывает и так, что исследователь получает хорошую интерпретацию при нескольких поворотах осей. И это обогащает его представления о реальности. Пример можно найти в [Интерпретация и анализ..., 1987, гл. 9] (автор главы — В.И.Викторов; факторный анализ в этой работе применен к данным, полученным с помощью метода семантического дифференциала). Автору удалось выделить две группы латентных факторов, примерно одинаково хорошо описывающих связи между наблюдаемыми переменными (это подтверждает наше положение о том, что многовариантность моделей является существенным свойством использования математического аппарата в социологии).
Несмотря на все сказанное, тестовая традиция в социологии работает.
И в наше время успешно используется как сам факторный анализ (см., например, [Данилова, Ядов, 1993]; другие примеры будут названы в главе 8), так и некоторые такие приемы, которые, будучи близки по своей логике к этому анализу, все же от него отличаются, являя собой по существу некоторый суррогат тестовой традиции, используемый именно с целью совместить ее с потребностями социологии. Мы имеем в виду в первую очередь известные шкалы Лайкерта и Гуттмана (п. 7.5). Сюда же можно отнести и разработанный Лазарсфельдом на* базе тех же идей, но с учетом потребностей именно социологии латентно-структурный анализ (ЛСА). Лазарсфельдовские концепции, подхваченные рядом ученых-математиков, привели к развитию широкого направления, включившего в себя факторный анализ как частный случай (это еще один пример "взаимодействия"социологии и математики, о котором мы говорили в п. 3.3).
Перейдем к описанию некоторых методов социологического шкалирования, основанных на тестовой традиции.
7.3. Социологические индексы. Проблемы их построения
7.3.1. Расчетиндекса—способизмерениялатентнойпеременной
В социологии рассматриваемая традиция нередко проявляется в виде стремления социолога к построению так называемых индексов для измерения латентной установочной переменной. Соответствующая процедура сводится к следующему.
Социолог, понимая, что "лобовой" вопрос в анкете не работает (что и означает латентность переменной), но что в то же время соответствующее состояние респондента может выражаться в разных аспектах его вербального поведения, задает респонденту серию косвенных вопросов, "вращающихся" как бы "вокруг да около" того, что исследователя в действительности интересует. Каждому из этих вопросов отвечает своя наблюдаемая переменная. Значение латентного признака для конкретного респондента обычно получается в результате суммирования ответов этого респондента на указанные вопросы, т.е. суммирования значений наблюдаемых переменных.
Например, применительно к уже рассматриваемой нами латентной переменной "удовлетворенность работой" описанная процедура будет означать обращение к респонденту с просьбой сказать, устраивает ли его зарплата, симпатичны ли ему товарищи по работе, авторитетен ли для него непосредственный начальник и т.д. Другими словами, одну "большую" удовлетворенность мы как бы "разлагаем" на много "маленьких". Каждый вопрос в таких случаях чаще всего сопровождается веером возможных ответов, соответствующих, скажем, традиционной пятибалльной шкале от "полностью устраивает" до "совершенно не устраивает" и т.д. (вместо баллов от I до 5 могут использоваться баллы от 5 до 1, от — 2 до +2, от 1 до 3, от 1 до 7 и т.д.). Баллы, соответствующие ответам одного респондента, суммируются. Считается, что полученное число можно интерпретировать как результат измерения "общей" удовлетворенности этого респондента. Далее мы полагаем, что максимальной удовлетворенности работой отвечает совокупность максимальных баллов-ответов по всем вопросам, минимальной удовлетворенности — совокупность минимальных баллов-ответов, а в промежуточном случае — удовлетворенность тем больше, чем больше суммарный балл. Сумма "маленьких" удовлетворенностей составляет одну "большую".
(Отметим очевидный, но иногда не замечаемый исследователем момент: используя обсуждаемый способ шкалирования, мы тем самым полагаем, что, скажем, максимальные значения ответов на все рассматриваемые вопросы анкеты говорят о состоянии удовлетворенности работой, а минимальные — о состоянии неудовлетворенности; так что если в анкету включены одновременно вопросы типа: "Часто ли Вам задерживают зарплату?" и "Часто ли Вы получаете премию?", оба — с веером ответов от "Очень часто" до "Крайне редко", то в первом случае мы должны приписать перечисленным вариантам ответов баллы от 1 до 5, а во втором — от 5 до 1.)
7.3.2. Индексыдляноминальныхданных ("логическийквадрат")
Для номинальных данных рассматриваемая процедура имеет свою специфику, в этом случае ее иногда называют методом "логического квадрата (куба и т.д.)". Впервые этот термин был использован в книге [Человек и его работа, 1967]. Поясним на примере, что он означает.
Предположим, что мы хотим измерить уровень культурного развития респондента на базе его ответов на вопросы типа: "Какие книги Вы предпочитаете читать (варианты ответов: боевики, приключенческую литературу, любовные романы, научно-популярную литературу, русскую классику и т.д.)"? "Какие учреждения Вы посещали за последние два месяца в свободное от работы время (кино, театр, дискотека, бар, ночной клуб, библиотека и т.д.)"? "Чем Вы занимаете Ваших детей-дошкольников после их возвращения из детского сада (шахматы; домино;
читаю детям книжки; дети сами находят,'чем заниматься; выгоняю детей на улицу; дети смотрят телевизор)"?
Значения нового признака-индекса определяем, например, следующим образом: значению 1 отвечают наборы ответов (боевики, ночной клуб, выгоняю детей на улицу), (любовные романы; бар; дети сами находят, чем заниматься); 2 — (любовные романы, дискотека, дети смотрят телевизор), 3 — (приключенческая литература, кино, домино); 4 — (русская классика, шахматы, театр); 5 — (научно-популярная литература, библиотека, читаю детям книжки). Ясно, что значения, отвечающие выписанным нами наборам, вполне можно считать определенными по порядковой шкале — чем больше значение, тем выше культурный уровень респондента. Конечно, многие сочетания ответов вызовут определенные трудности при определении того, какому значению такого порядкового признака они отвечают. Многие оказываются несравнимыми. Тем не менее более или менее приемлемый признак обычно удается построить. В нашем примере мы использовали "логический куб", поскольку информация была как бы трехмерной.