Файл: Тема Анализ и представление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.12.2023

Просмотров: 474

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Сначала определите переменную А1 и переменную В1 с которой мы будем вычислять значимость различий.
1. Выделите свободную ячейку внизу анализируемого столбца данных (B1). На панели инструментов щелкните значок fx (Вставка функции). В мастере функций выберите категорию «Статистические» и функцию «СТЬЮДЕНТ».
2. В аргументе функции в поле «Массив 1» укажите диапазон значений столбца переменных, для которых производится расчёт
(переменная А1).
3. В аргументе функции в поле «Массив 2» укажите диапазон значений столбца переменных, к которому принадлежит данная ячейка
(переменная B1).
4. В Поле «хвосты» вписываем значение 1 – если расчет будет методом одностороннего распределения и 2 – если расчет будет методом двухстороннего распределения.
5. В поле «тип» вводятся следующие значения:
1 – выборка состоит из зависимых величин
2 – выборка состоит из независимых величин
3 – выборка состоит из независимых величин с неравным отклонением и нажмите ОК
Критерий Фишера.
Впервые критерий был предложен Рональдом Фишером в его книге «Проектирование экспериментов». Это произошло в 1935 году.
Сам Фишер утверждал, что на эту мысль его натолкнула Муриэль
Бристоль. В начале 1920-х годов Рональд, Муриэль и Уильям Роуч находились в Англии на опытной сельскохозяйственной станции.
Муриэль утверждала, что может определить, в какой последовательности наливали в ее чашку чай и молоко. На тот момент проверить правильность ее высказывания не представлялось возможным.
Это дало толчок идее Фишера о «нуль гипотезе». Целью стала не попытка доказать, что Муриэль может определить разницу между по- разному приготовленными чашками чая. Решено было опровергнуть гипотезу, что выбор женщина делает наугад.
Было определено, что нуль-гипотезу нельзя ни доказать, ни обосновать. Зато ее можно опровергнуть во время экспериментов.
Было приготовлено 8 чашек. В первые четыре налито молоко сначала, в другие четыре – чай. Чашки были помешаны. Бристоль предложили опробовать чай на вкус и разделить чашки по методу приготовления чая. В результате должно было получиться две группы.
История говорит, что эксперимент прошел удачно.
Благодаря тесту Фишера вероятность того, что Бристоль действует интуитивно, была уменьшена до 0.01. То есть, верно определить чашку можно было в одном случае из 70. Но все же нет возможности свести к нулю шансы того, что мадам определяет случайно. Даже если увеличивать число чашек. Эта история дала

толчок развитию «нуль гипотезы». Тогда же был предложен точный критерий Фишера, суть которого в переборе всех возможных комбинаций зависимой и независимой переменных.
Точный критерий Фишера – это критерий, который используется для сравнения двух относительных показателей, характеризующих частоту определенного признака, имеющего два значения. Исходные данные для расчета точного критерия Фишера обычно группируются в виде четырехпольной таблицы.
Критерий оценивает достоверность различий между процентными долями двух выборок, в которых зарегистрирован интересующий нас эффект.
Аналогом точного критерия Фишера является Критерий хи- квадрат Пирсона, при этом точный критерий Фишера обладает более высокой мощностью, особенно при сравнении малых выборок, в связи с чем в этом случае обладает преимуществом.
Алгоритм расчета:
1. Сформулировать гипотезы. Выбрать уровень значимости α.
2. Найти эмпирическое значение критерия по формуле:
3. Найти число степеней свободы как k1 =nl – 1 для выборки с наибольшей величиной дисперсии и k2=n2 – 1 для выборки с наименьшей величиной дисперсии.
4. Определить критическое значение критерия Фишера по одноименной статистической таблице Приложения для степеней свободы k1 (№ столбца таблицы), k2 (№ строки таблицы) и уровня значимости α/2.
5. Сравнить эмпирическое и критическое значения критерия
Фишера, учитывая, что F-критерий правосторонний.
Если Fэмп Вопрос 4. Непараметрические критерии. Критерий Манна-Уитни
Непараметрические критерии
Непараметрические критерии – являются «свободными» от параметров распределения совокупности и могут быть применены по

отношению к любым данным, имеющим хоть какое-то числовое выражение.
Для данных, распределение которых отличается от нормального, ранговых выборок и выборок малого объема, эффективно применять непараметрические методы, использующие только предположение о случайном характере исходных данных и о непрерывности генеральной совокупности, из которой они извлечены. Для подтверждения стабильности полученных результатов рекомендуется пользоваться несколькими критериями.
Критерий Манна-Уитни
Данный метод выявления различий между выборками был предложен в 1945 году американским химиком и статистиком Фрэнком
Уилкоксоном.
В 1947 году он был существенно переработан и расширен математиками Х. Б. Манном (H.B. Mann) и Д. Р. Уитни (D.R. Whitney), по именам которых сегодня обычно и называется.
Исходные данные: две независимые выборки.
Рассчитываем с помощью критерия U-Манна-Уитни (выборка от
3 до 60 чел.). Применяется для оценки различий по показателям какого- либо признака. Количество показателей в выборках может быть неодинаковым. Чем больше различий, тем меньше эмпирическое значение U, тем более вероятно, что различия достоверны.
Подсчет критерия U Манна-Уитни:
1. Перенести все данные испытуемых на индивидуальные карточки.
2. Пометить карточки испытуемых выборки 1 одним цветом, скажем, красным, а все карточки из выборки 2 - другим, например, синим.
3. Разложить все карточки в единый ряд по степени нарастания признака, не считаясь с тем, к какой выборке они относятся, как если бы мы работали с одной большой выборкой.
4. Проранжировать значения на карточках, приписывая меньшему значению меньший ранг. Всего рангов получится столько, сколько у нас (n1+n2), где n1 – количество испытуемых в выборке 1; n2
- количество испытуемых в выборке 2.
5. Вновь разложить карточки на две группы, ориентируясь на цветные обозначения: красные карточки в один ряд, синие – в другой.
6. Подсчитать сумму рангов отдельно на красных карточках
(выборка 1) и на синих карточках (выборка 2). Проверить, совпадает ли общая сумма рангов с расчетной.
7. Определить большую из двух ранговых сумм.
8. Определить значение U по формуле:
U=(n1*n2) + nx*(nx+1)/2-Tx,
где n1 – количество испытуемых в выборке 1; n2 – количество испытуемых в выборке 2;
Тx– большая из двух ранговых сумм;
nx – количество испытуемых в группе с большей суммой рангов.
9. Определить критические значения U. Если Uэмп> Uкp 0,05, Н0 принимается.
Если Uэмп≤U кp 0,05, Н0 отвергается.
Чем меньше значения U, тем достоверность различий выше.
Критерий Q-Розенбаума
Критерий Q-Розенбаума (выборка более 11 человек). Основан на подсчете «хвостов», т. е. тех элементов одной выборки, которые не имеют схожих элементов из другой выборки.
Это очень простой непараметрический критерий, который позволяет быстро оценить различия между двумя выборками по какому-либо признаку. Однако если критерий Q не выявляет достоверных различий, это еще не означает, что их действительно нет.
Подсчет критерия Q-Розенбаума
1. Проверить, выполняются ли ограничения.
2. Упорядочить значения отдельно в каждой выборке по степени возрастания признака. Считать выборкой 1 ту выборку, значения в которой предположительно выше, а выборкой 2 - ту, где значения предположительно ниже.
3. Определить самое высокое (максимальное) значение в выборке
2.
4. Подсчитать количество значений в выборке 1, которые выше максимального значения в выборке 2. Обозначить полученную величину как S1.
5. Определить самое низкое (минимальное) значение в выборке
1.
6. Подсчитать количество значений в выборке 2, которые ниже минимального значения выборки 1. Обозначить полученную величину как S2.
7. Подсчитать эмпирическое значение Q по формуле: Q=S1+S2
8. Определить критические значения Q для данных n1 и n2. Если
Q эмп равно Q 0,05 или превышает его, Н0 отвергается.
9. При n1, n2 >26 сопоставить полученное эмпирическое значение с Q кр=8 (р≤0,05) и Qкp =10(p ≤0,01). Если Q эмп превышает или по крайней мере равняется Q кp=8, то H0 отвергается.
Вопрос 5. Непараметрические критерии, Критерий χ2 Пирсона
До конца XIX века нормальное распределение считалась всеобщим законом вариации данных. Однако К. Пирсон заметил, что эмпирические частоты могут сильно отличаться от нормального распределения. Встал вопрос, как это доказать. Требовалось не только графическое сопоставление, которое имеет субъективный характер, но и строгое количественное обоснование.
Так был изобретен критерий χ2 (хи-квадрат), который проверяет значимость расхождения эмпирических
(наблюдаемых) и

теоретических (ожидаемых) частот. Это произошло в далеком 1900 году, однако критерий используется и сегодня. Более того, его приспособили для решения широкого круга задач. Прежде всего, это анализ номинальных данных, т. е. таких, которые выражаются не количеством, а принадлежностью к какой-то категории.
Например, класс автомобиля, пол участника эксперимента, вид растения и т. д. К таким данным нельзя применять математические операции вроде сложения и умножения, для них можно только подсчитать частоты.
Критерий Хи-квадрат предпочтителен, когда исследуются большие объемы выборок. При малых объемах выборок этот критерий практически не пригоден.
Формула вычисления:
χ2 = (f эj – f т)2
/ (f т)
Где f эj – это Эмпирическая частота f т – это теоретическая частота
Шутливый пример, который иллюстрирует применения критерия
χ2
В комедии Гоголя «Женитьба» у купеческой дочери Агафьи
Тихоновны было пятеро женихов. Одного она сразу исключила из рассмотрения (он купеческого звания, как и она, а нужен статус выше).
А из остальных она не знала, кого выбрать. И вот Агафья Тихоновна положила бумажки с именами четырех женихов и попыталась вынуть бумажку с именем нужного жениха.
К сожалению, Агафья Тихоновна не была знакома с критерием
χ2. С его помощью можно было бы установить, в кого больше она влюблена.
За разряды мы берем направленность взгляда Агафьи
Тихоновны, итак:
Сидела с опущенными глазами – 25 минут
Благосклонно смотрела на Никанора Ивановича – 14 раз
Благосклонно смотрела на Ивана Кузьмича – 5 раз
Благосклонно смотрела на Ивана Павловича – 8 раз
Благосклонно смотрела на Балтаза Балтазарыча – 5 раз
Теперь нам нужно сопоставить полученные эмпирические частоты с теоретическими. Если Агафья Тихоновна никому не отдает предпочтение, то данное распределение показателя направленности ее взгляда не будет отличаться от нормального распределения: она на всех смотрит примерно с одинаковой частотой. Но если один из женихов чаще притягивает ее взор, это может быть основанием для выбора жениха.
Гипотезы:
Нулевая – распределение взглядов Агафьи Тихоновны между женихами не отличается от равномерного распределения.

Альтернативная – распределение взглядов Агафьи Тихоновны между женихами отличается от равномерного распределения.
Теоретическая частота при сопоставлении эмпирического распределения с равномерным определяется по формуле: f теор = n/k где n – кол-во наблюдений k – кол-во разрядов признака
В нашем случае признак – взгляд невесты, направленный на кого- либо из женихов, кол-во разрядов признака – 4, кол-во наблюдений –
32
Итак, в нашем случае f теор = 32/4=8
Если мы сравним с этой теоретической частотой все эмпирические частоты, а у нас это 14, 5, 8, 5, то Никанор Иванович явно опережает других женихов.
Но если мы проведем расчеты по формуле, у нас получился результат 6,75.
Формула вычисления
χ2 = (f эj – f т) 2
/ (f т)
Далее нам необходимо проверить, значим ли результата в таблице критических значений.
Мы получаем результат, что 6,75 входит в зону незначимости, а это значит мы принимаем нулевую гипотезу. Ответ будет такой:
Распределение взгляда Агафьи Тихоновны между женихами не отличается от равномерного распределения. То есть наша невеста не отдает предпочтение никому из женихов.
Алгоритм оформления выводов (вопросы, на которые
необходимо сформулировать ответ):
1. Что анализировалось (какие испытуемые, параметры какой методики).
2. Посредством чего проводился анализ (какие критерии и методы анализа использовались).
3. Какова достоверность полученных результатов (на каком уровне с указанием либо его точного значения (p=0,03), либо той зоны, в которую это значение попадает (p ≤ 0,05)).
4. Интерпретация (что это означает в контексте данного исследования и какой вывод из этого следует сделать).
Вопросы для самопроверки:
1. Какие качественные методы исследования вы знаете?
2. В чем отличия параметрических и непараметрических критериев?
3. Назовите статистические критерии различий, основания для их выбора.
4. Объясните порядок расчёта и интерпретации t-критерия


Стъюдента.
5. С какой целью мы можем использовать в нашем исследовании критерий χ2 Пирсона?

Качественные и количественные
методы анализа психологических
данных
1   2   3   4   5   6   7

Тема 5. Общие принципы
проверки статистических гипотез.
Качественные методы
исследования, критерии
значимости различий
Глоссарий
Контент-анализ (от англ. сontents – содержание) – метод качественно- количественного анализа содержания текста, заключающийся в систематической фиксации и квантификации (подсчете) определенных единиц содержания исследуемого текста для выявления или измерения различных фактов и тенденций, отраженных в нем.
Критерий значимости различий – критерий, который используется для выявление значимых различий в уровне того или иного признака при сравнении нескольких (двух и более) групп испытуемых.
Непараметрические критерии – критерии, которые не включают в расчёт параметры вероятностного распределения и основаны на оперировании частотами или рангами.
Параметрические критерии – критерии, которые основаны на предположении, что распределение признака в совокупности подчиняется некоторому известному закону.

Качественные и количественные
методы анализа психологических
данных
Тема 4. Многомерные
количественные методы обработки
данных и статистические гипотезы
Глоссарий
Гипотезапредположение или догадка, утверждение, которое, в отличие от аксиом, постулатов, требует доказательство. Гипотеза считается научной, если она, в соответствии с научным методом, объясняет факты, охватываемые этой гипотезой.
Достоверность различий – аналитико-статистическая процедура установления уровня значимости различий или сходств между выборками по изучаемым показателям (переменным).
Многомерные методы – предоставляют вычислительные и графические средства для исследования сходства, близости, группировки данных. Данные могут быть представлены в виде множества переменных, значения которых характеризуют некоторое число систем, объектов, или субъектов, или один объект, или субъект в разные моменты времени.
Статистическая гипотеза – научная гипотеза, допускающая статистическую проверку.

Тема 4. Многомерные количественные методы
обработки данных и статистические гипотезы
Качественные и
количественные методы
анализа психологических
данных
Цели изучения темы:
 изучить многомерные количественные методы обработки данных.
Задачи темы:
 научиться проверять статистические гипотезы;
 понять уровень статистической значимости;
 узнать виды корреляционных связей;
 изучить регрессионный анализ.
В результате изучения данной темы вы будете:
Знать:
 что такое уровень статистической значимости и о чем он свидетельствует.
Уметь:
 формулировать гипотезы исследования.
Владеть:
 навыками расчета нужного коэффициент корреляции, соответствующего распределению признака.
Учебные вопросы темы:
Вопрос 1. Статистические гипотезы. Понятие уровня статистической значимости.
Вопрос 2. Понятие и виды корреляционной связи.
Вопрос 3. Коэффициент линейной корреляции Пирсона. Ранговый коэффициент корреляции Спирмена. Случай одинаковых рангов.