Файл: Тема Анализ и представление.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 04.12.2023

Просмотров: 479

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Каждая из предложенных кодировок является правильной, так как сохраняется отношение порядка. Первая кодировка является наиболее естественной, привычной, и поэтому более предпочтительной. Пример показывает, что интервалы в ранговой шкале не равны между собой. Например, для второй градации разность рангов по абсолютной величине равна: |99 – 77| = 22, |77 — 44| = 33, |44
— 33| = 11, |33 — 11| = 22.
Другими словами, при измерении в шкале порядка (ранговой шкале) из всех свойств чисел учитывается только то, что они разные и одно число больше другого.
В порядковой шкале должно быть не меньше трех классов
(групп). Например, низкий, средний, высокий. Так, чтобы можно было расставить измеренные признаки по порядку (проранжировать). Чем больше число классов разбиений всей экспериментальной совокупности, тем шире возможности статистической обработки полученных данных и проверки статистических гипотез.
Пример.
Четверым студентам присвоены ранги в зависимости от того, кто быстрее выполнял задание, при этом ранг 1 присвоен тому студенту, который быстрее всех выполнил все задания.
Студент
Ранг
A
1
B
2
C
3
D
4
Основываясь только на этих данных, мы может судить о том, кто раньше выполнил задания, а кто – позже. Но мы не можем судить, насколько каждый из студентов выполнял задание быстрее или медленнее другого.
Правила ранжирования. Случай одинаковых рангов.
Правила ранжирования:
1.
Меньшему значению начисляется меньший ранг.
Наименьшему значению начисляется ранг 1. Наибольшему – ранг, соответствующий количеству ранжируемых значений. Например, если количество равно 7, то наибольшее значение получит ранг 7 2. В случае, если несколько значений равны, им начисляется ранг, представляющий собой среднее значение из тех рангов, которые они получили бы, если бы не были равны. Например, если двое испытуемых в группе показали самый высокий одинаковый результат, то им присваивается средний ранг: 1,5 = (1+2)/2, если трое – то средний ранг будет равен 2 = (1+2+3)/3 и т. д.
3. Общая сумма всех присвоенных рангов для группы численностью А должна совпадать с расчетной, которая определяется
по формуле: сумма = А×(А+1)/2, где А – общее количество ранжируемых значений. Сумма рангов должна быть равна сумме по формуле. Если равенства нет, то ранжирование проведено неверно.
Вопрос 3. Шкала интервалов и шкала отношений
Интервальная шкала
Шкала интервалов является первой метрической шкалой.
Собственно, начиная с нее, имеет смысл говорить об измерениях в узком смысле этого слова — о введении меры на множестве объектов.
Шкала интервалов определяет величину различий между объектами в проявлении свойства. С помощью шкалы интервалов можно сравнивать два объекта. При этом выясняют, насколько более или менее выражено определенное свойство у одного объекта, чем у другого.
Шкала интервалов очень часто используется исследователями.
Классическим примером применения этой шкалы в физике является измерение температуры по Цельсию. Шкала интервалов имеет масштабную единицу, но положение нуля на ней произвольно, поэтому нет смысла говорить о том, во сколько раз больше или меньше утренняя температура воздуха, измеренная шкалой Цельсия, чем дневная.
Пример:
Если вчера дневная температура воздуха была +10 0
С, а сегодня +
5 0
С. То не имеет смысла говорить о том, что вчера днем было в два раза теплее, чем сегодня.
В шкале интервалов каждое из возможных значений измеренных величин отстоит от ближайшего к нему значения на равном расстоянии.
Главное понятие этой шкалы – интервал, который можно определить, как долю или часть измеряемого свойства между двумя соседними позициями на шкале.
Размер интервала – величина фиксированная и постоянная на всех участках шкалы. Важной особенностью шкалы интервалов является то, что у нее нет естественной точки отсчета (нуль условен и не указывает на отсутствие измеряемого свойства). Эта шкала имеет количественную меру, то есть определенные количественные пределы существования в данном качестве.
Интервальная шкала позволяет применять практически всю параметрическую статистику для анализа данных, полученных с ее помощью. Помимо медианы и моды для характеристики центральной тенденции используется среднее арифметическое, а для оценки разброса—дисперсия. Можно вычислять коэффициенты асимметрии и эксцесса и другие параметры распределения. Для оценки величины статистической связи между переменными применяется коэффициент линейной корреляции Пирсона и т. д.


Для измерения посредством шкалы интервалов устанавливаются специальные единицы измерения. В психологии – это стены и
стенайны.
При работе с интервальной шкалой измеряемому свойству или предмету приписывается число, равное количеству единиц измерения, эквивалентное количеству имеющегося свойства.
Важной особенностью шкалы интервалов является то, что в
нее нет естественной точки отсчета (нуль условен и не указывает на
отсутствие измеряемого свойства).
Шкала отношений
Шкала отношений — наиболее часто используемая в физике шкала. По крайней мере, идеалом измерительной процедуры является получение таких данных о выраженности свойств объектов, когда можно сказать, во сколько раз один объект больше или меньше другого.
Это возможно лишь тогда, когда помимо определения равенства, рангового порядка, равенства интервалов известно равенство отношений. Шкала отношений отличается от шкалы интервалов тем, что на ней определено положение «естественного нуля». Классический пример — шкала температур Кельвина.
В психологии шкалы отношений практически не применяются.
Определение нулевой точки - сложная задача для психологических исследований, накладывающая ограничение на использование данной шкалы. С помощью таких шкал могут быть измерены масса, длина, сила, стоимость (цена), т. е. всё, что имеет гипотетический абсолютный ноль.
Шкала отношений, как наиболее мощная, суммирует все возможности, которыми обладают менее мощные шкалы наименований, порядка и интервалов. На ней определены отношения эквивалентности, равенства, порядка, функции метрики и расстояния.
На шкале отношений можно определить равенство и ранговый порядок величин, равенство интервалов и отношений между величинами.
Возможность оценки отношения величин – наиболее важная отличительная черта этой шкалы, определившая ее название.

Итак, любое измерение производится с помощью инструмента измерения. То, что измеряется называется переменной, то чем измеряют – инструмент измерения. Результаты измерения называются данными либо результатами (говорят «были получены данные измерения»).Полученные данные могут быть разного качества – относиться к одной из четырех шкал измерения. Каждая шкала ограничивает использование определённых математических операций, и соответственно ограничивает применение определённых методов математической статистики.
Вопрос 4. Таблица исходных данных. Нормальное распределение
Таблица исходных данных
Обычно в ходе исследования интересующий исследователя признак измеряется не у одного-двух, а у множества объектов
(испытуемых). Кроме того, каждый объект характеризуется не одним, а целым рядом признаков, измеренных в разных шкалах. Одни признаки представлены в номинативной шкале и указывают на принадлежность испытуемых к той или иной группе (пол, профессия, контрольная или экспериментальная группа и т. д.).
Другие признаки могут быть представлены в порядковой или метрической шкале. Поэтому результаты измерения для дальнейшего анализа чаще всего представляют в виде таблицы исходных данных.
Каждая строка такой таблицы обычно соответствует одному объекту, а каждый столбец - одному измеренному признаку. Таким образом, исходной формой представления данных является таблица типа
«объект - признак». В ходе дальнейшего анализа каждый признак выступает в качестве переменной величины, или просто - переменной, значения которой меняются от объекта к объекту.
Предположим, психолога интересует социальная сплоченность двух параллельных классов, различие в этом отношении мальчиков и девочек и эффективность проведенного в одном из этих классов социально-психологического тренинга. Для измерения социальной сплоченности исследователь задавал каждому ученику до и после тренинга один и тот же вопрос: «Как часто твое мнение совпадает с мнением твоих одноклассников?».
Для ответа ученикам предлагалось выбрать один из пяти вариантов: 1 - никогда, 2 - редко, 3 - затрудняюсь ответить, 4 - часто,
5 - всегда. Исходные данные исследования представлены в табл.
Общая численность всех испытуемых N =60. Численность класса, с которым проводился тренинг, N1 = 30; численность другого класса
- N2 = 30. Первые два столбца таблицы - порядковый номер испытуемого (№) и Ф. И. О. Далее следуют четыре столбца, соответствующие четырем интересующим исследователя признакам: х1i - пол (номинативный),

х2i - класс (номинативный),
1 2
3 4
5

Ф.И.О.
Пол
Класс
Самооценка
До
После
1 2
3 4
1
Иванов И. О.
1 0
5 5
2
Васильев К. А.
1 1
3 4
3
Розова М. И.
0 1
2 з
4
Краснова О. С.
0 0
3 3
5
Цветов С. Т.
1 0
1 3
6
Лозовая Е. И.
0 1
4 4





… i
… x
1i x
2i x
3i x
4i






60
Петров Е. М.
1 1
3 3
Нормальное распределение
Проверка на нормальность распределения играет большую роль, так как многие статистические методы предполагают, что анализируемые с их помощью данные распределены в соответствии с нормой. Необходимость такого сопоставления возникает, когда мы сомневаемся, в какой шкале представлен признак – в порядковой или метрической. А сомнения такие возникают очень часто, так как заранее, как правило, неизвестно, в какой шкале удается измерить изучаемое свойство (исключая случаи явно номинативного измерения).
Наиболее весомым аргументом в пользу того, что признак измерен в метрической шкале, является соответствие выборочного распределения норме. Если индивидуальная изменчивость некоторого свойства есть следствие действия множества причин, то распределение частот для всего многообразия проявлений этого свойства в генеральной совокупности соответствует кривой нормального распределения. Это и есть закон нормального распределения. Он характеризуется тем, что крайние значения признака встречаются достаточно редко, а значения близкие к средней величине – достаточно часто.
По форме – это колоколообразная кривая, вершина которой соответствует среднему значению признака, а слева и справа она симметрична. График нормального распределения называется кривой
Гаусса. Нормальным такое распределение называется потому, что оно очень часто встречается в естественнонаучных исследованиях и являлось «нормой» всякого массового случайного проявления признаков. Это распределение следует закону, открытому тремя
разными учеными в разное время: Муавром в 1733 в Англии, Гауссом в 1809 в Германии, Лапласом в 1812 во Франции.
Целью процедуры проверки нормальности распределения является решение вопроса о возможности применения тех или иных параметрических критериев. Для того чтобы распределение было нормальным, выборка должна соответствовать условиям репрезентативности и однородности.
Нормальное распределение задаётся несколькими параметрами.
Среди них среднее арифметическое, стандартное отклонение, эксцесс, ассиметрия.
Если распределение не является нормальным, то его нельзя охарактеризовать средним арифметическим и стандартным отклонением. В таком случае говорят о непараметрических данных, для которых применяются непараметрические методы статистики.
Непараметрические данные
– данные, распределение вероятности, которых не соответствует нормальному и не может быть задано параметрами нормального распределения.
Вопрос 5. Меры центральной тенденции и меры изменчивости
Начнем с центральной тенденции.
Методами статистической обработки результатов эксперимента называются математические приемы, формулы, способы количественных расчетов, с помощью которых показатели, получаемые в ходе эксперимента, можно обобщать, приводить в систему, выявляя скрытые в них закономерности. Речь идет о таких закономерностях статистического характера, которые существуют между изучаемыми в эксперименте переменными величинами.
Все методы математико-статистического анализа условно делятся на первичные и вторичные.
Первичными называют методы, с помощью которых можно получить показатели, непосредственно отражающие результаты производимых в эксперименте измерений. Соответственно под первичными статистическими показателями имеются в виду те, которые применяются в самих психодиагностических методиках и являются

итогом начальной статистической обработки результатов психодиагностики.
Вторичными называются методы статистической обработки, с помощью которых на базе первичных данных выявляют скрытые в них статистические закономерности.
К первичным методам статистической обработки относят, например, определение выборочной средней величины, выборочной дисперсии, выборочной моды и выборочной медианы. В число вторичных методов обычно включают корреляционный анализ, регрессионный анализ, методы сравнения первичных статистик у двух или нескольких выборок.
Рассмотрим методы вычисления первичных описательных статистик выборки.
Мера центральной тенденции – это число, характеризующее выборку по уровню выраженности измеренного признака.
Существуют три способа определения центральной тенденции,
каждому из которых отвечает своя мера: мода, медиана, выборочное
среднее.
Мода (Mode) – это такое значение из множества измерений, которое встречается наиболее часто.
Моде (или модальному интервалу признака) соответствует максимальный подъем графика распределения частот. Если график распределения частот имеет единственный максимальный подъем
(вершину), то такое распределение называется унимодальным.
Пример
Рассмотрим пример «предпочтение домашних животных».
Предположим, что измерения проведены в группе из 10 респондентов.
Пусть измеренный признак имеет следующие 10 значений: 1, 0, 2,
1, 0, 2, 2, 1, 3, 2.
Мода Mo = 2, как наиболее часто встречающееся значение признака (наибольшее число респондентов отдали предпочтение кошкам).
Когда все значения встречаются одинаково часто, то принято
считать, что такое распределение не имеет моды.
Пример
При определении темперамента в группе из 12 испытуемых получены следующие измерения: а), б), б), в), а), в), в), г), б), г), а), г).
Данное распределение не имеет моды, так как измерение показало, что среди 12 испытуемых трое являются сангвиниками, трое
– холериками, трое – меланхоликами и трое – флегматиками. То есть все значения измеренного признака «темперамент» встречаются в данной выборке одинаково часто.
Медиана (Median) – это такое значение признака, которое делит упорядоченное (ранжированное) множество пополам.
Одна половина всех значений признака оказывается меньше медианы, а вторая половина значений – больше медианы.

1) Первым шагом для определения медианы является упорядочивание (ранжирование) всех значений измеренного признака по возрастанию или убыванию.
2) Если выборка значений признака нечетная, то медиана – центральное значение признака; если выборка – четная, то медиана – точка, лежащая посредине между двумя центральными значениями.
Примеры.
1.
Пусть 9 человек имеют следующий ежемесячный доход:
10 тыс. руб., 10 тыс. руб., 12 тыс. руб., 12 тыс. руб., 15 тыс. руб.,
16 тыс. руб., 20 тыс. руб., 30 тыс. руб., 50 тыс. руб.,
Медиана Me = 15 тыс. руб. – то есть центральному значению в упорядоченной выборке.
2.
Пусть 9 человек имеют ежемесячный доход как в предыдущем примере, а доход 10-го составляет 70 тыс. руб. в месяц.
Мы имеем четную выборку из 10 значений измеренного признака
«ежемесячный доход».
Тогда медиана будет равна: Me = (15 тыс. руб. + 16 тыс. руб.)/2 =
15, 5 тыс. руб.
То есть медиана в данном примере равна среднему значению двух центральных значений.
Средняя арифметическая (М) – определяется как сумма всех значений измеренного признака, деленная на количество суммированных значений. В статистике ее обозначают буквой «М».
Чтобы ее подсчитать, надо суммировать все значения ряда и разделить сумму на количество суммированных значений. Использовать для обоснования каких-либо предположений и гипотез только среднее значение нельзя, оно не отражает объективной картины! Пример:
1+9=10, М=5, и 5+5=10, М=5.
Квартили (Quartiles) – это три точки значения признака, которые делят все упорядоченное (по возрастанию) множество значений измеренного признака на 4 равные по численности части.
Процентили (Percentiles) – это 99 точек значений признака, которые деля все упорядоченное (по возрастанию) множество значений признака на 100 равных по численности частей.
Процентили и квартили используют для определения частоты встречаемости тех или иных значений (или интервалов) измеренного признака, или для выделения подгрупп и отдельных испытуемых, наиболее типичных или нетипичных для данного множества наблюдений.
Меры
изменчивости:
размах
выборки,
дисперсия,
стандартное отклонение
Меры центральной тенденции отражают уровень выраженности измеренного признака. Однако не менее важной характеристикой является выраженность индивидуальных различий испытуемых по измеренному признаку. Меры изменчивости (Dispersion) применяются

в психологии для численного выражения величины межиндивидуальной вариации признака.
Размах (Range) – это разность между максимальным и минимальным значениями измеренного признака:
R = x max
– x min
В предыдущем примере размах выборки значений ежемесячных доходов для группы из 10-ти испытуемых составил 60 тыс. руб. = 70 тыс. руб. – 10 тыс. руб.
Для метрических данных используется дисперсия (вариация).
Дисперсия (D) – мера рассеянности случайной величины
(переменной).
Это среднее арифметическое квадратов отклонений значений переменной от ее среднего значения. Однако сама дисперсия, как характеристика отклонения от среднего, часто неудобна для интерпретации.
Дисперсия (Variation) – это мера изменчивости для метрических данных, пропорциональная сумме квадратов измеренных значений от их выборочного среднего:
Эмпирическая (выборочная дисперсия) вычисляется по следующей формуле:
Пример
Вычислим выборочную (эмпирическую) дисперсию для следующей выборки N=7
№ x
i x
i
– M
x
(x i
– M
x
)
2 1
2 2– 4= -2 4
2 4
4-4=0 0
3 7
7-4=3 9
4 2
2-4=-2 4
5 1
1-4=-3 9
6 6
6-4=2 4
7 6
6-4=2 4
M
x
= (2+4+7+2+1+6+6)/7 = 28/7 = 4; D
x
= (4+0+9+4+9+4+4)/6
= 34/6 = 5,66
Алгоритм нахождения дисперсии:
1. Вычисляем среднее по выборке.

2. Для каждого элемента выборки вычисляем его отклонение от средней.
3. Каждый элемент возводим в квадрат.
4. Находим сумму этих квадратов.
5. Эту сумму делим на общее количество членов ряда. Это и есть дисперсия.
Среднее квадратичное отклонение (в программе Excel – S, называется также основным, или стандартным, отклонением) – мера разнообразия входящих в группу объектов; она показывает, насколько в среднем отклоняется каждая варианта (конкретное значение оцениваемого параметра) от средней арифметической. Чем сильнее разбросаны варианты относительно средней, тем большим оказывается и среднее квадратичное отклонение.
Среднеквадратическое
(стандартное) отклонение σ
x равно положительному значению квадратного корня из выборочной
(эмпирической) дисперсии D
x
:
В условиях предыдущего примера среднеквадратическое отклонение равно:
σ
x
= квадратный корень из числа 5,66=2,38
Вопросы для самопроверки:
1. Дайте понятие «измерение» в психологии.
2. Какие виды шкал вы знаете?
3. Как правильно сделать ранжирование, если ранги одинаковые?
4. Что такое нормальное распределение?
5. Как определить моду, медиану, среднее арифметическое?

Качественные и количественные
методы анализа психологических
данных
1   2   3   4   5   6   7