ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.10.2020
Просмотров: 8425
Скачиваний: 53
101
мерения. Чем больше ошибка, тем шире диапазон неопределенности
на шкале (доверительный интервал индивидуального балла), внутри
которого оказывается статистически возможной локализация истинно-
го балла данного испытуемого. Таким образом, для проверки гипотезы
о значимости отличия балла испытуемого от среднего значения оказы-
вается недостаточным только оценить ошибку среднего, нужно еще
оценить ошибку измерения, обусловливающую разброс в положении
индивидуального балла (рис. 7).
Рис. 7. Соотношение распределений S
m
– стандартное от-
клонение эмпирического среднего, S
t
– стандартное отклонение
ошибки
Как же определить ошибку измерения? На помощь приходят
корреляционные методы, позволяющие определить точность (надеж-
ность) через устойчивость и согласованность результатов, получаемых
как на уровне целого теста, так и на уровне отдельных его пунктов.
Надежность целого теста имеет две разновидности.
1. Надежность-устойчивость (ретестовая надежность). Измеряет-
ся с помощью повторного проведения теста на той же выборке испыту-
емых, обычно через две недели после первого тестирования. Для ин-
тервальных шкал подсчитывается хорошо известный коэффициент
корреляции произведения моментов Пирсона:
)
/
)
)(
/
)
(
(
2
2
2
2
2
1
2
1
2
1
2
2
1
12
n
x
x
n
x
x
n
x
x
x
x
r
i
i
i
i
i
i
i
i
å
å
å
å
å
å
å
-
-
-
=
где х
1i
. - тестовый балл
i
-го испытуемого при первом измерении;
102
х
2i
. - тестовый балл того же испытуемого при повторном измере-
нии;
n - количество испытуемых.
Оценка значимости этого коэффициента основывается на не-
сколько иной логике, чем это обычно делается при проверке нулевой
гипотезы - о равенстве корреляций нулю. Высокая надежность дости-
гается тогда, когда дисперсия ошибки оказывается пренебрежительно
малой. 'Относительную долю дисперсии ошибки легко определить по
формуле
12
2
2
2
0
1
r
S
S
S
x
e
-
=
=
(3.2.4)
Таким образом, для нас существеннее близость к единице, а не
отдаленность от нуля. Обычно в тестологической практике редко уда-
ется достичь коэффициентов, превышающих 0,8. При г = 0,75 отно-
сительная доля стандартной ошибки равна
5
,
0
75
,
0
1
=
-
. Этой ошиб-
кой, очевидно, нельзя пренебречь. При такой ошибке эмпирически по-
лученное отклонение индивидуального тестового балла от среднего по
выборке оказывается, как правило, завышенным. Для того чтобы вы-
яснить «истинное» значение тестового балла индивида, применяется
формула
x
r
rx
x
i
)
1
(
-
+
=
¥
(3.2.5)
где
¥
x
- истинный балл; '
х
i
— эмпирический балл
i
-го испытуемого;
r - эмпирически измеренная надежность теста;
x
- среднее для теста.
Предположим, испытуемый получил балл IQ по шкале Стэнфор-
да.-Бине, равный 120 нормализованным очкам, М = 100, г = 0,9. Тогда
истинный балл
¥
x
= 0,9
´
120 + 0,1
´
100 =118.
Конечно, требование ретестовой надежности является коррект-
ным лишь по отношению к таким психическим характеристикам ин-
дивидов, которые сами являются устойчивыми во времени. Если мы
создаем тест для измерения эмоциональных состояний (бодрости, тре-
103
воги и т. д.), то, очевидно, требовать от него ретестовой надежности
бессмысленно: у испытуемых быстрее изменится состояние, чем они
забудут свои ответы по первому тестированию.
Для шкал порядка в качестве меры устойчивости к перетестиро-
ванию используется коэффициент ранговой корреляции Спирмена:
)
1
(
6
1
2
2
-
-
=
å
n
n
d
p
i
,
(3.2.6)
где d
i
— разность рангов /-го испытуемого в первом и втором
ранговом ряду.
С помощью компьютера определяется более надежный коэффи-
циент ранговой корреляции Кендалла (1975).
2. Надежность- согласованность (одномоментная надежность).
Эта разновидность надежности не зависит от устойчивости, име-
ет особую содержательную и операциональную природу. Простейшим
способ ее измерения
СОСТОИТЕ
коррелировании параллельных форм
теста (Анастази Д., 1982, кн. 1,с. 106). Чаще всего параллельные
формы теста получают расщеплением составного теста на «четную» и
«нечетную» половины: к первой относятся четные пункты, ко второй -
нечетные. По каждой половине рассчитываются суммарные баллы и
между двумя рядами баллов по испытуемым определяются допустимые
(с учетом уровня измерения) коэффициенты корреляции. Если парал-
лельные тесты не нормализованы, то предпочтительнее использовать
ранговую корреляцию. При таком расщеплении получается коэффици-
ент, относящийся к половинам теста. Для того чтобы найти надежность
целого теста пользуются формулой Спирмена - Брауна:
x
x
xx
r
r
r
-
=
1
2
(3.2.7)
где r
x
- эмпирически рассчитанная корреляция для половин.
Делить тест на две половины можно разными способами, и каж-
дый раз получаются несколько разные коэффициенты (Аванесов В. С.,
1982, с. 122), поэтому в психометрике существует способ оценки син-
хронной надежности, который соответствует разбиению теста на такое
104
количество частей, сколько в нем отдельных пунктов. Такова формула
Кронбаха:
÷÷
÷
÷
÷
ø
ö
çç
ç
ç
ç
è
æ
-
-
=
å
=
2
1
2
1
1
x
j
j
j
S
S
k
k
a
(3.2.8)
где а - коэффициент Кронбаха;
k- количество пунктов теста;
2
j
S
- дисперсия по
j
-му пункту теста;
2
x
S
- дисперсия суммарных баллов по всему тесту.
Обратите внимание на структурное подобие формулы Кронбаха
(3.2.2) и формулы Рюлона (3.2.8).
Несколько раньше была получена формула Кьюдера - Ричардсо-
на, аналогичная формуле Кронбаха для частного случая - когда отве-
ты на каждый пункт теста интерпретируются как дихотомические пе-
ременные с двумя значениями (1 и 0):
÷÷
÷
÷
÷
ø
ö
çç
ç
ç
ç
è
æ
-
-
=
å
=
2
1
2
20
1
x
k
j
j
j
x
S
q
p
S
k
k
KR
(3.2.9)
где KR
20
- традиционное обозначение получаемого коэффициен-
та;
j
j
q
p
-дисперсия
i
-и дихотомической переменной, какой является
i
-й пункт теста; р =
n
верно
N
)
»
«
(
,
q
= 1 -
p
В 1957 г. Дж. Ките предложил следующий критерий для оценки
статистической значимости коэффициента
a
:
a
a
k
n
k
X
n
+
-
-
=
-
)
1
(
)
1
(
2
1
(3.2.10)
105
где
2
1
-
n
X
- эмпирическое значение статистики % квадрат с п-1
степенью свободы;
k - количество пунктов теста;
n - количество испытуемых;.
a
- надежность.
Формулы (3.2.8) и (3.2.9) позволяют оценить взаимную согласо-
ванность пунктов теста, используя при этом только подсчет дисперсий.
Однако коэффициенты а и KR
2I>
позволяют оценить и среднюю корре-
ляцию между
i
-м и
j
-м произвольными пунктами теста, так как связаны
с этой средней корреляцией следующей формулой:
ij
ij
r
k
r
k
a
)
1
(
1
-
+
=
11)
где
ij
r
- средняя корреляция между пунктами теста. Легко уви-
деть идентичность формулы (3.2.11) обобщенной формуле Спирмена -
Брауна, позволяющей прогнозировать повышения синхронной надеж-
ности теста с увеличением количества пунктов теста в k раз (Аванесов
В. С., 1982, с. 121). Из этой формулы видно, что при больших k малое
значение
ij
r
может сочетаться с высокой надежностью. Пусть
ij
r
= 0,1,
a k =100, тогда по формуле (3.2.11)
91
,
0
9
,
10
10
1
,
0
99
1
1
,
0
100
»
=
×
+
×
=
a
Широкое распространение компьютерных программ факторного
анализа для исследования взаимоотношений между пунктами теста (по
одномоментным данным) привело к обоснованию еще одной до-
статочно эффективной формулы надежности теста, которой легко вос-
пользоваться, получив стандартную распечатку компьютерных резуль-
татов факторного анализа по методу главных компонент:
÷÷
ø
ö
çç
è
æ
-
-
=
1
1
1
1
l
q
k
k
(3.2.12)