ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.12.2023
Просмотров: 581
Скачиваний: 7
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Таблица 8.5. Вычисление коэффициента ранговой корреляции
Спирмена
Рост
Вес
Значение, см
Ранг
Значение, г Ранг
Разность рангов
31 1
7,7 2
–1 32 2
8,3 3
–1 33 3
7,6 1
2 34 4
9,1 4
0 35 5,5 9,6 5
0,5 35 5,5 9,9 6
–0,5 40 7
11,8 7
0 41 8
12,2 8
0 42 9
14,8 9
0 46 10 15,0 10 0
АНАЛИЗ ЗАВИСИМОСТЕЙ
264
Таблица 8.6. Критические значения коэффициента ранговой корреляции Спирмена
Уровень значимости
α
n
0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001 4
0,600 1,000 1,000 5
0,500 0,800 0,900 1,000 1,000 6
0,371 0,657 0,829 0,886 0,943 1,000 1,000 7
0,321 0,571 0,714 0,786 0,893 0,929 0,964 1,000 1,000 8
0,310 0,524 0,643 0,738 0,833 0,881 0,905 0,952 0,976 9
0,267 0,483 0,600 0,700 0,783 0,833 0,867 0,917 0,933 10 0,248 0,455 0,564 0,648 0,745 0,794 0,830 0,879 0,903 11 0,236 0,427 0,536 0,618 0,709 0,755 0,800 0,845 0,873 12 0,217 0,406 0,503 0,587 0,678 0,727 0,769 0,818 0,846 13 0,209 0,385 0,484 0,560 0,648 0,703 0,747 0,791 0,824 14 0,200 0,367 0,464 0,538 0,626 0,679 0,723 0,771 0,802 15 0,189 0,354 0,446 0,521 0,604 0,654 0,700 0,750 0,779 16 0,182 0,341 0,429 0,503 0,582 0,635 0,679 0,729 0,762 17 0,176 0,328 0,414 0,485 0,566 0,615 0,662 0,713 0,748 18 0,170 0,317 0,401 0,472 0,550 0,600 0,643 0,695 0,728 19 0,165 0,309 0,391 0,460 0,535 0,584 0,628 0,677 0,712 20 0,161 0,299 0,380 0,447 0,520 0,570 0,612 0,662 0,696 21 0,156 0,292 0,370 0,435 0,508 0,556 0,599 0,648 0,681 22 0,152 0,284 0,361 0,425 0,496 0,544 0,586 0,634 0,667 23 0,148 0,278 0,353 0,415 0,486 0,532 0,573 0,622 0,654 24 0,144 0,271 0,344 0,406 0,476 0,521 0,562 0,610 0,642 25 0,142 0,265 0,337 0,398 0,466 0,511 0,551 0,598 0,630 26 0,138 0,259 0,331 0,390 0,457 0,501 0,541 0,587 0,619 27 0,136 0,255 0,324 0,382 0,448 0,491 0,531 0,577 0,608 28 0,133 0,250 0,317 0,375 0,440 0,483 0.522 0,567 0,598 29 0,130 0,245 0,312 0,368 0,433 0,475 0,513 0,558 0,589 30 0,128 0,240 0,306 0,362 0,425 0,467 0,504 0,549 0,580 31 0,126 0,236 0,301 0,356 0,418 0,459 0,496 0,541 0,571 32 0,124 0,232 0,296 0,350 0,412 0,452 0,489 0,533 0,563 33 0,121 0,229 0,291 0,345 0,405 0,446 0,482 0,525 0,554 34 0,120 0,225 0,287 0,340 0,399 0,439 0,475 0,517 0,547 35 0,118 0,222 0,283 0,335 0,394 0,433 0,468 0,510 0,539 36 0,116 0,219 0,279 0,330 0,388 0,427 0,462 0,504 0,533 37 0,114 0,216 0,275 0,325 0,383 0,421 0,456 0,497 0,526 38 0,113 0,212 0,271 0,321 0,378 0,415 0,450 0,491 0,519 39 0,111 0,210 0,267 0,317 0,373 0,410 0,444 0,485 0,513 40 0,110 0,207 0,264 0,313 0,368 0,405 0,439 0,479 0,507
ГЛАВА 8
265
Таблица 8.6. Окончание
Уровень значимости
α
n 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001 41 0,108 0,204 0,261 0,309 0,364 0,400 0,433 0,473 0,501 42 0,107 0,202 0,257 0,305 0,359 0,395 0,428 0,468 0,495 43 0,105 0,199 0,254 0,301 0,355 0,391 0,423 0,463 0,490 44 0,104 0,197 0,251 0,298 0,351 0,386 0,419 0,458 0,484 45 0,103 0,194 0,248 0,294 0,347 0,382 0,414 0,453 0,479 46 0,102 0,192 0,246 0,291 0,343 0,378 0,410 0,448 0,474 47 0,101 0,190 0,243 0,288 0,340 0,374 0,405 0,443 0,469 48 0,100 0,188 0,240 0,285 0,336 0,370 0,401 0,439 0,465 49 0,098 0,186 0,238 0,282 0,333 0,366 0,397 0,434 0,460 50 0,097 0,184 0,235 0,279 0,329 0,363 0,393 0,430 0,456
Если объем выборки больше 50, нужно применить критерий
Стыодента:
2 1
2
s
s
r
t
r
n
=
−
−
с числом степеней свободы
ν = n – 2.
В данном случае связь веса и роста можно было установить и без помощи коэффициента ранговой корреляции Спирмена.
Применение обычного коэффициента корреляции, как мы ви- дели, приводит к тем же результатам.
Сколько лабораторных анализов нужно врачу?
В первые дни пребывания в больнице больному обычно делают множество дорогостоящих анализов. Все ли из них необходимы?
Шредер с коллегами* попытались, анализируя работу 21 врача,
выяснить, существует ли связь между квалификацией врача и стоимостью необходимых ему анализов. Прежде всего, специ- альная комиссия оценила квалификацию каждого врача. Каж- дому из врачей присвоили ранг от 1 (лучшая квалификация) до
* S. A. Schroeder, A. Schliftman, Т. Е. Piemine. Variation among physici- ans in use of laboratory tests: relation to quality of care. Med. Care, 12:
709–713, 1974.
АНАЛИЗ ЗАВИСИМОСТЕЙ
266 21 (худшая квалификация). Затем была подсчитана средняя сто- имость анализов, которые потребовались каждому из врачей за первые 3 суток пребывания больного в клинике. Эти данные упорядочили по возрастанию; наименьшей стоимости присвои- ли ранг 1, наибольшей — 21.
В результате каждому врачу была присвоена пара рангов —
ранг по шкале квалификации и ранг по шкале расходов. Эти пары представлены на рис. 8.13. Остается выяснить связь меж- ду квалификацией врача и величиной расходов на необходимые ему анализы. Вычислив коэффициент Спирмена, получим все- го лишь r
s
= –0,13. Абсолютная величина r
s
оказалась меньше критического значения даже при уровне значимости
α = 0,05
(критическое значение r
0,05
= 0,435).
Однако значит ли это, что не существует связи между квали- фикацией врача и затратами на анализы? Нет. Связь существу- ет, но она не линейная. Присмотревшись к рис. 8.13, можно заме- тить, что самыми дешевыми анализы были у лучших и... худ- ших врачей. И тем и другим, чтобы уверенно судить о болезни,
не требуется много анализов. Причем, похоже, большей уверен- ностью отличаются именно худшие специалисты.
Но почему эта связь не была уловлена коэффициентом кор- реляции? Исключительно из-за ее нелинейной формы. Ни один из коэффициентов корреляции не сможет уловить зависимость,
график которой — перевернутая U-образная кривая с рис. 8.13.
Этот пример показьюает, что, прежде чем применять какие- либо методы анализа связей, следует примерно определить, ка- кой может быть форма зависимости. Лучший способ для этого —
просто нарисовать график, подобный изображенному на рис. 8.13.
ЧУВСТВИТЕЛЬНОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ
Как уже говорилось, из статистической значимости коэффи- циента корреляции вытекает статистическая значимость коэф- фициента наклона. Ограничимся поэтому вычислением чувст- вительности коэффициента корреляции.
Можно показать, что величина
ГЛАВА 8
267
Рис. 8.13. А. Квалификация врача и стоимость анализов, которые он назначает больно- му в первые 3 дня госпитализации. Коэффициент ранговой корреляции Спирмена —
всего лишь –0,13. Можно было бы заключить, что стоимость анализов от квалифика- ции никак не зависит. Б. Приглядевшись к данным повнимательнее, можно заметить,
что зависимость на самом деле есть, только не линейная, а похожая на перевернутую букву U. Расходы на анализы выше у врачей средней квалификации, у наиболее и наи- менее квалифицированных врачей расходы ниже.
АНАЛИЗ ЗАВИСИМОСТЕЙ
268 1
1
ln
2 1
r
Z
r
+
=
−
имеет нормальное распределение со стандартным отклонением
1 3
Z
n
σ =
−
Тогда величина
Z
Z
z
=
σ
в отсутствие корреляции имеет стандартное нормальное рас- пределение со средним, равным нулю. Обозначим истинное зна- чение коэффициента корреляции
ρ (греческая «ро»). Тогда сред- ним значением z будет
Z
Z
ρ
σ , где
1 1
ln
2 1
Z
ρ
+ ρ
=
− ρ
Найдем, какой должна быть чувствительность, чтобы по вы- борке объемом 10 при уровне значимости 0,05 обнаружить кор- реляцию
ρ, не меньшую 0,9. На рис. 8.14 приведены два распре- деления z — для нулевого коэффициента корреляции и истин- ного, равного
ρ. (Заметьте, насколько этот этот рисунок похож на рис. 6.7.) Чувствительность равна площади под истинной кривой распределения z справа от критического значения z
α
.
Вычислим
1 1
1 1 0,9
ln ln
1,472 2
1 2
1 0,9
Z
ρ
+ ρ
+
=
=
=
− ρ
−
и
1 0,378.
3
Z
n
σ =
=
−
Уровню значимости
α = 0,05 соответствует критическое зна- чение z
α
= 1,960. Центром распределения z является
Z
Z
ρ
σ =
= 1,472/0,378 = 3,894. От этого центра критическое значение z
α
от-
ГЛАВА 8
269
стоит на 1,960 – 3,894 = –1,934 стандартных отклонения. Из табл.
6.4 находим, что площадь части стандартного нормального рас- пределения, расположенной правее –1,934 стандартного от- клонения от центра, составляет примерно 0,97. То есть искомая чувствительность равна 97%.
Итак, чувствительность 1 –
β, необходимая для обнаруже- ния корреляции, не меньшей
ρ, при уровне значимости α и при объеме выборки п равна площади под кривой стандартного нормального распределения правее точки
1 1
3
Z
z
z
n
ρ
−β
α
=
−
−
Эта формула для нахождения чувствительности по известно- му объему выборки. Если нужно найти объем выборки, при ко- тором достигалась бы чувствительность 1 –
ρ, то, разрешив это уравнение относительно п, получим:
1 3.
z
z
n
Z
α
−β
ρ
−
=
+
Рис. 8.14. Чувствительность выявления корреляции
ρ = 0,9 при объеме выборки n = 10
и уровне значимости
α = 0,05.
АНАЛИЗ ЗАВИСИМОСТЕЙ
270
СРАВНЕНИЕ ДВУХ СПОСОБОВ ИЗМЕРЕНИЯ: МЕТОД
БЛЭНДА—АЛТМАНА
Нередко требуется сравнить результаты измерений, выполнен- ных двумя методами, ни один из которых не является абсолют- но надежным. Например, некий гемодинамический показатель определяли непрямым, неинвазивным, методом. Допустим, изо- бретен новый метод, также непрямой. Естественно выяснить,
согласуются ли результаты измерений, выполненных старым и новым методами. Или похожий вопрос — насколько согласова- ны результаты повторных измерений, выполненных одним и тем же методом.
Итак, с помощью двух методов получены две серии измере- ний. Казалось бы, ничто не мешает применить регрессионный анализ или рассчитать коэффициент корреляции. Увы, эти, на первый взгляд, очевидные действия могут привести к ложными выводами.
Регрессионный анализ неприменим уже потому, что его ре- зультаты зависят от того, какую переменную считать незави- симой, а какую зависимой. Тут следует подчеркнуть отличие задачи сравнения двух методов измерения от задачи калибров-
ки, в которой приближенные измерения сравниваются с некото- рым эталоном. Типичный пример калибровки: приготовив ряд растворов известной концентрации, измерить ее исследуемым методом. Здесь регрессионный анализ вполне применим,
поскольку эталон — достоверно известная концентрация —
очевидным образом и является независимой переменной. На- против, при сравнении результатов двух приближенных мето- дов никакого эталона нет.
Что может дать коэффициент корреляции? Положим, он ста- тистически значимо отличается от нуля. Но ценен ли этот факт?
Нет, ведь проверялась корреляция измерений одной и той же
величины. В этом случае удивления было бы достойно как раз отсутствие значимой корреляции, говорящее о том, что резуль- таты, как минимум, одного из методов нимало не схожи с истин- ными значениями измеряемого признака. Это практически ис- ключено. Кроме того, как мы видели, даже весьма высоким ко-
ГЛАВА 8
271
эффициентам корреляции соответствует довольно значительная неопределенность предсказания зависимой переменной.
Д. Блэнд и Дж. Алтман предложили описательный метод оценки согласованности измерений, выполненных двумя спо- собами*. Идея метода очень проста. Для каждой — выполнен- ной одним и другим способами — пары измерений вычислим их разность. Найдем среднюю величину и стандартное откло- нение разности. Средняя разность характеризует системати-
ческое расхождение, а стандартное отклонение — степень раз- броса результатов. Далее, если в качестве оценки измеряемого признака взять среднее значение пары измерений, то можно определить, зависит ли расхождение от величины признака.
Последнее станет понятнее после того, как мы разберем при- мер применения метода Блэнда—Алтмана.
Два способа оценки митральной регургитации
Вспомним схему кровообращения. Из правого желудочка кровь поступает в легкие, где насыщается кислородом. Из легких кровь попадает в левое предсердие, затем — в левый желудочек. Отсю- да кровь перекачивается по всему телу, снабжая органы кислоро- дом, после чего попадает в правое предсердие и вновь в правый желудочек. Митральный клапан, расположенный между левым предсердием и левым желудочком, при сокращении желудочка закрывается и преграждает крови путь обратно в предсердие.
При митральной недостаточности возникает так называемая
митральная регургитация: часть крови при сокращении левого желудочка выбрасывается в предсердие. В результате легкие пе- реполняются кровью, что затрудняет их работу. Если мит- ральная регургитация слишком велика, клапан необходимо за- менять искусственным, — вот почему ее количественная оценка чрезвычайно важна. Такой оценкой служит фракция регургита-
ции — доля крови, которая при каждом сокращении выбрасыва-
* Более подробное изложение этой процедуры можно найти в статьях:
D. G. Altman and J. M. Bland. Measurement in medicine: the analysis of method comparison studies. Statistician, 32:307—317,1983 и J. M. Bland and D. G. Altman. Statistical methods for assessing agreement between two measures of clinical measurement. Lancet, 1(8476):307—310, 1986.
АНАЛИЗ ЗАВИСИМОСТЕЙ
272
ется из левого желудочка в левое предсердие. В норме фракция регургитации равна нулю; чем тяжелее митральная недостаточ- ность, тем более фракция регургитации приближается к еди- нице.
Фракцию регургитации можно определить с помощью ка- тетеризации сердца. В левый желудочек вводят катетер, а через него — рентгеноконтрастный препарат. Наблюдая за его рас- пространением, можно определить, какая доля крови выбра- сывается в левое предсердие. Описанный способ трудно назвать приятным, дешевым и безопасным.
Э. Мак-Исаак с соавт. предложили определять фракцию ре-
Таблица 8.7. Фракция митральной регургитации по данным ка- тетеризации сердца и допплеровского исследования
Допплеровское
Среднее исследование
Катетеризация
Разность значение
0,49 0,62
–0,13 0,56 0,83 0,72 0,11 0,78 0,71 0,63 0,08 0,67 0,38 0,61
–0,23 0,50 0,57 0,49 0,08 0,53 0,68 0,79
–0,11 0,74 0,69 0,72
–0,03 0,71 0,07 0,11
–0,04 0,09 0,75 0,66 0,09 0,71 0,52 0,74
–0,22 0,63 0,78 0,83
–0,05 0,81 0,71 0,66 0,05 0,69 0,16 0,34 0,18 0,25 0,33 0,50
–0,17 0,42 0,57 0,62
–0,05 0,60 0,11 0,00 0,11 0,06 0,43 0,45
–0,02 0,44 0,11 0,06 0,05 0,85 0,31 0,46
–0,15 0,39 0,20 0,03 0,17 0,12 0,47 0,50
–0,03 0,49
ГЛАВА 8
273
Рис. 8.15. А. Фракция митральной регургитации при измерении прямым методом и по данным допплеровского исследования. Б. Сравнение результатов по методу
Блэнда—Алтмана.
АНАЛИЗ ЗАВИСИМОСТЕЙ
274
гургитации с помощью допплеровского исследования*. Этот способ значительно проще и вполне безопасен. Насколько со- гласуются оценки, полученные двумя способами? Фракцию ре- гургитации обоими способами определили у 21 человека. Ре- зультаты приведены на рис. 8.15А и в табл. 8.7. Коэффициент корреляции между измерениями, выполненными обоими спо- собами, составил 0,89. Высокое значение коэффициента корре- ляции говорит о тесной линейной связи, однако для оценки со- гласованности этого недостаточно.
Помимо самих измерений в табл. 8.7 приведены усреднен- ные по каждому больному значения фракции регургитации и разности этих долей. На рис. 8.15Б изображены разности долей для каждого усредненного значения. Такое представление позво- ляет сделать ряд выводов. Во-первых, средняя разность между измерениями равна всего лишь –0,03, что говорит об отсутствии систематического расхождения. Во-вторых, стандартное откло- нение разностей составило 0,12, что невелико по сравнению с самими значениями. В-третьих, отсутствует зависимость раз- ности измерений от величины фракции регургитации. Таким образом, измерения, полученные обоими способами, хорошо со- гласуются друг с другом.
ЗАКЛЮЧЕНИЕ
Мы рассмотрели методы, предназначенные для оценки связи между двумя признаками. Успех применения этих методов опре- деляется тем, насколько математическая модель, лежащая в их основе, соответствует действительности. Особенно важна фор- ма зависимости — она должна быть линейной. Поэтому, перед тем как приступить к расчетам, нанесите данные на график —
это поможет вам правильно выбрать статистический метод (или отказаться от применения любого из них).
* A. I. MacIsaac, I. G. McDonald, R. L. G. Kirsner, S. A. Graham, R. W. Gill
Quantification of mitral regurgitation by integrated Doppler backscattei power.
J. Am. Coll. Cardioi, 24:690–695, 1994.
ГЛАВА 8
275
ЗАДАЧИ
8.1. Постройте графики для приведенных наборов данных.
Найдите для линии регрессии и коэффициенты корреляции.
X
Y
X
Y
X
Y
30 37 30 37 30 37 30 47 30 47 30 47 40 50 40 50 40 50 40 60 40 60 40 60 20 25 20 25 20 35 20 35 50 62 50 62 50 72 50 72 10 13 10 23 60 74 60 84
Нанесите данные и прямые регрессии на графики. Что в этих трех случаях общего, в чем различия?
8.2. Постройте графики для двух наборов данных. Найдите для каждого линию регрессии и коэффициент корреляции.
X
Y
X
Y
15 19 20 21 15 29 20 31 20 25 30 18 20 35 30 28 25 31 40 15 25 41 40 25 30 37 40 75 30 47 40 85 60 40 50 65 50 75 60 55 60 65
АНАЛИЗ ЗАВИСИМОСТЕЙ
Спирмена
Рост
Вес
Значение, см
Ранг
Значение, г Ранг
Разность рангов
31 1
7,7 2
–1 32 2
8,3 3
–1 33 3
7,6 1
2 34 4
9,1 4
0 35 5,5 9,6 5
0,5 35 5,5 9,9 6
–0,5 40 7
11,8 7
0 41 8
12,2 8
0 42 9
14,8 9
0 46 10 15,0 10 0
АНАЛИЗ ЗАВИСИМОСТЕЙ
264
Таблица 8.6. Критические значения коэффициента ранговой корреляции Спирмена
Уровень значимости
α
n
0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001 4
0,600 1,000 1,000 5
0,500 0,800 0,900 1,000 1,000 6
0,371 0,657 0,829 0,886 0,943 1,000 1,000 7
0,321 0,571 0,714 0,786 0,893 0,929 0,964 1,000 1,000 8
0,310 0,524 0,643 0,738 0,833 0,881 0,905 0,952 0,976 9
0,267 0,483 0,600 0,700 0,783 0,833 0,867 0,917 0,933 10 0,248 0,455 0,564 0,648 0,745 0,794 0,830 0,879 0,903 11 0,236 0,427 0,536 0,618 0,709 0,755 0,800 0,845 0,873 12 0,217 0,406 0,503 0,587 0,678 0,727 0,769 0,818 0,846 13 0,209 0,385 0,484 0,560 0,648 0,703 0,747 0,791 0,824 14 0,200 0,367 0,464 0,538 0,626 0,679 0,723 0,771 0,802 15 0,189 0,354 0,446 0,521 0,604 0,654 0,700 0,750 0,779 16 0,182 0,341 0,429 0,503 0,582 0,635 0,679 0,729 0,762 17 0,176 0,328 0,414 0,485 0,566 0,615 0,662 0,713 0,748 18 0,170 0,317 0,401 0,472 0,550 0,600 0,643 0,695 0,728 19 0,165 0,309 0,391 0,460 0,535 0,584 0,628 0,677 0,712 20 0,161 0,299 0,380 0,447 0,520 0,570 0,612 0,662 0,696 21 0,156 0,292 0,370 0,435 0,508 0,556 0,599 0,648 0,681 22 0,152 0,284 0,361 0,425 0,496 0,544 0,586 0,634 0,667 23 0,148 0,278 0,353 0,415 0,486 0,532 0,573 0,622 0,654 24 0,144 0,271 0,344 0,406 0,476 0,521 0,562 0,610 0,642 25 0,142 0,265 0,337 0,398 0,466 0,511 0,551 0,598 0,630 26 0,138 0,259 0,331 0,390 0,457 0,501 0,541 0,587 0,619 27 0,136 0,255 0,324 0,382 0,448 0,491 0,531 0,577 0,608 28 0,133 0,250 0,317 0,375 0,440 0,483 0.522 0,567 0,598 29 0,130 0,245 0,312 0,368 0,433 0,475 0,513 0,558 0,589 30 0,128 0,240 0,306 0,362 0,425 0,467 0,504 0,549 0,580 31 0,126 0,236 0,301 0,356 0,418 0,459 0,496 0,541 0,571 32 0,124 0,232 0,296 0,350 0,412 0,452 0,489 0,533 0,563 33 0,121 0,229 0,291 0,345 0,405 0,446 0,482 0,525 0,554 34 0,120 0,225 0,287 0,340 0,399 0,439 0,475 0,517 0,547 35 0,118 0,222 0,283 0,335 0,394 0,433 0,468 0,510 0,539 36 0,116 0,219 0,279 0,330 0,388 0,427 0,462 0,504 0,533 37 0,114 0,216 0,275 0,325 0,383 0,421 0,456 0,497 0,526 38 0,113 0,212 0,271 0,321 0,378 0,415 0,450 0,491 0,519 39 0,111 0,210 0,267 0,317 0,373 0,410 0,444 0,485 0,513 40 0,110 0,207 0,264 0,313 0,368 0,405 0,439 0,479 0,507
ГЛАВА 8
265
Таблица 8.6. Окончание
Уровень значимости
α
n 0,50 0,20 0,10 0,05 0,02 0,01 0,005 0,002 0,001 41 0,108 0,204 0,261 0,309 0,364 0,400 0,433 0,473 0,501 42 0,107 0,202 0,257 0,305 0,359 0,395 0,428 0,468 0,495 43 0,105 0,199 0,254 0,301 0,355 0,391 0,423 0,463 0,490 44 0,104 0,197 0,251 0,298 0,351 0,386 0,419 0,458 0,484 45 0,103 0,194 0,248 0,294 0,347 0,382 0,414 0,453 0,479 46 0,102 0,192 0,246 0,291 0,343 0,378 0,410 0,448 0,474 47 0,101 0,190 0,243 0,288 0,340 0,374 0,405 0,443 0,469 48 0,100 0,188 0,240 0,285 0,336 0,370 0,401 0,439 0,465 49 0,098 0,186 0,238 0,282 0,333 0,366 0,397 0,434 0,460 50 0,097 0,184 0,235 0,279 0,329 0,363 0,393 0,430 0,456
Если объем выборки больше 50, нужно применить критерий
Стыодента:
2 1
2
s
s
r
t
r
n
=
−
−
с числом степеней свободы
ν = n – 2.
В данном случае связь веса и роста можно было установить и без помощи коэффициента ранговой корреляции Спирмена.
Применение обычного коэффициента корреляции, как мы ви- дели, приводит к тем же результатам.
Сколько лабораторных анализов нужно врачу?
В первые дни пребывания в больнице больному обычно делают множество дорогостоящих анализов. Все ли из них необходимы?
Шредер с коллегами* попытались, анализируя работу 21 врача,
выяснить, существует ли связь между квалификацией врача и стоимостью необходимых ему анализов. Прежде всего, специ- альная комиссия оценила квалификацию каждого врача. Каж- дому из врачей присвоили ранг от 1 (лучшая квалификация) до
* S. A. Schroeder, A. Schliftman, Т. Е. Piemine. Variation among physici- ans in use of laboratory tests: relation to quality of care. Med. Care, 12:
709–713, 1974.
АНАЛИЗ ЗАВИСИМОСТЕЙ
266 21 (худшая квалификация). Затем была подсчитана средняя сто- имость анализов, которые потребовались каждому из врачей за первые 3 суток пребывания больного в клинике. Эти данные упорядочили по возрастанию; наименьшей стоимости присвои- ли ранг 1, наибольшей — 21.
В результате каждому врачу была присвоена пара рангов —
ранг по шкале квалификации и ранг по шкале расходов. Эти пары представлены на рис. 8.13. Остается выяснить связь меж- ду квалификацией врача и величиной расходов на необходимые ему анализы. Вычислив коэффициент Спирмена, получим все- го лишь r
s
= –0,13. Абсолютная величина r
s
оказалась меньше критического значения даже при уровне значимости
α = 0,05
(критическое значение r
0,05
= 0,435).
Однако значит ли это, что не существует связи между квали- фикацией врача и затратами на анализы? Нет. Связь существу- ет, но она не линейная. Присмотревшись к рис. 8.13, можно заме- тить, что самыми дешевыми анализы были у лучших и... худ- ших врачей. И тем и другим, чтобы уверенно судить о болезни,
не требуется много анализов. Причем, похоже, большей уверен- ностью отличаются именно худшие специалисты.
Но почему эта связь не была уловлена коэффициентом кор- реляции? Исключительно из-за ее нелинейной формы. Ни один из коэффициентов корреляции не сможет уловить зависимость,
график которой — перевернутая U-образная кривая с рис. 8.13.
Этот пример показьюает, что, прежде чем применять какие- либо методы анализа связей, следует примерно определить, ка- кой может быть форма зависимости. Лучший способ для этого —
просто нарисовать график, подобный изображенному на рис. 8.13.
ЧУВСТВИТЕЛЬНОСТЬ КОЭФФИЦИЕНТА КОРРЕЛЯЦИИ
Как уже говорилось, из статистической значимости коэффи- циента корреляции вытекает статистическая значимость коэф- фициента наклона. Ограничимся поэтому вычислением чувст- вительности коэффициента корреляции.
Можно показать, что величина
ГЛАВА 8
267
Рис. 8.13. А. Квалификация врача и стоимость анализов, которые он назначает больно- му в первые 3 дня госпитализации. Коэффициент ранговой корреляции Спирмена —
всего лишь –0,13. Можно было бы заключить, что стоимость анализов от квалифика- ции никак не зависит. Б. Приглядевшись к данным повнимательнее, можно заметить,
что зависимость на самом деле есть, только не линейная, а похожая на перевернутую букву U. Расходы на анализы выше у врачей средней квалификации, у наиболее и наи- менее квалифицированных врачей расходы ниже.
АНАЛИЗ ЗАВИСИМОСТЕЙ
268 1
1
ln
2 1
r
Z
r
+
=
−
имеет нормальное распределение со стандартным отклонением
1 3
Z
n
σ =
−
Тогда величина
Z
Z
z
=
σ
в отсутствие корреляции имеет стандартное нормальное рас- пределение со средним, равным нулю. Обозначим истинное зна- чение коэффициента корреляции
ρ (греческая «ро»). Тогда сред- ним значением z будет
Z
Z
ρ
σ , где
1 1
ln
2 1
Z
ρ
+ ρ
=
− ρ
Найдем, какой должна быть чувствительность, чтобы по вы- борке объемом 10 при уровне значимости 0,05 обнаружить кор- реляцию
ρ, не меньшую 0,9. На рис. 8.14 приведены два распре- деления z — для нулевого коэффициента корреляции и истин- ного, равного
ρ. (Заметьте, насколько этот этот рисунок похож на рис. 6.7.) Чувствительность равна площади под истинной кривой распределения z справа от критического значения z
α
.
Вычислим
1 1
1 1 0,9
ln ln
1,472 2
1 2
1 0,9
Z
ρ
+ ρ
+
=
=
=
− ρ
−
и
1 0,378.
3
Z
n
σ =
=
−
Уровню значимости
α = 0,05 соответствует критическое зна- чение z
α
= 1,960. Центром распределения z является
Z
Z
ρ
σ =
= 1,472/0,378 = 3,894. От этого центра критическое значение z
α
от-
ГЛАВА 8
269
стоит на 1,960 – 3,894 = –1,934 стандартных отклонения. Из табл.
6.4 находим, что площадь части стандартного нормального рас- пределения, расположенной правее –1,934 стандартного от- клонения от центра, составляет примерно 0,97. То есть искомая чувствительность равна 97%.
Итак, чувствительность 1 –
β, необходимая для обнаруже- ния корреляции, не меньшей
ρ, при уровне значимости α и при объеме выборки п равна площади под кривой стандартного нормального распределения правее точки
1 1
3
Z
z
z
n
ρ
−β
α
=
−
−
Эта формула для нахождения чувствительности по известно- му объему выборки. Если нужно найти объем выборки, при ко- тором достигалась бы чувствительность 1 –
ρ, то, разрешив это уравнение относительно п, получим:
1 3.
z
z
n
Z
α
−β
ρ
−
=
+
Рис. 8.14. Чувствительность выявления корреляции
ρ = 0,9 при объеме выборки n = 10
и уровне значимости
α = 0,05.
АНАЛИЗ ЗАВИСИМОСТЕЙ
270
СРАВНЕНИЕ ДВУХ СПОСОБОВ ИЗМЕРЕНИЯ: МЕТОД
БЛЭНДА—АЛТМАНА
Нередко требуется сравнить результаты измерений, выполнен- ных двумя методами, ни один из которых не является абсолют- но надежным. Например, некий гемодинамический показатель определяли непрямым, неинвазивным, методом. Допустим, изо- бретен новый метод, также непрямой. Естественно выяснить,
согласуются ли результаты измерений, выполненных старым и новым методами. Или похожий вопрос — насколько согласова- ны результаты повторных измерений, выполненных одним и тем же методом.
Итак, с помощью двух методов получены две серии измере- ний. Казалось бы, ничто не мешает применить регрессионный анализ или рассчитать коэффициент корреляции. Увы, эти, на первый взгляд, очевидные действия могут привести к ложными выводами.
Регрессионный анализ неприменим уже потому, что его ре- зультаты зависят от того, какую переменную считать незави- симой, а какую зависимой. Тут следует подчеркнуть отличие задачи сравнения двух методов измерения от задачи калибров-
ки, в которой приближенные измерения сравниваются с некото- рым эталоном. Типичный пример калибровки: приготовив ряд растворов известной концентрации, измерить ее исследуемым методом. Здесь регрессионный анализ вполне применим,
поскольку эталон — достоверно известная концентрация —
очевидным образом и является независимой переменной. На- против, при сравнении результатов двух приближенных мето- дов никакого эталона нет.
Что может дать коэффициент корреляции? Положим, он ста- тистически значимо отличается от нуля. Но ценен ли этот факт?
Нет, ведь проверялась корреляция измерений одной и той же
величины. В этом случае удивления было бы достойно как раз отсутствие значимой корреляции, говорящее о том, что резуль- таты, как минимум, одного из методов нимало не схожи с истин- ными значениями измеряемого признака. Это практически ис- ключено. Кроме того, как мы видели, даже весьма высоким ко-
ГЛАВА 8
271
эффициентам корреляции соответствует довольно значительная неопределенность предсказания зависимой переменной.
Д. Блэнд и Дж. Алтман предложили описательный метод оценки согласованности измерений, выполненных двумя спо- собами*. Идея метода очень проста. Для каждой — выполнен- ной одним и другим способами — пары измерений вычислим их разность. Найдем среднюю величину и стандартное откло- нение разности. Средняя разность характеризует системати-
ческое расхождение, а стандартное отклонение — степень раз- броса результатов. Далее, если в качестве оценки измеряемого признака взять среднее значение пары измерений, то можно определить, зависит ли расхождение от величины признака.
Последнее станет понятнее после того, как мы разберем при- мер применения метода Блэнда—Алтмана.
Два способа оценки митральной регургитации
Вспомним схему кровообращения. Из правого желудочка кровь поступает в легкие, где насыщается кислородом. Из легких кровь попадает в левое предсердие, затем — в левый желудочек. Отсю- да кровь перекачивается по всему телу, снабжая органы кислоро- дом, после чего попадает в правое предсердие и вновь в правый желудочек. Митральный клапан, расположенный между левым предсердием и левым желудочком, при сокращении желудочка закрывается и преграждает крови путь обратно в предсердие.
При митральной недостаточности возникает так называемая
митральная регургитация: часть крови при сокращении левого желудочка выбрасывается в предсердие. В результате легкие пе- реполняются кровью, что затрудняет их работу. Если мит- ральная регургитация слишком велика, клапан необходимо за- менять искусственным, — вот почему ее количественная оценка чрезвычайно важна. Такой оценкой служит фракция регургита-
ции — доля крови, которая при каждом сокращении выбрасыва-
* Более подробное изложение этой процедуры можно найти в статьях:
D. G. Altman and J. M. Bland. Measurement in medicine: the analysis of method comparison studies. Statistician, 32:307—317,1983 и J. M. Bland and D. G. Altman. Statistical methods for assessing agreement between two measures of clinical measurement. Lancet, 1(8476):307—310, 1986.
АНАЛИЗ ЗАВИСИМОСТЕЙ
272
ется из левого желудочка в левое предсердие. В норме фракция регургитации равна нулю; чем тяжелее митральная недостаточ- ность, тем более фракция регургитации приближается к еди- нице.
Фракцию регургитации можно определить с помощью ка- тетеризации сердца. В левый желудочек вводят катетер, а через него — рентгеноконтрастный препарат. Наблюдая за его рас- пространением, можно определить, какая доля крови выбра- сывается в левое предсердие. Описанный способ трудно назвать приятным, дешевым и безопасным.
Э. Мак-Исаак с соавт. предложили определять фракцию ре-
Таблица 8.7. Фракция митральной регургитации по данным ка- тетеризации сердца и допплеровского исследования
Допплеровское
Среднее исследование
Катетеризация
Разность значение
0,49 0,62
–0,13 0,56 0,83 0,72 0,11 0,78 0,71 0,63 0,08 0,67 0,38 0,61
–0,23 0,50 0,57 0,49 0,08 0,53 0,68 0,79
–0,11 0,74 0,69 0,72
–0,03 0,71 0,07 0,11
–0,04 0,09 0,75 0,66 0,09 0,71 0,52 0,74
–0,22 0,63 0,78 0,83
–0,05 0,81 0,71 0,66 0,05 0,69 0,16 0,34 0,18 0,25 0,33 0,50
–0,17 0,42 0,57 0,62
–0,05 0,60 0,11 0,00 0,11 0,06 0,43 0,45
–0,02 0,44 0,11 0,06 0,05 0,85 0,31 0,46
–0,15 0,39 0,20 0,03 0,17 0,12 0,47 0,50
–0,03 0,49
ГЛАВА 8
273
Рис. 8.15. А. Фракция митральной регургитации при измерении прямым методом и по данным допплеровского исследования. Б. Сравнение результатов по методу
Блэнда—Алтмана.
АНАЛИЗ ЗАВИСИМОСТЕЙ
274
гургитации с помощью допплеровского исследования*. Этот способ значительно проще и вполне безопасен. Насколько со- гласуются оценки, полученные двумя способами? Фракцию ре- гургитации обоими способами определили у 21 человека. Ре- зультаты приведены на рис. 8.15А и в табл. 8.7. Коэффициент корреляции между измерениями, выполненными обоими спо- собами, составил 0,89. Высокое значение коэффициента корре- ляции говорит о тесной линейной связи, однако для оценки со- гласованности этого недостаточно.
Помимо самих измерений в табл. 8.7 приведены усреднен- ные по каждому больному значения фракции регургитации и разности этих долей. На рис. 8.15Б изображены разности долей для каждого усредненного значения. Такое представление позво- ляет сделать ряд выводов. Во-первых, средняя разность между измерениями равна всего лишь –0,03, что говорит об отсутствии систематического расхождения. Во-вторых, стандартное откло- нение разностей составило 0,12, что невелико по сравнению с самими значениями. В-третьих, отсутствует зависимость раз- ности измерений от величины фракции регургитации. Таким образом, измерения, полученные обоими способами, хорошо со- гласуются друг с другом.
ЗАКЛЮЧЕНИЕ
Мы рассмотрели методы, предназначенные для оценки связи между двумя признаками. Успех применения этих методов опре- деляется тем, насколько математическая модель, лежащая в их основе, соответствует действительности. Особенно важна фор- ма зависимости — она должна быть линейной. Поэтому, перед тем как приступить к расчетам, нанесите данные на график —
это поможет вам правильно выбрать статистический метод (или отказаться от применения любого из них).
* A. I. MacIsaac, I. G. McDonald, R. L. G. Kirsner, S. A. Graham, R. W. Gill
Quantification of mitral regurgitation by integrated Doppler backscattei power.
J. Am. Coll. Cardioi, 24:690–695, 1994.
ГЛАВА 8
275
ЗАДАЧИ
8.1. Постройте графики для приведенных наборов данных.
Найдите для линии регрессии и коэффициенты корреляции.
X
Y
X
Y
X
Y
30 37 30 37 30 37 30 47 30 47 30 47 40 50 40 50 40 50 40 60 40 60 40 60 20 25 20 25 20 35 20 35 50 62 50 62 50 72 50 72 10 13 10 23 60 74 60 84
Нанесите данные и прямые регрессии на графики. Что в этих трех случаях общего, в чем различия?
8.2. Постройте графики для двух наборов данных. Найдите для каждого линию регрессии и коэффициент корреляции.
X
Y
X
Y
15 19 20 21 15 29 20 31 20 25 30 18 20 35 30 28 25 31 40 15 25 41 40 25 30 37 40 75 30 47 40 85 60 40 50 65 50 75 60 55 60 65
АНАЛИЗ ЗАВИСИМОСТЕЙ