Файл: Н. З. Мусина фарМацевтическая иНфорМация Первый Московский Государственный Медицинский Университет имени И. М. Сеченова Фармацевтический факультет Кафедра фармакологии фармацевтического факультета Учебное пособие.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 08.11.2023
Просмотров: 508
Скачиваний: 11
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
33
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
Для примера рассмотри исследование по лечению депрессии, в ко- тором 2% участников в контрольной группе испытывали депрессию
(то есть Rc=0,02). Проведенная терапия снизила риск депрессии до
1% (Rc=0,01). Относительный риск (RR) = Ri/Rc = 0,01/0,02 = 0,5.
То есть риск снижается в 2 раза, и это выглядит, как очень значи- мый эффект. Однако при расчете снижения абсолютного риска (ARR) получаем:
ARR = Rc-Ri = 0,02-0,01 = 0,01 или 1%
Излечение депрессии происходит у одного из 100 человек. Такой по- казатель выглядит менее значимо, чем снижение риска в 2 раза. Таким образом, при оценке результатов исследования необходимо трактовать показатели относительного риска и отношения шансов в контексте того, как часто данный исход наблюдается в популяции.
На основе показателя «снижение абсолютно риска» вычисляется другой часто применяемый показатель – число пациентов, которых
необходимо пролечить
(Number needed to treat (NNT)). NNT показы- вает, сколько пациентов надо пролечить, чтобы избежать одного неблагоприятного исхода, и рассчитывается как величина, обратная абсолютному снижению риска:
NNT = 1/ARR = 1/(Rc-Ri) = 1/0,01 = 100
Это удобный способ выражения клинической эффективности: чем более эффективно вмешательство, тем ниже NNT.
1 2 3 4 5 6 7 8 9 10
Тема 4.
«Аналитическая биостатистика»
После изучения этой темы студент должен знать:
• Определение термина «аналитическая биостатистика».
• Определение стандартной ошибки и доверительного интервала.
• Определение понятий: нулевая гипотеза, альтернативная гипотеза, статистическая значимость.
После изучения этой темы студент должен уметь:
• Рассчитывать стандартную ошибку средней.
• Рассчитывать и интерпретировать доверительные интервалы.
• Осуществлять проверку гипотез в программе MS Excel.
4.1. Введение
После проведения первичной статистической обработки данных – группирования данных, определения центральной тенденции (средняя, мода, медиана) и оценок вариации (размах колебаний, среднее ква- дратическое отклонение, дисперсия, размах квартилей) – возникает
34
Н.З. Мусина
необходимость ответить на вопрос: «Какой вывод можно сделать из полученных данных?». Решение данного вопроса является предметом изучения аналитической биостатистики.
Аналитическая биостатистика (Inferential biostatistics)
– это раздел биостатистики, решающий задачу получения статистических выводов на основе собранной и систематизированной информации об объекте исследования.
При проведении исследования мы изучаем выборку, сформирован- ную из объектов генеральной совокупности, и используем информацию о выборке для формирования выводов о генеральной совокупности.
Однако, если даже исследование проводилось правильно, такой резуль- тат, как 5% снижение смертности у пациентов, принимавших препарат
А, по сравнению с теми, кто его не принимал, не всегда значит, что лечение действительно эффективно. Смертность в данной выборке могла снизиться просто из-за случайности. Ведь мы же не делаем никаких выводов, когда при игре в кости какая-либо цифра выпадает много раз подряд, мы объясняем это случайностью.
Такая же логика применима к результатам медицинских вмеша- тельств. Эффект от вмешательства особенно очевиден, когда прово- дится мало испытаний. Поэтому необходим статистической анализ результатов исследования, позволяющий сделать вывод о том, в какой степени результаты могут быть объяснены случайностью.
4.2. Стандартная ошибка среднего
Если сформировать много выборок из генеральной совокупности, значения средней в каждой выборке будут отличаться. Статистическая теория гласит, что если бы мы могли повторять эксперимент несколько сотен раз на различных выборках из одной популяции, результат всег- да будет разным. Таким образом, среднюю можно рассматривать как случайную величину, так как результат любого исследования может отличаться от истинного значения случайно. Степень этого отличия измеряет стандартная ошибка (standard error, SE).
Стандартная ошибка среднего – это теоретическое стандартное отклонение всех средних выборки размера n, извлекаемое из совокупности, и зависящая от совокупной дисперсии и размера выборки (n), выглядит следующим образом:
SE
s
n
x
( )
=
2
35
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
Чем больше стандартная ошибка, тем больше отличие выборочной средней от генеральной средней. При увеличении объема выборки стандартная ошибка и дисперсия стремятся к нулю. То есть, чем боль- ше объем выборки, тем меньше выборочная и генеральная средние отличаются друг от друга.
4.3. Доверительные интервалы
В статистике часто используют так называемые доверительные интервалы, соответствующие заданной (как правило, заранее) довери- тельной вероятности. Доверительной вероятностью оценки числовой характеристики с помощью доверительного интервала называется вероятность того, что эта характеристики находится в данном интер- вале. Чем шире доверительный интервал, тем выше соответствующая доверительная вероятность, и наоборот: чем большую доверительную вероятность оценки числовой характеристики мы хотим обеспечить, тем большим окажется соответствующий доверительный интервал.
Доверительный интервал для интервальной оценки генеральной средней при заданной доверительной вероятности находят по формуле:
x
x
z
SE
−
×
( )
−
1 2
α
,
x
x
z
SE
+
×
( )
−
1 2
α
где
x
–средняя выборочная,
SE x
( )
– стандартная ошибка средней,
z
1 2
−
α
– стандартное нормальное отклонение доверительного интерва- ла, значение которого определяется уровнем значимости (α).
Уровень значимости равен 0.05 при 0.95 доверительной вероятности.
При решении статистических задач в фармации, медицине и биологии до- верительную вероятность, как правило, принимают равной 0.95 или (реже)
0.99. 95% доверительный интервал – это интервал значений, в пределах которого с вероятностью 95% находится истинное значение. Чем меньше объем выборки или больше вариабельность изучаемого признака, тем больше стандартная ошибка и тем шире доверительный интервал. Стан- дартное нормальное отклонение 95% доверительного интервала равно 1.96.
При нормальном распределении случайной величины 95% измере- ний будут находиться в интервале двух стандартных отклонений в обе стороны от средней. А при формировании множества выборок из одной генеральной совокупности истинное значение генеральной средней будет находиться в интервале двух стандартных ошибок в обе стороны от каждой средней выборочной для 95% выборок.
36
Н.З. Мусина
Многие биомедицинские журналы требуют представлять данные в виде доверительных интервалов. Доверительные интервалы могут также служить для ответа на вопрос о значимости различий между группами.
Например, судить об эффективности лечения можно по значимости различий между средними до и после лечения и между средними ис- следуемой и контрольной групп. Если доверительные интервалы для средних значений артериального давления в группе до и после лечения пересекаются (например, 145±6 мм рт.ст. и 138±8 мм рт.ст., соответ- ственно), то мы не можем утверждать с заданным уровнем вероятности, что эти изменения статистически значимы. Также, если доверительный интервал для отношения шансов или относительного риска включает значение 1 (то есть одинаковые шансы и риски в обеих группах), то мы не можем утверждать с заданным уровнем вероятности, что различия между контрольной и исследуемой группами статистически значимы.
4.4. Проверка гипотез
Другим подходом позволяющим судить о значимости различий между двумя выборками является проверка гипотез. В этом случае про- веряется предположение о том, что найденные различия между двумя выборками неслучайны и, следовательно, отражают действительные различия между двумя генеральными совокупностями. Различие групп означает их неравенство по некоторому показателю (смертности, зна- чению артериального давления, сроку выздоровления и т.д.). Чтобы обосновать этот вывод, применяется формальный логический прием.
Доказать правильность гипотезы проведением подтверждающего ее эксперимента нельзя, зато можно высказать противоположную гипо- тезу, и отвергнуть ее опытом. Поэтому сначала предполагается, что группы неразличимы (нулевая гипотеза). Затем проверяется, может ли эта гипотеза быть отклонена. Отклонение нулевой гипотезы и озна- чает неравенство групп, то есть принятие альтернативной гипотезы.
Альтернативная гипотеза состоит в том, что различия между группами не случайны, а отражают истинные различия между генеральными совокупностями, из которых получены выборки. Для испытания ну- левой гипотезы используют разнообразные статистические критерии
(статистические тесты).
4.4.1. Статистические критерии
Статистическими критериями или критериями для проверки гипотез называют математические показатели, вычисляемые на основании экс- периментальных данных, для того чтобы установить, не являются ли
37
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
полученные результаты, подтверждающие гипотезу исследователя или опровергающие ее, только лишь случайными. Для этого вычисляется величина статистического критерия. В общем виде она вычисляется следующим образом:
Статистика критерия = (наблюдаемая величина – ожидаемая ве- личина при нулевой гипотезе)/стандартная ошибка наблюдаемой величины
Статистика критерия показывает, на сколько стандартных ошибок выборочное значение отличается от значения при условиях нулевой ги- потезы. Для того чтобы оценить статистику критерия, ее сравнивают со стандартным распределением этой статистики. Это может быть нормальное распределение или специальное распределение для этой статистики. Если полученная в результате расчета статистика критерия очень мала или очень велика, то можно отклонить нулевую гипотезу. Также возможно рассчитать точное значение вероятности наблюдать анализируемые данные, если бы нулевая гипотеза была верна (значение p). В этом случае нулевая гипотеза отвергается, если, р≤ выбранного уровня значимости (обычно 0.05).
NB!
Статистическими критериями или критериями для проверки гипо- тез называют математические показатели, вычисляемые на основании экспериментальных данных, для того чтобы установить, не являются ли полученные результаты, подтверждающие гипотезу исследователя или опровергающие ее, только лишь случайными.
4.4.2. Два типа ошибок
Никакой статистический критерий не дает абсолютной уверенности в различии групп или в их идентичности. Напротив, все статисти- ческие критерии позволяют утверждать что-либо лишь с некоторой вероятностью. Допустим, в ходе исследования была принята нулевая гипотеза, то есть был сделан вывод, что различия отсутствуют. Но всегда существует вероятность, что различия на самом деле есть, то есть, что исследователь принял нулевую гипотезу, когда ее нужно было отвергнуть. Такой тип ошибок называется β-ошибка или ошибка типа II (читается ошибка второго типа). Такие ошибки очень часто встречаются в клинических исследованиях. Вероятность ошибки типа
II снижается при увеличении объема выборки.
38
Н.З. Мусина
Ошибка типа I или α-ошибка случается, если отвергается нулевая гипотеза и делается вывод о наличии различий, в то время, как на са- мом деле они отсутствуют. Другими словами, это проблема заключа- ется в том одном случае из двадцати, когда р=0,05. Минимизировать вероятность ошибки типа I можно снизив уровень вероятности, напри- мер, считая результаты статистически значимыми при р≤0,01. В этом случае вероятность ошибки типа I составляет только 1 из 100. Однако, снижая вероятность ошибки типа I, мы повышаем вероятность ошибки типа II (вероятность отвергнуть существующие различия). Опять реше- нием проблемы и в этом случае является увеличение объема выборки.
4.5. Выбор статистического критерия
Важным аспектом статистической проверки гипотез является вы- бор статистического критерия.
При выборе статистического критерия нужно, прежде всего, идентифицировать тип переменных (признаков) и тип распределения данных, который получился в исследовании.
На рисунке 10 представлен график (называемый также кривой
Гаусса) нормального закона распределения, или закона Гаусса, и его математическое представление. Этот закон, его свойства и связанные с ним теоремы играют важную роль в статистике, являясь теоретиче- ской основой для статистических критериев. Столь большое значе- ние закона нормального распределения в аналитической статистике объясняется предельным (универсальным) характером, которым он обладает: все остальные законы распределения (ненормальные, напри- мер Пуассона, биноминальное и т.п.) приближаются к нормальному закону распределения при определенных условиях. Фактически все статистические критерии, имеющие в своей основе законы распреде- ления, отличные от нормального, представляют собой статистические параметры видоизмененного к тем или иным условиям нормального закона распределения. Также необходимо отметить тот факт, что все массовые явления, включающие в себя и медицинские, подчиняют- ся нормальному закону распределения (закону Гаусса). Важнейшим свойством закона распределения, является тот факт, что площадь, ограниченная сверху кривой распределения, а снизу осью абсцисс, равна единице, так как представляет собой графическое выражение полной вероятности наступления события.
Параметрические критерии используются в том случае, когда рас- пределение полученных данных рассматривается как нормальное. Нор- мальное распределение с большей вероятностью (но не обязательно) получается при выборках более 100 испытуемых (может получиться
39
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
и при меньшем количестве, а может не получиться и при большем).
При использовании параметрических критериев необходима проверка нормальности распределения.
Для непараметрических критериев тип распределения данных не имеет значения. При небольших объемах выборки испытуемых це- лесообразно выбрать непараметрические критерии, которые дают большую достоверность выводам, независимо от того, получено ли в исследовании нормальное распределение данных. В некоторых случаях статистически обоснованные выводы могут быть сделаны даже при выборках в 5–10 испытуемых.
Во многих исследованиях осуществляется поиск различий в изме- ряемых показателях у испытуемых, имеющих те или иные особенности.
При обработке соответствующих данных могут использоваться крите- рии для выявления различий в уровне исследуемого признака или в его распределении. Для определения значимости различий в проявлении признака в исследованиях часто используются такие показатели, как парный критерий Вилкоксона, U-критерий Манна–Уитни, критерий
χ-квадрат (χ
2
), точный критерий Фишера, биномиальный критерий.
Во многих исследованиях осуществляется поиск взаимосвязи ис- следуемых показателей у одних и тех же испытуемых. Для обработки соответствующих данных могут использоваться коэффициенты корреляции. Связь величин друг с другом и их зависимость часто характеризуется коэффициентом линейной корреляции Пирсона и
Рис. 10. Кривая Гаусса
40
Н.З. Мусина
коэффициентом ранговой корреляции Спирмена. В табл. 8 приведены некоторые часто используемые статистические критерии.
Важным аспектом статистической проверки гипотез является вы- бор одно- или двухстороннего статистического критерия. Например, если исследователь изучает действие ингибитора холинэстеразы на ее активность, то он может ограничиваться ожиданием только одного эффекта – более низкой активности фермента у подвергнутых экс- позиции людей по-сравнению со здоровыми. Если же сравнивается действие двух гиполипидемических препаратов, то возможно, что один из них окажется активнее другого. Поэтому нужно изучить обе возможности. Практически важно, что критическая величина р для критерия двухсторонних различий выше и соответственно достигается труднее. Поэтому некоторые исследователи используют односторонний критерий там, где следовало бы использовать двухсторонний. Так про- ще достигается статистически значимое различие, но это увеличивает вероятность того, что это будет ложное различие (ошибка типа I).
Всегда, когда применяется односторонний критерий, для этого должны быть ясные основания.
4.6. Корреляционный анализ
При изучении корреляций стараются установить, существует ли какая-то связь между двумя показателями в одной выборке (напри- мер, между ростом и весом людей) либо между двумя различными выборками (например, при сравнении пар близнецов), и если эта
Таблица 8
Некоторые часто используемые статистические критерии
Параметрический
критерий
Непараметрический
критерий
Назначение критерия
Две независимые выборки (непарный) t-критерий
U-тест Манна-
Уитни
Сравнивает 2 независимые вы- борки
Две зависимые выборки (парный) t-критерий
Тест Вилкоксона
Сравнивает наблюдения за одними и теми же образцами
Коэффициент корре- ляции Пирсона
Коэффициент корреляции рангов
Спирмена
Оценивает силу линейной взаимо- зависимости между двумя количе- ственными переменными
Параметрический аналог отсутствует
χ
2
-критерий
Проверяет нулевую гипотезу, что пропорции переменных, изменяю- щихся на двух уровнях, независи- мы от второй переменной