Файл: Н. З. Мусина фарМацевтическая иНфорМация Первый Московский Государственный Медицинский Университет имени И. М. Сеченова Фармацевтический факультет Кафедра фармакологии фармацевтического факультета Учебное пособие.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 08.11.2023

Просмотров: 501

Скачиваний: 11

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

22
Н.З. Мусина
тематике по электронной почте, по желанию. Возможно получение обновлений еженедельно или ежемесячно, в формате индексов или рефератов.
2.3. Поиск в Кокрановской библиотеке
Кокрановская библиотека (Cochrane Library) включает:
– кокрановский регистр контролируемых испытаний (Cochrane
Registry of Controlled Studies);
– базу данных по методологии обзоров (Cochrane Review Methodol- ogy Database);
– базу данных по оценке медицинских технологий (Health Technol- ogy Assessment Database) (содержит отчеты по систематическим обзорам и программы комплексной оценки медицинских техно- логий);
– кокрановская база данных систематических обзоров (Cochrane
Database of Systematic Reviews);
– база данных рефератов обзоров эффективности (Database of Ab- stracts of Reviews of Effectiveness).
Названа библиотека в честь английского эпидемиолога Арчи Ко- крейна, который предложил в 1972 г. составить центральный между- народный регистр клинических испытаний. Сейчас Кокрановская библиотека содержит более 4000 систематических обзоров, сотни тысяч контролируемых клинических испытаний. Опубликованные статьи вводятся в кокрановские базы данных участниками Кокрановского сотрудничества, которое объединяет специалистов в области медицины по всему миру.
Кокрановская библиотека доступна на сайте: www.cochrane.org. По- иск по базам данных сходен с системой поиска в Medline.
Тема 3.
«Описательная биостатистика»
После изучения этой темы студент должен знать:
• Отличие между описательной и аналитической статистикой.
• Определение основных статистических понятий (генеральная совокупность, выборка, объем выборки, событие, испытание, случайная величина).
• Виды признаков.
• Графические методы представления материала.
• Числовые методы представления материала.
• Меры центральной тенденции.

23
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
• Меры вариабельности.
После изучения этой темы студент должен уметь:
• Представлять анализируемые данные графически.
• Рассчитывать среднюю, медиану, моду, стандартное отклонение и дисперсию.
3.1. Введение
Биостатистика
– раздел статистики, связанный с разработкой и использованием статистических методов в научных исследованиях в медицине, здравоохранении и эпидемиологии. Выделяют два направ- ления в биостатистике: описательную и аналитическую биостатистику.
Целью описательной биостатистики является сбор и систематизация данных (в том числе получение обобщенных показателей) о предмете исследования. Аналитическая биостатистика ставит перед собой задачу получения статистических выводов на основе собранной и си- стематизированной информации об объекте исследования.
NB!
Описательная биостатистика собирает и систематизирует данные о предмете исследования. Аналитическая биостатистика делает ста- тистические выводы на основе собранной и систематизированной информации об объекте исследования.
3.2. Основные статистические понятия
Часть объектов исследования, определенным образом избранная из более обширной совокупности, называется выборкой, а исходная совокупность, из которой взята выборка, – генеральной (основной) со-
вокупностью
. Важнейшая характеристика выборки – объем выборки, то есть число элементов в ней. Число элементов в генеральной совокупности называется объемом генеральной совокупности (обозначается N). Относи- тельно N, как правило, делается предположение, что он бесконечно велик, то есть выборка получается из бесконечной генеральной сово- купности.
Эксперимент, согласно терминологии теории вероятностей, назы- вается испытанием. Результатом каждого испытания является тот или иной его исход, называемый событием. В испытаниях, исход которых не может быть однозначно определен, события называют случайными.
Случайной величиной
называют такую величину, которая в результате эксперимента принимает какое-либо одно значение из множества ее


24
Н.З. Мусина
возможных значений, причем до эксперимента невозможно предска- зать, какое именно.
Все объекты (элементы), составляющие генеральную совокупность, должны иметь хотя бы один общий признак, позволяющий класси- фицировать объекты, сравнивать их друг с другом (например, пол, возраст, спортивная квалификация и т.п.). Предметом изучения в статистике являются изменяющиеся (варьирующие) признаки, кото- рые иногда называют статистическими признаками. Они делятся на качественные и количественные.
3.3. Виды признаков
Качественные
признаки – это признаки, которыми объект обладает либо не обладает. Они не поддаются непосредственному измерению
(например, цвет волос, глаз, пол, наличие того или иного заболевания и т.п.). Они подразделяются на бинарные и ординарные (упорядочен- ные).
Бинарные
данные характеризуют признак, который может принимать только два значения, по принципу да/нет, например, болен/здоров
(болен/не болен).
Упорядоченные
данные (ординарные) – это вид качественных дан- ных, которые после сбора были упорядочены по какому-то принципу, например распределение пациентов по стадиям заболеваний – I, II,
III и т.д. стадия.
Количественные
признаки – это результаты подсчета или изме- рения. В соответствии с этим они делятся на дискретные и непре- рывные. Примерами количественных данных являются количество госпитализаций пациентов с ишемической болезнью сердца, рост, уровень гемоглобина в крови и т.д.
Количественные дискретные
признаки могут быть выражены в виде целых положительных чисел. Количество приступов бронхиальной астмы у пациента за исследуемый период можно отнести к количе- ственным дискретным данным, количество госпитализаций в год и т.д.
Количественные непрерывные
признаки могут принимать любое значение в установленном интервале, и перечислить все значения которого не представляется возможным. Так, например, данные о температуре пациента, изменения массы тела пациента в результате проводимой терапии относятся к количественным непрерывным данным, так как могут принимать в ограниченном интервале любое значение.

25
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
3.4. Графическое представление данных
Графическое представление данных является частью анализа дан- ных. Правильный способ представления данных позволяет ряды цифр превратить в понятные графические образы. Выделяют следующие виды графиков: гистограммы, диаграммы и скаттерграммы.
Гистограмма используется для представления распределения слу- чаев по величине отдельного признака, обычно количественного, реже – ординального. На гистограмме хорошо видно, какие величины являются типичными (мода), насколько симметрично распределение, имеются ли выскакивающие величины. На гистограмме по оси аб- сцисс откладывается величина признака. По ординате откладывается число случаев с данным значением или доля случаев с таким значением в процентах. Последнее удобнее, если сравниваются гистограммы для выборок различного размера. На рис. 5 приведена гистограмма частот распределения больных по возрасту (интервал 2,5 года), иллюстри- рующая данные табл. 5. Гистограмму не следует путать со столбиковой диаграммой.
Столбиковая диаграмма используется для представления сведений о значении количественного признака в сравниваемых группах, выде- ленных по номинативному признаку (например, распространенность заболевания по территориям), или частоты номинативного признака
Рис. 5. Гистограмма частот распределения больных по возрасту (интервал
2,5 года)


26
Н.З. Мусина
в сравниваемых группах (частота симптома при разных вариантах болезни). В табл. 6 приведены данные по распределению больных в стационаре по стадиям артериальной гипертонии. На рис. 6 приведена столбиковая диаграмма, иллюстрирующая табл. 5.
Секториальная диаграмма используется для представления сведений о распределении случаев выборки по номинативным признакам (на- пример, распределение пациентов по диагнозу). На рис. 7 приведена секториальная (круговая) диаграмма, иллюстрирующая данные табл. 5.
Линейная диаграмма обычно используется для представления из- менений количественного признака во времени. При этом время традиционно откладывается по абсциссе слева направо. На рис. 8 при- ведена линейная диаграмма, иллюстрирующая динамику изменения температуры тела у больного в течение суток.
Скаттерграмма (точечная диаграмма) используется для представ- ления случаев по двум признакам одновременно. На скаттерграмме видно, как связаны между собой значения двух признаков. На рис. 9
Таблица 5
Распределение больных по стадиям артериальной гипертонии
Стадия артериальной гипертонии
Относительная частота
I стадия
0,2
II стадия
0,3
III стадия
0,5
Рис. 6. Столбиковая диаграмма распределения больных по стадиям арте-
риальной гипертонии

27
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
приведена скаттерграмма, отражающая взаимосвязь между возрастом больных и продолжительностью занятий физкультурой (использова- лись данные табл. 8).
3.5. Числовые характеристики данных
Основной целью числовых характеристик в описательной статистике яв- ляется оценка суммарных, общих показателей для характеристики выборки.
Рис. 7. Секториальная диаграмма распределения больных по стадиям ар-
териальной гипертонии
Рис. 8. Динамика изменения температуры тела у больного в течение суток

28
Н.З. Мусина
3.5.1. Оценка центральной тенденции
Величина, наиболее типичная для изучаемого признака, называется центральной тенденцией. Применительно к ординальным признакам центральная тенденция соответствует тому рангу, который встречается чаще всего. Применительно к количественным признакам в зависи- мости от того, как определяется «типичное», центральная тенденция может быть определена по-разному.
Наиболее часто для характеристики центральной тенденции при описании количественных признаков применяют выборочную сред- нюю (
x
). Она представляет среднее арифметическое всех значений изучаемого признака в выборке и рассчитывается по следующей фор- муле:
x
x
n
i
n
i
=
=

1
Медианой (Ме) называется такое значение признака X, когда по- ловина значений экспериментальных данных меньше ее, а вторая половина – больше. Широкое использование этой характеристики на практике объясняется простотой ее вычисления и независимостью от формы распределения эмпирических данных. Если данных немного
(объем выборки невелик), медиана вычисляется очень просто. Для
Рис. 9. Скаттерграмма, отражающая взаимосвязь возраста с продолжитель-
ностью занятий физкультурой


29
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
этого выборку ранжируют, то есть располагают данные в порядке возрастания или убывания, и в ранжированной выборке, содержа- щей n членов, ранг R (порядковый номер) медианы определяется как
R=(n+1)/2. Например, имеется ранжированная выборка, содержащая нечетное число членов n = 9: 12 14 14 18 20 22 22 26 28. Тогда ранг ме- дианы R=(9+1)/2=5 и медиана, обозначаемая символом Ме, совпадает с пятым членом ряда: Ме = 20.
Если выборка содержит четное число членов, то медиана не может быть определена столь однозначно. Например, получен ряд из 10 чле- нов: 6 8 10 12 14 16 18 20 22 24. Ранг медианы оказывается равным 5,5.
Медианой в этом случае может быть любое число между 14 и 16 (5-м и 6-м членами ряда). Для определенности принято считать в качестве медианы среднее арифметическое этих значений, т.е. (14+16)/2=15.
Мода (Мо) представляет собой значение признака, встречающееся в выборке наиболее часто. Ряд называется унимодальным, если в нем только одно модальное значение, и полимодальным, если есть не- сколько значений признака, которые встречаются одинаково часто.
Для полимодального ряда моду не вычисляют.
NB!
Величина, наиболее типичная для изучаемого признака, называ- ется центральной тенденцией. Мерой центральной тенденции могут служить выборочная средняя, медиана, мода.
3.5.2. Оценка вариабельности
Средние значения не дают полной информации о варьирующем признаке. Нетрудно представить себе два эмпирических распределения, у которых средние одинаковы, но при этом у одного из них значения признака рассеяны в узком диапазоне вокруг среднего, а у другого – в широком. Поэтому наряду со средними значениями вычисляют и вариабельность выборки. Мерами вариабельности могут быть размах вариации, дисперсия, стандартное отклонение, размах квартилей.
Размах вариации (колебаний) – разность между максимальной и минимальной вариантами выборки: R = Xmax-Xmin. Размах колебаний используется как первичная грубая характеристика вариации признака, так как зависит лишь от двух значений признака – максимального и минимального.
Дисперсией называется средний квадрат отклонения значений при- знака от среднего арифметического. Дисперсия, вычисляемая по вы-

30
Н.З. Мусина
борочным данным, называется выборочной дисперсией и обозначает- ся
s
2
. Выборочную дисперсию вычисляют по приведенной ниже формуле:
s
n
x x
i
n
i
2 1
2 1
1
=


(
)
=

или
s
n
n
x
x
2 2
2 1
=


(
)
Наибольшую ценность при анализе данных имеет не дисперсия (так как получаемые при её расчете данные имеют абстрактную размер- ность «в квадрате»), а производная от неё характеристика – среднее
квадратическое отклонение
, или стандартное отклонение (Standart deviation), которое определяется как корень квадратный из дисперсии и обозначается S.
Стандартное отклонение, являясь основной характеристикой вариа- ции признака, имеет широкое применение в статистическом анализе при проведении статистических тестов.
Такая характеристика вариации как размах квартилей (Inter-quartile range), также как и медиана применима только для упорядоченных
(ранжированных) по возрастанию/убыванию данных. Под квартилями понимают значения, которые делят весь ранжированный ряд данных на четыре равные по численности группы. Размах квартилей определяется как разность третьего и первого квартилей: Q=Q3-Q1. При этом между первым и третьим квартилем находится 50% данных, а второй квартиль совпадает с медианой.
NB!
Мерами вариабельности могут быть размах вариации, дисперсия, стандартное отклонение, размах квартилей.
3.5.3. Оценка рисков
Одним из наиболее распространенных в медицинской практики способов выражения эффективности является оценка влияния меди- цинской технологии на риск возникновения того или иного благопри- ятного/неблагоприятного состояния. Биостатистика предоставляет ряд показателей, связывающих медицинскую технологию и результат её применения. К наиболее распространенным показателям оценки риска относятся:


31
ФАРМАЦЕВТИЧЕСКАЯ ИНФОРМАЦИЯ
• Относительный риск, или соотношение рисков (Risk Ratio).
• Соотношение шансов (Odds Ratio).
• Снижение абсолютного риска (Absolute risk reduction).
• Число пациентов, нуждающихся в лечении (Number needed to treat).
Относительный риск, или соотношение рисков
(Risk Ratio) определя- ется как отношение риска наступления исхода в группе применения данной медицинской технологии к риску наступления исхода в кон- трольной группе. Риск исхода в исследуемой группе вычисляется как отношение числа людей с наступившим исходом к общему числу людей в исследуемой группе. Так же вычисляется риск исхода в контрольной группе. Для иллюстрации рассмотрим таблицу 6.
Относительный риск
RR
Ri
Rc
a a c
b b d
( )
=
=
+
(
)
+
(
)
Если отличие между контрольной и исследуемой группой отсутству- ет, тогда риск исхода в обеих группах одинаков, и относительный риск равен 1. Если риск исхода ниже в исследуемой группе по сравнению с контрольной группой, тогда относительный риск будет меньше 1. Если вмешательство причиняет вред здоровью, тогда относительный риск будет больше 1. Чем больше относительный риск отличается от 1, тем сильнее взаимосвязь между вмешательством и исходом. Соотношение
шансов
(Odds Ratio) – это отношение шанса наступления исхода в группе применения данной медицинской технологии (воздействия данного фак- тора) к шансу наступления исхода в контрольной группе. В этом случае под шансом подразумевается отношение числа испытаний, в результате которых исход наступил к числу испытаний, в результате которых исход не наблюдался. Используя данные табл.6 можно рассчитать:
Отношение шансов
OR
a c
b d
( )
=
Так же, как в случае отношения рисков отношение шансов равно 1, когда нет различий между контрольной и исследуемой группой. Когда
Таблица 6
Характеристики контрольной и исследуемой групп
Исход
Исследуемая группа
Контрольная группа
Наблюдался
А
В
Отсутствовал
С
D
Всего
А+С
B+D

32
Н.З. Мусина
изучаемый исход наблюдается довольно редко (а и b очень малы), от- ношение шансов и отношение рисков близки по значению.
Для примера рассмотрим данные, полученные в исследовании по оценке эффективности гиполипидемической терапии у лиц, стра- дающих ишемической болезнью сердца или перенесших инфаркт миокарда (вторичная профилактика). Данные по количеству смертных случаев после 5 лет наблюдения приведены в табл. 7.
Риск умереть в исследуемой группе (Ri) = 182/2221 = 0,082
(8% пациентов умерли в течение 5 лет)
Риск умереть в контрольной группе (Rc) = 256/2223 = 0,115
(11,5% пациентов умерли в течение 5 лет)
Мы видим, что риск умереть ниже в исследуемой, чем в контрольной группе. Подтвердить это можно с помощью отношения рисков:
Отношение рисков (RR) = 0,082/0,115 = 0,7
Таким образом, риск смерти при приеме статинов составляет 70% от риска смерти при приеме плацебо.
Таким же образом рассчитывается отношение шансов (OR):
= 0,089/0,130 = 0,68
Отношение шансов близко по значению к отношению рисков, так как смерть в данном исследовании является относительно редким со- бытием.
Отношения рисков и шансов измеряют силу взаимосвязи между вмешательством и исходом. Мы можем сказать, что отношение шан- сов 0,6 свидетельствует о более выраженном эффекте, чем отношение шансов 0,9, то есть эти показатели являются относительными. Для того, чтобы судить о клинической значимости вмешательства не- обходимы абсолютные показатели. Такими показателями являются снижение абсолютного риска и число пациентов, которых необхо- димо пролечить.
Снижение абсолютного риска
(Absolute risk reduction, ARR) определя- ется как разность рисков анализируемых исходов между исследуемой группой и группой контроля: ARR = Rc – Ri.
Таблица 7
Характеристики исследуемой и контрольной групп при изучении
статинов (вторичная профилактика)
Исход после 5 лет наблюдения
Принимали статины
Не принимали статины
Умерли
182 256
Живы
2039 1967
Всего
2221 2223