Файл: Основы биомедицинской статистики.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 18.11.2021

Просмотров: 425

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

Автор: доцент Андаспаева А.А. 

21 

n m 2

P T

t

 

 

в 

случае 

б) 

n m 2

P T

t

 

 

, где 

t

 – расчетное значе-

ние  статистики 

Т

Т

n+m-2

  –  случайная  величина, 

имеющая распределение Стьюдента с 

(n

+

m-2)

  сте-

пенями свободы

 

критическое одностороннее

 

Критическое  значение 

t

  (

α;  n

+

m-2)

  порядка 

α

  рас-

пределения Стьюдента с 

(n

+

m-2)

 степенями свобо-

ды 

n m 2

P T

t

;n

m

2

 

 

 

P(T≤t)

 двухстороннее

 

Значимость 

n m 2

P T

t

 

 (случай в))

 

t

 критическое двухстороннее

 

Критическое  значение 

t

  (

α/2;  n

+

m-2)

  порядка 

α/2

 

распределения  Стьюдента  с 

(n

+

m-2)

  степенями 

свободы 

n m 2

/ 2

P T

t

/ 2;n

m

2

 

 

 

 

Двухвыборочный t-тест с разными дисперсиями.

 Двухвыборочный t-тест Стьюдента (рис. 24) 

используется для проверки гипотезы о равенстве средних для двух выборок данных из разных гене-
ральных совокупностей. Эта форма t-теста предполагает несовпадение дисперсий генеральных сово-
купностей и обычно называется гетероскедастическим t-тестом. Если тестируется одна и та же гене-
ральная совокупность, используется парный тест. 

 

 

Рис. 24.

 

Двухвыборочный t-тест с разными дисперсиями 

 
Для определения тестовой величины t используется следующая формула. 

1

2

2

2

1

2

X

X

t

n

m

   

 

 

 

(52) 

где 

δ

 - гипотетическая разность средних; 

1

2

X

X

Так как результат вычисления обычно не бывает целым числом, значение 

df

  округляется  до 

целого для получения порогового значения из t-таблицы. Функция Excel 

ТТЕСТ

 по возможности ис-

пользует вычисленные значения без округления для вычисления значения 

ТТЕСТ

 с нецелым значени-

ем df. Из-за разницы подходов к определению степеней свободы, результаты функций 

ТТЕСТ

 и t-тест 

будут различаться в случае с разными дисперсиями. Следующая формула используется для вычисле-
ния степени свободы df. 


background image

 

Автор: доцент Андаспаева А.А. 

22 

2

2

2

1

2

2

2

2

2

1

2

1

1

S

S

n

m

df

S

S

n

m

n

m

 

 

 

 

 

       (53) 

Элементы диалогового окна «Двухвыборочный t-тест с различными дисперсиями» совпадают 

с элементами диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями» 

Парный двухвыборочный t-тест для средних.

 Парный двухвыборочный t-тест Стьюдента (рис. 

25)  используется  для  проверки  гипотезы  о  различии  средних  для  двух  выборок  данных.  В  нем  не 
предполагается равенство дисперсий генеральных совокупностей, из которых выбраны данные. Пар-
ный тест используется, когда имеется естественная парность наблюдений в выборках, например, ко-
гда генеральная совокупность тестируется дважды — до и после эксперимента.  

 

 

Рис. 25. Парный двухвыборочный t-тест для средних 

 
Одним из результатов теста является совокупная дисперсия (совокупная мера распределения 

данных вокруг среднего значения), вычисляемая по следующей формуле. 

2

2

2

1 1

2

2

1

2

2

n S

n S

S

n

n

   

 

 

 

(54) 

Элементы диалогового окна «Парный двухвыборочный t-тест для средних» совпадают с эле-

ментами диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями». 
 

 

7

 

Регрессионный анализ 

 

Уравнением регрессии  

Y

  от 

X

  называют функциональную  зависимость 

у=f(x)

, а ее график – 

линией регрессии.  

 
 

7.1

 

Построение графиков 

 

Excel  позволяет  создавать  диаграммы  и  графики  довольно  приемлемого  качества.  Excel  имеется 

специальное средство — Мастер диаграмм, под руководством которого пользователь проходит все четыре 
этапа процесса построения диаграммы или графика. 

Как правило, построение графика начинают с выделения диапазона, содержащего данные, по кото-


background image

 

Автор: доцент Андаспаева А.А. 

23 

рым он должен быть построен. Такое начало упрощает дальнейший ход построения графика.  

 В Excel 2007 находим вкладку

 ВСТАВКА 

(рис. 28).  

 

 

Рис. 28. 

МАСТЕР ДИАГРАММ

 в Excel 2007 

 
Наиболее  просто  выделить  диапазон  исходных  данных,  в  котором  эти  данные  находятся  в 

смежных рядах (столбцах или строках), — надо щелкнуть по левой верхней ячейке диапазона и затем 
протащить указатель мыши до правой нижней ячейки диапазона. При выделении данных, находящихся в 
несмежных рядах, указатель мыши перетаскивают по выделяемым рядам при нажатой клавише Ctrl. Если 
один  из  рядов  данных  имеет  ячейку  с  названием,  остальные  выделенные  ряды также должны иметь 
соответствующую ячейку, даже если она пустая. 

Для проведения регрессионного анализа лучше всего использовать диаграмму типа Точечная (рис. 

30). При ее построении Excel воспринимает первый ряд выделенного диапазона исходных данных как набор 
значений аргумента функций, графики которых нужно построить (один и тот же набор для всех функ-
ций). Следующие ряды воспринимаются как наборы значений самих функций (каждый ряд содержит 
значения одной из функций, соответствующие заданным значениям аргумента, находящимся в пер-
вом ряду выделенного диапазона). 

В Excel 2007  названия осей ставятся во вкладке меню 

МАКЕТ

 (рис. 29). 

 

Рис. 29. Настойка названий осей графика в Excel 2007 

 

7.2

 

Линейная функция 

 

Функция аргумента 

х

, имеющая вид 

у=ах+b

, где 

а

 и 

b

 – некоторые заданные числа, называет-

ся линейной. Ее графиком является прямая линия, которая наклонена к оси 

х

  под  углом

  φ

, тангенс 

которого равен 

а

 и смещенная по оси 

у

 на величину 

b

 от начала координат (рис. 30). 

 

 

 

 

 

 

 

y=ax+b 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y=ax–b 

 

 
 

Рис. 30. График линейной функции 

 
 

7.3. Логарифмическая, степенная и экспоненциальная  функции 

 
Экспоненциальная функция 

φ 


background image

 

Автор: доцент Андаспаева А.А. 

24 

y=a

.

e

bx

 

где 

a

 и 

b

 – расчетные коэффициенты,  

e

 – основание натурального логарифма. 

Логарифмическая функция  

y=a

.

lnx+b 

где 

a

 и 

b

 – расчетные коэффициенты,  

ln

 – функция натурального логарифма. 

Логарифмическая функция является обратной к экспоненциальной функции. 
Степенная функция 

y=a

.

х

b

 

где 

a

 и 

b

 – расчетные коэффициенты. 

Графики экспоненциальной и логарифмической функций приведены на рис. 31. 
 
 

 

 

 

 

 

 

 

 

y=a

.

e

bx

   

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

y=a

.

lnx+b 

 

Рис. 31. Графики экспоненциальной и логарифмической функций 

 
 

 

Примечание  

Основные статистические характеристики 

 

Выборка

 – группа элементов, выбранная для исследования из всей совокупности эле-

ментов. Задача выборочного метода состоит в том, чтобы сделать правильные выводы отно-
сительно  всего  собрания  объектов,  их  совокупности.  Например,  врач  делает  заключения  о 
составе крови пациента на основе анализа ее нескольких капель. 
 

При  статистическом  анализе,  прежде  всего,  необходимо  определить  характеристики 

выборки, и важнейшей является среднее значение. 
 

Среднее значение (Хс, М)

 – центра выборки, вокруг которого группируются элементы 

выборки. 
 

Медиана

  – 

элемент выборки, число элементов выборки со значениями больше кото-

рого и меньше которого – равно. 
 

Дисперсия  (D)  – 

параметр,    характеризующий  степень  разброса  элементов  выборки 

относительного среднего значения. Чем больше Дисперсия, тем дольше отклоняются значе-
ния элементов выборки от среднего значения. 

 

Важной  характеристикой  выборки  является  мера  разброса  элементов  выборки  от 

среднего  значения.  Такой  мерой  является 

среднее  квадратическое  отклонение

  или 

стан-

дартное отклонение

 

Стандартное  отклонение  (среднее  квадратическое  отклонение)  – 

параметр,  ха-

рактеризующий степень разброса элементов выборки от среднего значения. Стандартное от-
клонение обычно обозначается буквой “σ “ 

(

сигма

). 

 

Ошибки среднего или стандартная ошибка

 (m)  – 

параметр, характеризующий сте-

пень возможного отклонения среднего значения, полученного на исследуемой

 

ограниченной 

выборке, от истинного среднего значения, полученного на всей совокупности элементов. 
 

Нормальное  распределение 

–  совокупность  объектов,  в  которой  крайние  значения 

некоторого признака – наименьшее или наибольшее  – появляются редко; чем ближе значе-
ние признака к среднему арифметическому, тем чаще оно встречается. Например, распреде-


background image

 

Автор: доцент Андаспаева А.А. 

25 

ление пациентов по их чувствительности к воздействию любого фармакологического агента 
часто приближается к нормальному распределению. 
 

Коэффициент корреляции (r) – 

параметр, характеризующий степень линейной взаи-

мосвязи  между  двумя  выборками.  Коэффициент  корреляции  изменяется  от  -1  (строгая  об-
ратная  линейная  зависимость)

 

до  1  (строгая  прямая  пропорциональная  зависимость).  При 

значении 0 линейной зависимости между двумя выборками нет. 
 

Случайное  событие

  –  событие,  которое  может  произойти  или  не  произойти  без  ви-

димой закономерности. 
 

Случайная величина – 

величина, принимающая различные значения без видимой за-

кономерности, т.е. случайным образом. 
 

Вероятность (p) 

– параметр, характеризующий частоту появления случайного собы-

тия. Вероятность изменяется от 0 до 1, причем вероятность 

р=0

 означает, что случайное со-

бытие  никогда  не  происходит  (невозможное  событие),  вероятность 

р=1

  означает,  что  слу-

чайное событие происходит всегда (достоверное событие). 
 

Уровень значимости – 

максимальное значение вероятности появления события, при 

котором  событие  считается  практический  невозможным.  В  медицине  наибольшее  распро-
странение  получил  уровень  значимости  равный 

0,05

.  Поэтому  если  вероятность,  с  которой 

интересующее  событие  может  произойти  случайным  образом 

р  <  0,05

,  то  принято  считать 

это событие маловероятным, и если оно все же произошло, то это не было случайным. 
 

Критерий  Стьюдента

  –  наиболее  часто  используется  для  проверки  гипотезы: 

«Среднее двух выборок относятся к одной и той же совокупности». Критерий позволяет най-
ти вероятность того, что оба средних относятся к одной и той же совокупности. Если это ве-
роятность 

р

 ниже уровня значимости (р < 0,05), то принято считать, что выборки относятся к 

двум разным совокупностям. 
 

Регрессия 

– линейный регрессионный анализ заключается в подборе графика и соот-

ветствующего            уравнения  для  набора  наблюдений.  Регрессия  используется  для  анализа 
воздействия на отдельную зависимую переменную значений одной или более независимых 
переменных.  Например,  на  степень  заболеваемости  человека  влияют  несколько  факторов, 
включая возраст, вес и иммунный статус. Регрессия пропорционально распределяет меру за-
болеваемости  по  этим  трем  факторам  на  основе  данных  наблюдаемой  заболеваемости.  Ре-
зультаты регрессии впоследствии могут быть использованы для предсказания уровня заболе-
ваемости новой, неисследованной группы людей. 

 

8. Демонстрационные примеры 
 

Пример №1. 

Рассмотрим  две  группы  больных  тахикардией,  одна  из  которых  (контрольная)  полу-

чала традиционное лечение, другая (исследуемая) получала лечение по новой методике. Ни-
же приведены частоты сердечных сокращений (ЧСС) для каждой группы (ударов в минуту). 
А)  Определить  среднее  значение  в  контрольной  группе.  В)  Определить  стандартное  откло-
нения  в контрольной группе. 
 

Контроль                                        Исследование 

 

 

162                                                            135 

            156                                                            126 
            144                                                            115 

            

137                                                              140 

            125                                                              121 
            145                                                              112 
            151                                                              130 
            

Решение А). 

 

Для  определения  среднего  значения  в  контрольной  группе  необходимо  установить 

табличный  курсор  в  свободную  ячейку.  На  панели  инструментов  нажать  кнопку 

Вставка