Файл: Основы биомедицинской статистики.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 18.11.2021

Просмотров: 427

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

Автор: доцент Андаспаева А.А. 

16 

Уравнение для асимметрии в программе Excel определяется следующим образом:  

 

3

i

n

X

X

K

n 1

n

2

S

  

 

 

 

 

(31) 

где S — стандартное отклонение выборки. 

Эксцесс ( Е )

 - позволяет судить о сплющенности (крутости) кривой распределения по сравне-

нию с кривой нормального распределения (рис. 19). 

4

4

3

i

X

X

E

nS

   

 

 

 

(32) 

В программе Excel эксцесс вычисляется с помощью функции 

ЭКСЦЕСС

(

число1

;

число2; ...),

 

которая  возвращает  эксцесс  множества  данных.  Эксцесс  характеризует  относительную  остроконеч-
ность  или  сглаженность распределения  по  сравнению  с  нормальным  распределением  (рис.  19).  По-
ложительный  эксцесс  обозначает  относительно  остроконечное  распределение.  Отрицательный  экс-
цесс обозначает относительно сглаженное распределение. 

 

 

 

                   

 

 

       Рис. 19. Эксцесс 

ЭКСЦЕСС

(

число1

;

число2; ...) 

Число1, число2,...— от 1 до 30 аргументов, для которых вычисляется мода. (Возвращает наиболее 
часто встречающееся или повторяющееся значение в массиве или интервале данных.) Можно исполь-
зовать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой. 

Аргументы должны быть либо числами, либо именами, массивами или ссылками, содержа-

щими числа. 

 

Рис. 20 Функция 

ЭКСЦЕСС

 

Е>0 

Е=0 

Е<0 


background image

 

Автор: доцент Андаспаева А.А. 

17 

Если аргумент, который является массивом или ссылкой, содержит текст, логические значе-

ния или пустые ячейки, эти значения игнорируются; ячейки, содержащие нулевые значения, учиты-
ваются.  

Если задано менее четырех точек данных или если стандартное отклонение выборки равняет-

ся нулю, то функция 

ЭКСЦЕСС

 возвращает значение ошибки #ДЕЛ/0!.  

В программе Excel эксцесс определяется следующим образом:  

 



 

4

2

1

1

1

2

3

2

3

n n

n

Xi

X

E

n

n

n

S

n

n

  

  

 

 

      (33) 

При  приближенной  оценке  соответствия  эмпирического  распределения  нормальному    необ-

ходимо сравнить значения 

К

 и 

Е

 с их средними квадратическими отклонениями  

S

k

  и 

S

Е 

 

6

1

6

3

K

n

S

n

n

 

,                                 

(34)

 

 

 

 

2

24

2

3

1

3

5

E

n

n

S

n

n

n

 

 

  

 

     

(35) 

Если 

K

K

S

  и 

E

E

S

, то гипотеза о соответствии эмпирического распределения  нор-

мальному закону отвергается. 

 

 

6

 

Сравнение двух выборок 

 

6.1

 

Сравнение двух средних  независимых выборок  (критерий Стьюдента) 

 

Часто в процессе проведения испытаний  необходимо сравнить результаты двух независимых 

выборок с тем, чтобы оценить достоверность разности  

Х

1

 – Х

2

.

 Если эта разность недостаточно зна-

чима, то средние 

Х

1

 и 

Х

2

 могут относиться к одной и той же генеральной совокупности. Если же эта 

разность достаточно значима, то средние 

Х

1

 

и 

Х

2

 

относятся к разным генеральным совокупностям или 

к одной совокупности, но при измерении величин 

Х

1

 и 

Х

2

 имеется достаточная разница в методах их 

определения. 

При большом числе испытаний 

n>30

  и 

m>30

 критерий  достоверности  определяется  по  фор-

муле: 

       

1

2

2

2

1

2

X

X

t

S

S

n

m

                 

 

 

      

(47) 

где

 S

1

, S

2

 – 

среднее квадратическое отклонение в первой и второй выборке; 

n, m

 – число значений в первой и второй выборке. 

Полученное значение сравнивают с табличными  значениями критерия Стьюдента. 
При малом числе испытаний 

n+m<60 

1

2

2

X

X

n m

t

n

m

S

 

 

 

     (48) 

2

1

2

n 1

m 1

S

n

m

2

 

 

 

 

При числе испытаний n=m<30 

1

2

2

2

1

2

X

X

n n

1

t

S

S

 

 

 

   

(49) 


background image

 

Автор: доцент Андаспаева А.А. 

18 

где

 σ

1

, σ

2

 – 

среднее квадратическое отклонение в первой и второй выборке.

 

При использовании формулы (48) находят значение 

                                       

k = n + m -2      

 

 

 

 

 

   

(50) 

и по таблице 13 для найденной величины 

k

 и при вероятности 95% определяют табличное значение t. 

При использовании формулы (49) находят значение 

                                       

k = 2  

.

(

n - 1

)

      

 

 

 

 

 

   

(51) 

и по таблице 13 для найденной величины 

k

 и при вероятности 95% определяют табличное значение t. 

Если  

t

р

 > t,

 то разность средних  

Х

а

 –Х

в

 при нормальном распределении достоверна более чем 

на 95%. Если  

t

р

 < t

 , то разность средних не считается достаточно достоверной. 

Таблица 13 

    k

 

    t

 

   k

 

     t

 

   k

 

    t

 

   k

 

    t

 

    1

 

12,78

 

  10

 

  2,23

 

  19

 

  2,09

 

  28

 

  2,05

 

    2

 

  4,30

 

  11

 

  2,20

 

  20

 

  2,09

 

  29

 

  2,05

 

    3

 

  3,18

 

  12

 

  2,18

 

  21

 

  2,08

 

  30

 

  2,04

 

    4

 

  2,78

 

  13

 

  2,16

 

  22

 

  2,07

 

  40

 

  2,02

 

    5

 

  2,57

 

  14

 

  2,14

 

  23

 

  2,07

 

  60

 

  2,00

 

    6

 

  2,45

 

  15

 

  2,13

 

  24

 

  2,06

 

 120

 

  1,98

 

    7

 

  2,37

 

  16

 

  2,12

 

  25

 

  2,06

 

   

 

  1,96

 

    8

 

  2,30

 

  17

 

  2,11

 

  26

 

  2,06

 

    -

 

     -

 

    9

 

  2,26

 

  18

 

  2,10

 

  27

 

  2,05

 

    -

 

     -

 

 
В программе Excel применяется функция 

ТТЕСТ

 (рис. 21). Она возвращает вероятность, соот-

ветствующую  критерию  Стьюдента.  Функция  ТТЕСТ  используется,  чтобы  определить,  насколько 
вероятно, что две выборки взяты из генеральных совокупностей, которые имеют одно и то же сред-
нее. 

 

Рис. 21. Функция 

ТТЕСТ 

 

ТТЕСТ

(

массив1

;

массив2

;

хвосты

;

тип

Массив1 — первое множество данных. 
Массив2 — второе множество данных. 
Хвосты — число хвостов распределения. Если хвосты = 1, то функция ТТЕСТ использует односто-
роннее распределение. Если хвосты = 2, то функция ТТЕСТ использует двустороннее распределение. 
Тип — вид исполняемого t-теста. 
 

Тип

 

Выполняемый тест

 

1

 

Парный

 

2

 

Двухвыборочный с равными дисперсиями (гомоскедастический)

 

3

 

Двухвыборочный с неравными дисперсиями (гетероскедастический)

 


background image

 

Автор: доцент Андаспаева А.А. 

19 

 
Если массив1 и массив2 имеют различное число точек данных, а тип = 1 (парный), то функция 

ТТЕСТ возвращает значение ошибки #Н/Д.  

Аргументы хвосты и тип усекаются до целых.  
Если хвосты или тип не является числом, то функция ТТЕСТ возвращает значение ошибки 

#ЗНАЧ!.  

Если хвосты имеет значение, отличное от 1 и 2, то функция ТТЕСТ возвращает значение 

ошибки #ЧИСЛО!.  

TTEСT использует данные массива1 и массива2 для вычисления неотрицательной  t-

статистики. Если хвосты = 1, TTEСT возвращает вероятность более высокого значения t-статистики, 
исходя из предположения, что массив1 и массив2 являются выборками, принадлежащими одной и 
той же генеральной совокупности. Значение, возвращаемое функцией TTEСT в случае, когда хвосты 
= 2, является двусторонним значением, возвращаемым, когда хвосты = 1 и представляет собой веро-
ятность более высокого абсолютного значения t-статистики, исходя из предположения, что массив1 и 
массив2 являются выборками, принадлежащими одной и той же генеральной совокупности.  

В  надстройке 

АНАЛИЗ  ДАННЫХ

  представлено  несколько  типов  теста  для  сравнения  выбо-

рочных средних (рис. 22). 

 

Рис. 22. Пакет анализа 

 

Двухвыборочный t-тест проверяет равенство средних значений генеральной совокупности по 

каждой выборке. Эти три средства допускают следующие условия: равные дисперсии генерального 
распределения, дисперсии генеральной совокупности не равны, а также представление двух выборок 
до и после наблюдения по одному и тому же субъекту. 

Для всех трех средств, перечисленных ниже, значение t-статистики t вычисляется и отобража-

ется как "t-статистика" в выводимой таблице. В зависимости от данных, это значение t может быть 
отрицательным  или  неотрицательным.  Если  предположить,  что  средние  генеральной  совокупности 
равны,  при  t  <  0  “P(T  <=  t)  одностороннее”  дает  вероятность  того,  что  наблюдаемое  значение  t-
статистики будет более отрицательным, чем t. При t >=0 “P(T <= t) одностороннее” делает возмож-
ным  наблюдение  значения  t-статистики,  которое будет  более  положительным  чем  t.  “t  критическое 
одностороннее” выдает пороговое значение, так что вероятность наблюдения значения t-статистики 
большего или равного “t критическое одностороннее” равно Alpha. 

“P(T <= t) двустороннее” дает вероятность наблюдения значения t-статистики по абсолютно-

му значению большего чем t. “P критическое двустороннее” выдает пороговое значение, так что зна-
чение вероятности наблюдения значения t - статистики по абсолютному значению большего “P кри-
тическое двустороннее” равно Alpha. 

Двухвыборочный  t-тест  с  одинаковыми  дисперсиями.

  Двухвыборочный  t-тест  Стьюдента 

служит для проверки гипотезы о равенстве средних для двух выборок. Эта форма t-теста предполага-
ет совпадение значений дисперсии генеральных совокупностей и обычно называется гомоскедасти-
ческим t-тестом. 

Элементы диалогового окна «Двухвыборочный t-тест с одинаковыми дисперсиями» приведе-

ны на рис. 23. 

 


background image

 

Автор: доцент Андаспаева А.А. 

20 

 

Рис. 23. Двухвыборочный t-тест с одинаковыми дисперсиями 

 
Интервал переменной 1. Дается ссылка на первый диапазон анализируемых данных. Диапазон 

должен состоять из одного столбца или одной строки. 

Интервал переменной 2. Дается ссылка на второй диапазон анализируемых данных. Диапазон 

должен состоять из одного столбца или одной строки. 

Гипотетическая средняя разность. Вводится число, равное предполагаемой разности средних. 

Значение 0 (нуль) указывает, что средние принимаются равными. 

Заголовки. Если первая строка или первый столбец входного интервала содержит заголовки, 

то устанавливается флажок. Флажок снимается, если заголовки отсутствуют; в этом случае подходя-
щие названия для данных выходного диапазона будут созданы автоматически. 

Альфа. Вводится уровень надежности для теста. Его значение должно находиться в диапазоне 

0...1. Уровень альфа связан с вероятностью возникновения ошибки типа I (опровержение верной ги-
потезы). 

Выходной диапазон. Вводится ссылка на левую верхнюю ячейку выходного диапазона. Раз-

мер  выходного диапазона  будет  определен  автоматически,  и  на  экран  будет  выведено  сообщение в 
случае возможного наложения выходного диапазона на исходные данные. 

Новый  лист.  Устанавливается  переключатель  таким  образом,  чтобы  открыть  новый  лист  в 

книге и вставить результаты анализа, начиная с ячейки A1. Если в этом есть необходимость, введите 
имя нового листа в поле, расположенном напротив соответствующего положения переключателя. 

Новая книга. Устанавливается переключатель таким образом, чтобы открыть новую книгу  и 

вставить результаты анализа в ячейку A1 на первом листе в этой книге. 

Результаты расчетов выводятся в виде таблицы (табл. 14). 

Таблица 14 

Заголовок

 

Объяснение

 

Среднее

 

Средние значения первой и второй выборки

 

Дисперсия

 

Дисперсии первой и второй выборки

 

Наблюдения 

 

Число значений в первой и второй выборке (

n

 и 

m

)

 

Объединенная дисперсия

 

Выборочная 

дисперсия 

2

2

2

1

2

n 1

m 1

S

n

m

2

 

 

 

вычис-

ленная по объединенным данным обеих выборок 

 

Гипотетическая разность средних

 

Гипотетическая разность средних 

1

2

X

X

 

df

 

Число  степеней  свободы  статистики  Т  (

df

n

m

2

  

)

 

t

 - статистика

 

Расчетное значение t, найденное по формуле (50)

 

P(T≤t)

 одностороннее

 

Значимость 

α

В 

случае 

а)