Файл: Основы биомедицинской статистики.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 18.11.2021

Просмотров: 422

Скачиваний: 5

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

Автор: доцент Андаспаева А.А. 

11 

Нижняя граница:  

 

 

1

н

t S

Х

Х

Х

n

 

     

 

      (12) 

Верхняя граница:  

 

1

в

t S

Х

Х

Х

n

 

     

 

     (13) 

Для двусторонних границ: 

Нижняя граница:  

 

 

н

t S

Х

Х

Х

n

 

      

 

     (14) 

Верхняя граница:  

 

в

t S

Х

Х

Х

n

 

      

 

     (15) 

где  

t

1

 и 

- квантили распределения Стьюдента при доверительной вероятности   

 

 = 0,95,  значения 

которых приведены  в таблице 3.     

Таблица 3 

K=n-1

 

t

1

 

t

 

z

н

 

z

в

 

K =n-1

 

t

1

 

t

 

z

н

 

z

в

 

2

 

2,920

 

4,303

 

0,578

 

4,42

 

29

 

1,699

 

2,045

 

0,825

 

1,28

 

3

 

2,353

 

3,182

 

0,620

 

2,92

 

40

 

1,684

 

2,021

 

0,847

 

1,23

 

4

 

2,132

 

2,776

 

0,649

 

2,37

 

50

 

1,676

 

2,009

 

0,861

 

1,20

 

9

 

1,833

 

2,262

 

0,729

 

1,65

 

100

 

1,660

 

1,984

 

0,897

 

1,13

 

19

 

1,729

 

2,093

 

0,794

 

1,37

 

 

1,645

 

1,960

 

1,000

 

1,00

 

 

В  программе  Excel  доверительные  интервалы  рассчитываются  с  помощью  функции 

ДОВЕ-

РИТ

 (рис.14). Она возвращает значение, с помощью которого можно определить доверительный ин-

тервал  для  математического  ожидания  генеральной  совокупности.  Доверительный  интервал  пред-
ставляет собой диапазон значений. Выборочное среднее 

x

  является серединой  этого  диапазона, сле-

довательно, доверительный интервал определяется как (

x

 ± ДОВЕРИТ).  

 

 

Рис. 14. Функция 

ДОВЕРИТ

 

 

ДОВЕРИТ

(

альфа

станд_откл

размер

Альфа  —  это  уровень  значимости,  используемый  для  вычисления  уровня  надежности.  Уро-

вень надежности равняется (1 - альфа)

.

100%, или, другими словами, альфа равное 0,05 означает 95-

процентный уровень надежности. 

Станд_откл — это стандартное отклонение (среднее квадратическое отклонение) генеральной 

совокупности для интервала данных, оно предполагается известным. Размер — это размер выборки. 


background image

 

Автор: доцент Андаспаева А.А. 

12 

Если какой-либо из аргументов не является числом, то функция 

ДОВЕРИТ

 возвращает значе-

ние ошибки #ЗНАЧ!.  

Если альфа  ≤ 0 или альфа  ≥ 1, то функция 

ДОВЕРИТ

 возвращает значение ошибки #ЧИСЛО!  

Если станд_откл ≤ 0, то функция 

ДОВЕРИТ

 возвращает значение ошибки #ЧИСЛО!.  

Если размер не целое, то оно округляется.  
Если размер < 1, то функция 

ДОВЕРИТ

 возвращает значение ошибки #ЧИСЛО!.  

Доверительные интервалы для среднего квадратического отклонения. 

определяются по следующим формулам, если число испытаний n<100: 

              

 

 

н

н

Z

S

                                                         

(16) 

             

 

 

 

в

в

Z

S

                                                    

      (17) 

где S – среднее квадратическое отклонение. 
Значения 

Z

н

  и    

Z

в

   

определяются с помощью табл.4. 

При числе испытаний 

К=n-1 >100

 значения  

Z

н

 

 и 

Z

в

 вычисляют по формулам: 

     

 

 

 

н

Z

U

1

  

 

                                 (18) 

            

 

 

в

Z

U

1

                         

              (19) 

где 

U = t

1

 при 

n

=∞ – квантиль распределения Стьюдента при доверительной вероятности 

Р

д

=0,95

Доверительные интервалы для коэффициента вариации

    

 

 

 

 

     

н

н

V

К С

                                                 (20) 

              

 

 

  

в

в

V

К С

                                                     (21) 

где 

С

 – коэффициент вариации. 

Значения 

К

н

 и 

К

в

 

приведены в таблице 4. 

 Таблица 4  

n

 

30

 

50

 

100

 

200

 

500

 

1000

 

K

н

 

0,83

 

0,86

 

0,90

 

0,92

 

0,95

 

0,97

 

K

в

 

1,27

 

1,20

 

1,13

 

1,10

 

1,06

 

1,04

 

 
 

4

 

 

Оценка анормальности результатов испытаний 

 

Если  результаты  измерений  можно  отнести  к  нормальному  распределению,  то  грубые  по-

грешности исключают, основываясь на критериях оценки анормальности результатов наблюдений. 

Анормальным 

называют результат измерений, резко отклоняющийся от группы результатов, 

являющихся нормальными. 

План расчета: 

1.

 

Полученные результаты ранжируют в порядке возрастания 

                   

 

 

Х

< X

< X

<...            ...< X

 

В  программе  Excel  2007  расположить  результаты  в  порядке  возрастания  можно  с  помощью 

кнопки 

 на вкладке ДАННЫЕ (рис. 15). 

 

Рис. 15. Сортировка по возрастанию в Excel 2007 

 
Если предварительно выделить диапазон данных, то появится окно, показанное на рис. 16, в 

котором отмечаем точкой 

СОРТИРОВАТЬ В ПРЕДЕЛАХ УКАЗАННОГО ВЫДЕЛЕНИЯ


background image

 

Автор: доцент Андаспаева А.А. 

13 

 

 

Рис. 16. Установка предела сортировки 

 

2. Подсчитывают выборочное среднее,  среднее квадратическое отклонение 
Чтобы оценить  

Х

n

 и 

Х

1

 в данной нормальной совокупности и принять решение об исключе-

нии или оставлении данных значений в составе выборки, находят отклонения  этих величин относи-
тельно среднего значения, для чего используются следующие формулы: 

                 

 

 

 

n

n

(X -X )

U  = 

 

S

 

 

 

 

 

(22)

 

    

 

 

 

 

1

1

(X-X  )

U  = 

S

  

 

 

 

 

(23) 

В программе Excel нет функций, соответствующих данным формулам, поэтому для расчетов 

их придется набирать в ячейках. 

Полученные результаты сравнивают со значением 

m

,

  взятым  из  таблиц  для  данного  объема 

выборки 

n

 и принятых уровней значимости 

q

Если 

U

n

 > 

т

 или 

U

1

 > 

т

 , то значения X

n

 или X

1

 исключают из дальнейших исследований. 

Значения 

т

 приведены в таблице 5.              

Правила оценки анормальности отдельных результатов наблюдений при нормальном распре-

делении результатов изложены в таблице 5.  

Таблица 5 

Объем выборки

 

Предельное значение 

 

при уровне значимости 

q

 

n

 

0,100

 

0,075

 

0,050

 

0,025

 

5

 

1,42

 

1,44

 

1,67

 

1,84

 

10

 

2,03

 

2,10

 

2,18

 

2,29

 

20

 

2,38

 

2,46

 

2,56

 

2,71

 

 
 

5

 

Проверка гипотез о соответствии фактического распределения  резуль-

татов испытаний теоретическому 

 

Распространять сводные выборочные характеристики на всю партию материала можно с оп-

ределенной вероятностью, для нахождения которой необходимо знать закон распределения первич-
ных данных. Именно закон распределения дает полную картину варьирования исследуемого свойст-
ва, тогда как сводные характеристики, даже генеральные, определяют распределение признака лишь 
в  среднем.  Знание  закона  распределения  показателя  качества  позволяет  установить  границы  между 
случайными и неслучайными отклонениями сводных выборочных характеристик от нормированного 
значения (последнее обстоятельство лежит в основе статистического контроля качества продукции). 

Многие  свойства  медицинских  и  фармацевтических  материалов  подчиняются  нормальному 

закону распределения, но некоторые из них имеют распределение, отличающееся от нормального. В 
этом случае вероятность нахождения генеральной характеристики в пределах доверительного интер-
вала снижается или остается неизвестной. Однако следует иметь в виду, что при распределении от-
дельных результатов измерений, отличающихся от нормального, средние из этих результатов, разде-


background image

 

Автор: доцент Андаспаева А.А. 

14 

ленных на группы (выборки), тем ближе следуют нормальному распределению, чем больше числен-
ность указанных групп. 

М е т о д ы   п р о в е р к и   с т а т и с т и ч е с к и х  г и п о т е з .   Исходя  из  эмпирического  рас-

пределения полученных экспериментальных данных, на основе их графического изображения или по 
другим  каким-либо  соображениям  выдвигают гипотезу  о  соответствии  данного  эмпирического  рас-
пределения предполагаемому теоретическому. При сравнении выбранного теоретического распреде-
ления с эмпирическим нужно решать вопрос о том, можно ли разницу в этих распределениях считать 
случайной. Проверяемая гипотеза всегда заключается в предположении чисто случайного характера 
разницы  сравниваемых  распределений,  т.  е.  в  отсутствии  между  ними  существенных различий. Та-
кую гипотезу часто называют 

н у л е в о й

.  Если фактическое различие распределений не достигнет 

границы, выход за которую при условии правильности нулевой гипотезы маловероятен, то это озна-
чает, что нулевая гипотеза при данном исследовании не опровергается. Однако надо четко различать 
вывод «не опровергается» от вывода «подтверждается». Когда нулевая гипотеза не опровергнута, то 
те же наблюдения  могут оказаться совместимыми и с другими гипотезами, отличающимися от пер-
вой. Следовательно, рассматриваемый метод оценки 

 

может служить для подтверждения нулевой ги-

потезы; он может только опровергать, что позволяет делать вывод о 

существенном

, а 

не случайном

 

различии сравниваемых распределений. 

Проверку  гипотезы  осуществляют  с  помощью 

к р и т е р и е в

,   связывающих  те  или  иные 

элементы эмпирического распределения элементами теоретического распределения. Малые значения 
критериев  (несогласия)  указывают  на  случайность  отклонений  сравниваемых  распределений,  т.  е. 
подтверждают 

гипотезу  их  близости 

или 

совпадения

.  Большие  значения  критериев  несогласия  ее 

могут

 

быть

 

объяснены  только  случайными  отклонениями;  последние  являются  настолько  сущест-

венными, что свидетельствуют 

о различии

 сравниваемых 

распределений

Границу  между  случайными  и  значимыми показателями  определяет 

у р о в е н ь   з н а -

ч и м о с т и   к р и т е р и я

,    показывающий    вероятность  

q

 

тех   значений   критерия,   которые  

практически    при      правильности   гипотезы можно принять за невозможные. 

q

 

есть тот процент 

риска, на который можно идти, принимая определенные  значения критерия за невозможные. Среди 
уровней  значимости  чаще  используют  уровни 

q

 

=  5%

 

(

q

 

=  0,05)  и 

q

= 1 % (

q

=0,01).  Чем  меньше 

уровень значимости, тем меньше вероятность забраковать верную гипотезу. 

К р и т и ч е с к о й   о б л а с т ь ю

  данного  критерия  проверки  гипотезы  называют  область 

тех  значений  критерия,  вероятность  попадания

 

в  которую  при  верной  гипотезе  равна  или  меньше 

уровня значимости 

q

.  

О б л а с т ь  д о п у с т и м ы х  з н а ч е н и й

 критерия лежит вне критической области и яв-

ляется областью тех его значений, вероятность

 

попадания в которую при верной гипотезе равна 

Р = 

q.

 

Чем больше величина критериев

часто применяемых при проверке близости фактического и 

теоретического распределений, тем  меньше вероятность их получения. Поэтому, если критерий, на-
столько  велик,  что  вероятность  его  получения  равна  или  меньше  уровня  значимости

то  значения 

критериев  окажутся  в  критической  области,  и  это  свидетельствует  о  настолько  малой  вероятности 
близости сравниваемых распределений, что практически с риском, равным или меньшим 

q

можно 

считать данную близость 

невероятной;

 тогда 

нулевая гипотеза

 соответствия распределений долж-

на быть 

отвергнута

. Наоборот, если значение критерия будет в области допустимых значений, то оно 

не  противоречит  нулевой  гипотезе

  соответствия  сравниваемых  распределений;  поэтому  можно 

принять допустимость нулевой гипотезы, по крайней мере до тех пор, пока более обстоятельное ис-
следование не приведет к противоположному заключению. 

 

5.1

 

Оценка соответствия результатов измерения нормальному закону по величине 

асимметрии и эксцесса 

  

Для кривой нормального распределения характерно симметричное расположение отдельных 

значений  относительно среднего,  что  можно  проверить  по  величине 

асимметрии, 

которая  является 

мерой косости.            

                     

 

 

        

3

3

Х

Х

К

n S

                             

                  

(30)

 

где  

К

 - асимметрия; 


background image

 

Автор: доцент Андаспаева А.А. 

15 

       

S

 - среднее квадратическое отклонение; 

       

Х

– текущее значение результатов испытаний; 

       

Х

 - среднее значение; 

       

n

 - число испытаний. 

К

=0 свидетельствует о симметричности кривой распределения. Чем больше 

К

, тем асиммет-

ричнее кривая (рис.19). 

 

Рис.17. Асимметрия 

 

В программе Excel асимметрия вычисляется с помощью функции 

СКОС

 (рис. 18). Асиммет-

рия  характеризует  степень  несимметричности  распределения  относительно  его  среднего.  Положи-
тельная  асимметрия  указывает  на  отклонение  распределения  в  сторону  положительных  значений. 
Отрицательная асимметрия указывает на отклонение распределения в сторону отрицательных значе-
ний. 

СКОС

(

число1

;

число2; ...) 

Число1, число2 ...— от 1 до 30 аргументов, для которых вычисляется асимметрия. Можно использо-
вать один массив или одну ссылку на массив вместо аргументов, разделяемых точкой с запятой. 

Аргументы должны быть числами или именами, массивами или ссылками, содержащими чис-

ла. Если аргумент, который является массивом или ссылкой, содержит текст, логические значения 
или пустые ячейки, эти значения игнорируются; ячейки, содержащие нулевые значения, учитывают-
ся. Если имеется менее трех точек данных, или стандартное отклонение равно нулю, то функция 

СКОС

 возвращает значение ошибки #ДЕЛ/0!.  

 

 

Рис. 18 Функция 

СКОС

 

 

К=0 - кривая 
нормального 
распределения, 
т.е. случайные 
величины нор-
мально рас-
пределены 

К>0 

К<0