ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.04.2021

Просмотров: 965

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

 

 

развитие 

теории 

надежности 

и 

теории 

массового 

обслуживания  внесли    член-корреспондент  АН  СССР  А.Я. 
Хинчин (1894-1959), академик АН УССР Б.В. Гнеденко (1912-
1995)  и  другие  отечественные  ученые.  Математическая 
статистика  бурно  развивается  и  в  настоящее  время.  Так,  за 
последние  40  лет  можно  выделить  четыре  принципиально 
новых направления исследований

:

 

 

разработка  и  внедрение  математических  методов 

планирования экспериментов; 

 

развитие статистики объектов нечисловой природы как 

самостоятельного 

направления 

в 

прикладной 

математической статистике; 

 

развитие  статистических  методов,  устойчивых  по 

отношению  к  малым  отклонениям  от  используемой 
вероятностной модели; 

 

широкое 

развертывание 

работ 

по 

созданию 

компьютерных пакетов программ, предназначенных для 
проведения статистического анализа данных. 

 

Вероятностно-статистическая модель и задачи  

математической статистики 

 

Математическая  статистика  –  это  раздел  математики, 

который  занимается  методами  обработки  статистических 
данных  с  целью  построения  или  уточнения  вероятностной 
модели  случайного  явления.  В  некотором  смысле  задачи 
математической 

статистики 

обратны 

задачам 

теории 

вероятностей.  Математические  модели  случайных  явлений, 
изучаемых  в теории вероятностей, основываются на понятии 
вероятностного  пространства  (

,

A

,

),  где 

={

}  –  непустое 

множество, называемое пространством элементарных событий 
(элементы 

  интерпретируются  как  взаимно  исключающие 

исходы изучаемого случайного явления); 

A

  –  некоторая  выделенная  совокупность  подмножеств 

множества 

,  называемых  событиями  (при  этом  требуется, 


background image

 

 

чтобы 

A

  было 

-алгеброй,  т.е.  чтобы 

A

  содержало 

  и  было 

замкнуто  относительно  операции  взятия  противоположного 
события  и  объединения  событий  в  не  более  чем  счетном 
числе);  

P  –  вероятность,  заданная  на  событиях  А

A

.  В  каждой 

конкретной  ситуации  вероятность  Р  считается  заданной  и 
основной  задачей  теории  вероятностей  является  нахождение 
вероятностей  сложных  событий,  исходя  из  известных 
вероятностей 

более 

простых 

событий 

для 

данной 

вероятностной модели. 

В  теории  вероятностей  при  заданной  вероятностной 

модели находятся те или иные статистические характеристики. 

На  практике  вероятность  Р  редко  известна  полностью. 

Априори можно утверждать, что Р является элементом класса 
вероятностей 

P

 ,  Р

P

. Этот класс 

P

 может включать в себя все 

вероятности,  которые  можно  задать  на 

A

  (ситуация  полной 

неопределенности). В других же случаях класс 

P

 представляет 

узкое семейство вероятностей, заданное в той или иной явной 
форме  (ситуация,  когда  имеется  определенная  априорная 
информация).  В  любом  случае 

P

  –  это  совокупность 

допустимых для описания данного эксперимента вероятностей 
Р. 

Если  задан  класс 

P

,  то  говорят,  что  имеется 

вероятностно-статистическая 

модель

 

(или 

просто 

статистическая модель), понимая под этим набор (

,

A

,

P

). 

Итак,  статистическая  модель  описывает  такие  ситуации, 

когда  в  вероятностной  модели  эксперимента  имеется 
неопределенность  в  задании  вероятности  Р.  Задача 
математической  статистики  состоит  в  том,  чтобы  уменьшить 
эту  неопределенность, используя  информацию,  получаемую  в 
результате наблюдений исходов эксперимента (статистические 
данные). 
 
 
 


background image

 

 

Различные виды статистических данных 

 

Методы  прикладной  математической  статистики  –  это 

методы  анализа  достаточно  большого  количества  данных. 
Статистические  данные  могут  иметь  различную  природу. 
Исторически  самыми  ранними  были  два  вида  данных: 
сведения  о  числе  объектов,  удовлетворяющих  определенным 
условиям, и числовые результаты измерений.  

Первый  вид  данных  до  сих  пор  главенствует  в 

статистических  сборниках.  Такие    данные    называют 

категоризованными

 

потому, 

что 

о 

каждом 

из 

рассматриваемых  объектов  известно,  в  какую  из  нескольких 
заранее  заданных  категорий  он  попадает.  Информация  о 
населении страны, с разделением по возрастным категориям и 
полу является примером категоризованных данных.  

Второй  наиболее  распространенный  вид  данных  – 

количественные 

данные, рассматриваемые как действительные 

числа.  Эти  данные  являются  результатами  измерений, 
наблюдений,  испытаний,  опытов,  анализов.  Количественные 
данные обычно описываются набором чисел (выборкой).  

Существует 

весьма 

много 

различных 

видов 

статистических  данных.  Это  связано,  в  частности,  со 
способами  их  получения.  Например,  если  испытания 
некоторых 

технических 

устройств 

продолжаются 

до 

определенного  момента,  то  получаем 

цензурированные  

данные,  состоящие  из  набора  чисел  –  продолжительности 
работы  ряда  устройств  до  отказа,  и  информации  о  том,  что 
остальные  устройства  продолжали  работать  в  момент 
окончания испытания. Такого рода данные часто используются 
при оценке и контроле надежности технических устройств. 

Описание  вида  данных,  а  также  механизма  их 

порождения,  если  это  необходимо  –  начало  любого 
статистического исследования.  

В  простейшем  случае  статистические  данные  –  это 

значения  некоторого  признака,  свойственного  изучаемым 
объектам.  Значения  могут  быть  количественными  или 


background image

 

 

представлять  собой  указание  на  категорию,  к  которой  можно 
отнести  объект.  Во  втором  случае  говорят  о  качественном 
признаке.  

При  измерении  по  нескольким  количественным  или 

качественным признакам в качестве статистических данных об 
объекте получаем вектор. Его можно рассматривать как новый 
вид  данных.  В  таком  случае  выборка  состоит  из  набора 
векторов.  Если  часть  координат  –  числа,  а  часть  – 
качественные  (категоризованные)  данные,  то  говорим  о 
векторе разнотипных данных.  

Одним  элементом  выборки,  т.е.  одним  измерением, 

может 

быть 

и 

функция 

в 

целом. 

Например, 

электрокардиограмма 

больного 

или 

временной 

ряд, 

описывающий  динамику  показателей  определенной  фирмы. 
Тогда выборка состоит из набора функций.  

Элементами выборки могут быть и бинарные отношения. 

Различные  виды  бинарных  отношений  (упорядочения, 
разбиения,  толерантности),  множества  и  нечеткие  множества 
используют для описания экспертных исследований. 

Итак,  математическая  природа  элементов  выборки  в 

различных  задачах прикладной  статистики  может  быть  самой 
разной.  Однако  можно  выделить  два  класса  статистических 
данных – числовые и нечисловые. Соответственно прикладная 
статистика разбивается на две части – числовую статистику и 
нечисловую статистику.  

Числовые  статистические  данные  –  это  числа,  векторы, 

функции. Их можно складывать,  умножать на коэффициенты. 
Поэтому  в  числовой  статистике  большое  значение  имеют 
разнообразные суммы. Математический аппарат анализа сумм 
случайных  элементов  выборки  –  это  классические  законы 
больших чисел и центральные предельные теоремы. 

Нечисловые 

статистические 

данные 

– 

это 

категоризованные  данные,  векторы  разнотипных  признаков, 
бинарные  отношения,  множества  и  нечеткие  множества.  Их 
нельзя  складывать  и  умножать  на  коэффициенты,  поэтому  не 
имеет  смысла  говорить  о  суммах  нечисловых  статистических 


background image

 

10 

 

данных. 

Они 

являются 

элементами 

нечисловых 

математических  пространств  (множеств).  Математический 
аппарат  анализа  нечисловых  статистических  данных  основан 
на использовании расстояний между элементами (а также мер 
близости,  показателей  различия)  в  таких  пространствах.  С 
помощью 

расстояний 

определяются 

эмпирические 

и 

теоретические  средние,  доказываются  законы  больших  чисел, 
строятся непараметрические оценки плотности распределения 
вероятностей,  решаются  задачи  диагностики  и  кластерного 
анализа.  

Будем 

рассматривать 

методы 

прикладной 

математической  статистики,  предназначенные  для  обработки 
числовых данных. 
 

 

1. ОСНОВНЫЕ ПОНЯТИЯ И ЭЛЕМЕНТЫ

 

ВЫБОРОЧНОЙ ТЕОРИИ 

 

Исходные 

статистические 

данные 

– 

результат 

наблюдения  некоторой  совокупности  случайных  величин 

X

=(X

1

,...,X

n

), 

характеризующей 

исход 

изучаемого 

эксперимента.  Эксперимент,  обычно,  состоит  в  проведении  n 
испытаний,  в  которых  результат  i-го  испытания  описывается 
случайной величиной  X

i

, (i=1,...,n). 

Совокупность 

наблюдаемых 

случайных 

величин  

X

=(X

1

,...,X

n

)  называется 

выборкой

;  величины  X

i

,  (i=1,...,n) 

называются 

элементами  выборки

;  их  число  n  - 

объемом 

выборки

Реализация  выборки 

X

 

обозначается  строчными 

буквами:  

x

=(x

1

,...,x

n

). Пусть 

X

={

x

} – множество, на котором 

задано  распределение  случайного  вектора 

X

,  т.е.  множество 

всех  возможных  значений  выборки 

X

.  Множество 

X

 

называется 

выборочным  пространством

.  Выборочное 

пространство  может  быть  либо  n-мерным  евклидовым