Файл: Нов-ПМС-1.pdf

Скачать файл (2,38Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.04.2021

Просмотров: 1009

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

при n



к вероятности этого события], F

(x)

 



F(x), т.е.

имеет место равенство (1.6) ▓

Замечание.

Если объем выборки большой, то значение

эмпирической функции распределения в каждой точке х
может служить приближенным значением (

оценкой

)

теоретической функции распределения в этой точке. Функцию
F

(x) назвают еще

статистическим аналогом

для F(x).

Более глубокие свойства эмпирической функции

распределения проявляются, если рассматривать ее поведение
не в отдельной фиксированной точке х, а в произвольной
конечной совокупности точек x

<...<x

. В частности, важно

знать отклонения эмпирической функции распределения F

(x)

от F(x) на всей оси. Известен результат, принадлежащий
Гливенко В.И.

Теорема 1.2 (Гливенко): В условиях теоремы 1.1

F x

lim sup

( )

  













 

(1.7)

Другими словами, соотношение (1.7) означает, что

отклонение D

= D

(



sup

( )

 



F x

эмпирической функции распределения от F(x) на всей оси с
вероятностью 1 будет сколь угодно мало при n



(при

достаточно большом объеме выборки).

Рассмотрим теорему, которая позволяет для больших n

оценивать вероятности заданных отклонений случайной
величины. D

от 0.

Теорема 1.3 (Колмогорова): Если функция F(x)

непрерывна, то при любом фиксированном t>0





lim

( )

i t

P nD

K t









 







2 2

(1.8)

Предельную  функцию  распределения  К(х)  можно  с  хорошим
приближением  использовать  для  практических  расчетов  уже
при  n



20. Теорему Колмогорова применяют для того, чтобы

определить  границы,  в  которых  с  заданной  вероятностью
находится  теоретическая  функция  распределения  F(x),  если
она  неизвестна.  Пусть  для  заданного



(0,1) число t



определяется уравнением K(t



Тогда из (1.8) имеем:







 

























































)

(

)

(

)

(

)

(

)

(

Таким образом, при n



с вероятностью, близкой к



значения функции F(x) для всех х удовлетворяют
неравенствам

F x

( )









Так как 0



F(x)



1, эти неравенства можно уточнить:

max , ( )

( ) min

( )

F x







 













Область, определяемая этими нижней и верхней

границами, называется

асимптотической



-доверительной

зоной

для теоретической функции распределения. Для

определения числовых значений t



при различных



можно

воспользоваться табулированными значениями функции K(t).

Теорема 1.4 (Смирнова): Пусть F

(x) и F

(x) - две

эмпирические функции распределения, построенные на основе
двух независимых выборок объемом n и m из одного и того же
распределения

(



), и D

n,m

sup

( )

 



F x

Тогда, если теоретическая функция распределения F(x)
непрерывна, то для любого фиксированного t>0

lim

(

)

( )

n m

n m D

K t













 

где функция K(t) определена равенством (1.8).

Эту

теорему

используют

для

проверки

гипотезы

(предположения) о том, что две выборки получены из одного и
того же распределения.

1.3. Гистограмма и полигон частот

Итак, эмпирическая функция распределения – удобный

способ представления статистических данных (выборки



Он позволяет делать выводы о распределении наблюдаемой
случайной величины



, когда оно неизвестно. По

эмпирической функции распределения. F

(x) при n



со

сколь угодно высокой точностью можно восстановить
неизвестную теоретическую функцию распределения F(x).

Рассмотрим

другие

способы

представления

статистических данных. Пусть наблюдаемая случайная
величина



дискретна и принимает значения x

,...

Представление о законе распределения



дадут частоты



/n,

где



- число элементов выборки



=(X

,...,X

), принявших

значение x



I X





(

)

В этом случае, по теореме Бернулли, при n







 





(

), r = 1,2,...

Пусть



- непрерывная случайная величина и имеет

непрерывную  плотность  распределения  f(x).  Рассмотренную
методику  применим  для  оценивания  неизвестной  плотности.
Это  осуществляется  с  помощью

метода группировки

наблюдений

(или метода группировки данных), который

состоит в следующем.

Пусть {



} - некоторое разбиение области



возможных

значений













, i



j и









) - число

выборочных точек [элементов выборки



=(X

,...,X

)],

попавших в интервал



. Тогда при n



, по теореме Бернулли,



 





f x dx

( )





По теореме о среднем значении, последний интеграл

равен





f(x

), где x

некоторая внутренняя точка интервала







- его длина. Обычно интервалы выбираются одинаковой

длины, и если длина интервала мала, то в качестве x

берут

середину интервала. Поэтому можно считать



 



f(x

)

или





f x



( )

. (1.9)

Построим

теперь

кусочно-постоянную

функцию

f x

( )







, при x



, r=1,2,..., называемую

гистограммой

При n



и достаточно мелком разбиении {



} гистограмма

(x) будет оценкой f(x) - теоретической плотности. Если

плотность достаточно гладкая функция, то ее лучше
приблизить кусочно-линейными графиками. Оценка гладких
f(x) основама на построении

полигона частот

. Полигон частот

-  это  ломанная,  которую  строят  так:  если  построена
гистограмма,  то  ординаты,  соответствующие  средним  точкам
интервалов,  последовательно  соединяют  отрезками  прямых.
Такой  кусочно-линейный  график  является  статистическим
аналогом (оценкой) теоретической плотности (рис. 1.2.).

(x)



Рис. 1.2

Высота определяется формулой (1.9), а основание -

длина интервала разбиения.

1.4. Определения и свойства выборочных

характеристик

Пусть



=(X

,...,X

) - выборка из распределения

(



F(x) и F

(x) - соответственно теоретическая и эмпирическая

функции распределения. Точно так же, как функции F(x)
ставят

соответствие

(x),

любой

теоретической

характеристике

g x dF x





( ) ( )

можно

поставить

соответствие

ее

статистический

аналог

G=G(



определяемый по формуле

g x dF x

g X









( ) ( )

(

)

Случайную величину G называют

эмпирической

или

выборочной

характеристикой

соответствующей

теоретической характеристике g. Таким образом, выборочная
характеристика - это среднее арифметическое значение
функции g(x) для элементов выборки



. Если g(x)=x

, то G -

выборочный момент k-го порядка

, обозначается A

A X

( )







(1.10)

(значение начального момента k-го порядка







При k=1 величину A

называют

выборочным средним

обозначают

X A





Значения случайных величин A

для данной реализации

выборки



обозначают строчными буквами a

= a

Выборочным центральным моментом k-го порядка

называют случайную величину

Смотрите также файлы

block_ciphers.pdf

Коновалова_управление качеством окр среды.pdf

Lumf_p1&amp;2(2010).pdf

Basic Telephone Training.pdf

algebra_Tzareff.pdf

Файл: Нов-ПМС-1.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно