Файл: Эмпирическая функция распределения. Полигон и гистограмма. В результате изучения темы студент должен.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.01.2024

Просмотров: 68

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Эмпирическая функция распределения. Полигон и гистограмма.

В результате изучения темы студент должен:

- знать геометрическое изображение выборки: полигон и гистограмма, эмпирическую функцию распределения выборки, числовые характеристики выборки

[1], [3], [4]

Статистические оценки параметров распределения

В результате изучения темы студент должен:

- знать понятие точечной оценки

- знать понятие интервальной оценки

[1], [3], [4]


Перечень информационного обеспечения:

основной и дополнительной литературы, учебно-методических пособий,

электронных ресурсов


№ п/п.

Автор

Наименование

Издательство

Год издания

1

И. И. Валуцэ, Г. Д. Дилигул

Математика для техникумов

М. : Наука

1989

2

Данко П.Е., Попов А.Г., Кожевникова Т.Я.

Высшая математика в задачах и упражнениях

М. : «Высшая школа»

1999

3

А. Г. Мякишев


Теория вероятностей. Элективный курс

М. :Издательство: Илекса

2012

4

М. С. Спирина, П. А. Спирин

Теория вероятностей и математическая статистика: учебник

М. : ИЦ "Академия"

2014

5

М. С. Спирина, П. А. Спирин

Теория вероятностей и математическая статистика. Сборник задач: учебное пособие

М. : ИЦ "Академия"

2014



Тема лекции: Математическая статистика
План:

  1. Основные понятия математической статистики

  2. Графическое изображение выборки

  3. Точечные оценки параметров распределения





  1. Основные понятия математической статистики


На практике функция распределения случайной величины бывает неизвестна и ее определяют по результатам наблюдений или, как говорят, по выборке. Выборкой объема n для случайной величины называется последовательность независимых наблюдений этой величины, где – совокупность значений, принятых независимыми случайными величинами , имеющими тот же закон распределения , что и величина X. В этом случае говорят, что выборка взята из генеральной совокупности величины X, а под законом распределения генеральной совокупности понимают закон распределения случайной величины X. Значения называют выборочными значениями или вариантами. Последовательность вариант, записанных в возрастающем порядке, называется вариационным рядом. Число, указывающее, сколько раз наблюдается данная варианта, называется частотой варианты, а отношение частоты варианты к объему выборки – относительной частотой.
Если – вариационный ряд, а x – произвольное число, и nx – количество выборочных значений, меньших x, то – частота попадания выборочных значений левее точки x в данной выбоке объема n, т. е. частота события .
Эта частота является функцией от x и называется эмпирической функцией распределения случайной величины X, полученной по данной выборке. Если обозначить эту функцию через , то по определению

.

Эмпирическая функция распределения обладает всеми свойствами функции распределения . Так как частота события в 

n независимых опытах является оценкой вероятности этого события, то значение эмпирической функции распределения в точке x есть оценка вероятности события , то есть оценка теоретической функции распределения :

.

Статистическим рядом распределения называется таблица, которая содержит вариационный ряд и соответствующие частоты или относительные частоты членов этого ряда (табл. 1).

,

, .

Таблица 1 Таблица 2

x1

x2

...

xk








...



n1

n2

...

nk




n1

n2

...

nk

w1

w2

...

wk




w1

w2

...

wk

В случае непрерывного распределения величины X статистический ряд распределения представляет собой таблицу, в которой заданы интервалы значений величины X и соответствующие им частоты или относительные частоты, причем интервалы располагаются в порядке возрастания величины X (табл. 2).

Второй случай легко сводится к первому, если в качестве вариант брать середины интервалов:


, .


  1. Графическое изображение выборки


Графически табл. 1 изображается полигоном частот, представляющим собой ломаную, отрезки которой соединяют на плоскости соседние точки и или и , если строится полигон относительных частот.

В случае табл. 2 исходный интервал, в котором заключены все наблюдаемые значения признака, разбивают на определенное количество равных интервалов длины . После этого строится гистограмма частот – ступенчатая фигура, состоящая из прямоугольников, основания которых равны h, а высоты равны отношению (или для гистограммы относительных частот).

Гистограмма относительных частот является аналогом функции плотности, так как площадь под ней равна единице. Число интервалов разбиения находят по формуле , где n – объем выборки. Тогда длина каждого интервала , где и – максимальное и минимальное значение выборки соответственно.


  1. Точечные оценки параметров распределения


По аналогии с такими числовыми характеристиками случайной величины, как математическое ожидание, дисперсия и среднее квадратическое отклонение, для выборки случайной величины X и для статистического ряда определяются следующие числовые характеристики:

выборочная средняя ,

где k – число вариант и
;

выборочная дисперсия

или , ;

выборочное среднее квадратическое отклонение
Во многих случаях бывает заранее известно, что функция распределения принадлежит к определенному классу функций распределения, зависящих от одного или нескольких параметров: . В этом случае определение неизвестной функции распределения сводится к оценке неизвестных параметров по результатам выборки. Следует заметить, что ни при каких n нельзя определить по выборке точное значение неизвестного параметра, а можно найти его приближенное значение, которое называется оценкой по выборке неизвестного параметра. Всякая оценка по выборке является функцией от выборочных значений , так как она меняется от выборки к выборке. Функцию подбирают так, чтобы случайная величина по возможности более точно аппроксимировала неслучайное неизвестное число a.
Для выполнения данного условия накладывают следующие требования на оценку: несмещенность оценки, ее эффективность и состоятельность. Наиболее часто применяемыми метода получения оценок являются метод моментов и метод максимального правдоподобия.
Несмещенной и состоятельной оценкой математического ожидания является выборочная средняя .
Несмещенная и состоятельная оценка дисперсии вычисляется по формуле: