ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.12.2019

Просмотров: 881

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

метров, равна нулю.

Отсюда следует, что ; в соответствии с формулой Стерджесса, при , находим длину частичного интервала разбиения:

Если примем за , тогда Все исходные данные разбиваем на интервалов (при ):

Подсчитав общее число студентов , попавших в каждый из полученных промежутков, получим интервальный статистический ряд:



Рост

[150-156)

[156-162)

[162-168)

[168-174)

[174-180)

[180-186)

Частота

4

5

6

7

5

3

Частость

0,13

0,17

0,20

0,23

0,17

0,10


Одним из способов статистической обработки вариационного ряда является построение

эмпирической функции распределения.

Пусть известно статистическое распределение частот количественного признака число наблюдений, при которых наблюдалось значе­ние признака , а общее число наблюдений (объем выборки).

Эмпирической (статистической) функцией распределения называется функция, определяющая для каждого значения частость события :

(2) .

В отличие от эмпирической функции распределения выборки, интегральную функцию распределения ге­неральной совокупности называют теоретической функ­цией распределения. Различие между эмпирической и тео­ретической функциями состоит в том, что теоретическая функция

(3)

- определяет вероятность события, а эмпирическая функция определяет относительную частоту этого же события.

Очевидно, что функция удовлетворяет тем же условиям, что и истинная функция (см.Т.3). Другими словами, числа и мало отличаются одно от другого. Уже отсюда следует целесообразность исполь­зования эмпирической функции распределения выборки для приближенного представления теоретической (инте­гральной) функции

-распределения генеральной совокуп­ности. Такое заключение подтверждается и тем, что об­ладает всеми свойствами . Действительно, из опреде­ления функции вытекают следующие ее свойства:

1. Значения эмпирической функции принадлежат от­резку [0,1];

2. неубывающая функция;

3. Если наименьшая варианта, то при ; и если наибольшая варианта, то при , .

На основании теорем ЗБЧ при увеличении числа наблюдений (опытов) относительная частота события приближается к истинной вероятности этого события.

Эмпирическая функция распределения является как бы «оценкой» вероятности события , т.е. оценкой теоретической функции распределения с.в. .

Таким образом, можно заключить, что имеет место утверждение,

Пусть является теоретическая функция распределения случайной величины , а её эмпирической функцией распределения. Тогда для любого справедливо предельное соотношение

(4)

Пример 5. В условиях примера 3, и используя полученные результаты, построим эмпирическую функцию .


Решение. В нашем случае по условию . В целях наглядности решения примера приведём ещё раз полученную таблицу относительных частот


0

1

2

3

4

5

где . Контроль.

Поэтому при (наблюдений меньше отсутствует); при (здесь по таблице ). при (здесь ) и т.д. Таким образом, получаем

График эмпирической функции распределения имеет вид: (Рис. 72.)


Рисунок 72 из Письменного



5. Графическое изображение статистического

распределения, полигон и гистограмма.


В целях наглядности изучения ста­тистического распределения изображают (строят) различные графики в виде так называемых полигона и ги­стограммы. Полигон, как правило, служит для изображения дискретного (т.е. варианты отличаются друг от друга на постоянную величину) статистического ряда.

Полигоном частот называют ломаную, построенную путём последовательного соединения отрезками точек , на плоскости . Для построе­ния полигона частот на оси абсцисс откладывают значения вариантов , а на оси ординат соответствующие им частоты . Точки соединяют слева на право отрезками прямых и получают полигон частот.

Полигоном относительных частот называют ломаную, построенную путём последовательного соединения отрезками точек , на плоскости . Для построе­ния полигона относительных частот на оси абсцисс откладывают значения вариантов , а на оси ординат соответствующие им относительные частоты . Точки соединяют слева на право отрезками прямых и получают полигон относительных частот.

Пример 6. Для примера 3, полигон относительных частот изображен на чертеже 73. по таблице


0

1

2

3

4

5

где . Контроль.

Рис.73. из Письменного


Задание. Построить для этого же примера полигон частот на основании таблицы




0

1

2

3

4

5

1

2

1

1

2

3

где . Контроль.

Сравнение этих двух графиков показывают, что ординаты полигона частот может быть достаточно «высоким», причем сумма координат равна числу выборке . Ординаты полигона относительных частот ограничена сверху единичной прямой, причём сумма их координат (ординат) равна 1. Как бы во втором случае происходит «нормировка» графика.

Для непрерывного распределения признака (т.е. значения варианты могут отличиться один от другого на сколь угодно, малую величину) можно построить полигон частот, взяв середины интервалов в качестве значений . В этих случаях обычно стро­ят гистограмму частот, а также гистограмму относительных частот

Гистограммой частот называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению плотность частоты.


Гистограммой относительной частоты называют ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные интервалы длины , а высоты равны отношению плотность относительной частоты.

На основании этих определений, легко заметить, что:

1. Площадь гистограммы частот равна объёму выборки , т.е.

(5) .

2. Площадь гистограммы относительных частот равна единице, т.е.

(6) .

Пример 7. В условиях примера 4 рассмотрим гистограмму частот и гистограмму относительных частот.

Решение. В примере 4 длина интервала равна , и нами была составлена статистическая таблица распределения


Рост

[150-156)

[156-162)

[162-168)

[168-174)

[174-180)

[180-186)

Частота

4

5

6

7

5

3

Частость

0,13

0,17

0,20

0,23

0,17

0,10


На основании этой таблицы находим высоты прямоугольников:

Гистограмма относительных частот изображена на рис. 74.


Рис. 74 из Письменного


Заметим, что гистограмма относительных частот является статистическим аналогом дифференциала функции распределения плотности с.в. . Сумма площадей прямоугольников равна единице.

,

что соответствует условию нормировки

(контроль)

для плотности вероятностей Кривая на рисунке выражает и плотность вероятностей .

Если соединить середины верхних оснований прямоугольников отрезками прямой, то получим полигон того же распределения. (Самостоятельно убедитесь в этом)

Задание. На основании таблицы примера 7 и формулы

1. Найдите значения чисел

2. Изобразите гистограмму частот

Упражнение. Дана таблица измерения некоторого измерительного процесса



Интервал

длиною

5-10

10-15

15-20

20-25

25-30

30-35

35-40

Частота

интервала

4

6

16

36

24

10

4

Плотность

частоты

0,8

1,2

3,2

7,2

4,8

2,0

0,8


1. Вычислить объём выборки ,

2. Найти численные значения высот и ,

3. Постройте геометрическое изображение гистограммы частот и относительных частот.


6. Числовые характеристики

статистического распределения


Пусть требуется изучить количественный признак ге­неральной совокупности. Допустим, что из теоретических соображений удалось установить, какое именно распре­деление имеет признак. Естественно возникает задача оценки параметров, которыми определяется это распре­деление. Например, если априори (до эксперимента) известно, что изучаемый признак в генеральной совокупности распределен нормаль­но, то необходимо оценить (приближенно найти) математи­ческое ожидание и среднеквадратическое отклонение, так как эти два параметра полностью определяют нормаль­ное распределение. Если же есть основания считать, что признак имеет, например распределение Пуассона, то необходимо оценить параметр которым это распреде­ление определяется.


Обычно в распоряжении исследователя имеются лишь данные выборки, например, значения количественного признака , полученные в результате наблю­дений (здесь и далее наблюдения предполагаются незави­симыми). Через эти данные можно определить ряд числовых характеристик, аналогичным тем, что в теории вероятностей определялись для случайных величин.

Предположим, что статистическое распределение выборки объёма (таблица) имеет вид:

Выборочным средним (или математическим ожиданием выборки) называется среднее арифметическое всех значений выборки:

(7)

Выборочное среднее с учётом значения относительной частоты можно записать и так:

(8)

Для обозначения выборочного среднего используют: .

Следует отметить, что в случае интервального статистического ряда в равенстве (7) в качестве берут середины его интервалов, а в качестве соответствующие им частоты.

Выборочной дисперсией называется среднее арифметическое квадратов отклонений значений выборки от выборочной средней т.е.

(9)


или, с учётом выборочной относительной частоты имеем

(10)

Ввиду того, что наблюдения проводятся независимые, можно доказать вычислительную формулу, где

(11)


или

Следует отметить, все основные свойства математического ожидания и дисперсии, рассмотренные ранее (см. Т.8.) сохраняются.

Выборочное среднеквадратическое отклонение выборки определяется формулой

(12) .

Особенность выборочного среднеквадратичного отклонения состоит в том, что оно измеряется в тех же единицах, что и изучаемый признак.

При решении практических задач используется и величина

(13) .

Величина называется исправленной выборочной дисперсией, а величина

(14)

- называется исправленным выборочным средним квадратическим отклонением.

Для непрерывно распределённого признака формулы для выборочных средних

будут такими же, но за значения последовательности следует брать не концы промежутков, а их середины

В качестве описательных характеристик вариационного ряда или полученного из него статистического распределения выборки (таблицы) используется медиана, мода, размах выборки (вариации) и т.д.

Размахом вариации называется число, где или где наибольший, наименьший вариант статистического ряда.

Модой вариационного ряда называется вариант, имеющий наибольшую частоту.

Медианой вариационного ряда называется значение признака (с.в. ), приходящееся на середину ряда, при этом


(15)

Пример 8. По условиям примера 3 найти характеристики выборки результаты тестирования десяти абитуриентов.

Решение. Сначала приведём полученные таблицы частоты и относительные частоты (см. решение примера3) из примера 3:


0

1

2

3

4

5

1

2

1

1

2

3

где . Контроль.


0

1

2

3

4

5

где . Контроль.

На основании определений, таблиц и формулы (7)-(15) соответственно получим:

1.

2. ,

3. ,

4.

5.

6.

7. ,

8.

Упражнение. На одном из телефонных станции города «П» производились наблюдения за количеством неправильных соединений в минуту.

Результаты наблюдений в течение одного часа представлены в виде статистического распределения.


2

3

4

5

6

8

17

16

10

6

2

1


1. а) построить полигоны частот и относительных частот.

б) построить гистограммы частот и относительных частот.

2. Найти значения выборочные среднее и дисперсию. Сравните распределение относительной частоты с распределением Пуассона

.

Ответы: ,

.

3. Проверьте равенство и убедитесь, что с.в. количество неправильных соединений имеет фактически пуассоновское распределение.



Тема19. Элементы теории оценок и

проверки гипотез


1. Оценки параметров распределения


- Понятие оценки параметров

Пусть рассматривается случайная величина с некоторым законом распределения. По виду статистического распределения (таблицы распределения) можно строить гипотезы об истинном характере распределения величины . Например, построив гистограмму, естественно предположить, что распределение величины подчиняется определённому (нормальному или равномерному и т.д.) закону.

На практике, в целом, редко встречается такое положение, когда изучаемый закон распределения неизвестен полностью. Чаще всего дело обстоит следующим образом, что вид

закона распределения заранее (из каких-либо теоретических соображений) известен. Требуется найти лишь некоторые параметры, от которых закон зависит. Например, если распределение происходит по закону Пуассона

,

то следует определить параметр , а если по нормальному закону, то нужно определить параметры и . Впрочем, в некоторых задачах и сам вид закона распределения несущественен, а требуется только его числовые характеристики. Во всех подобных случаях

можно обойтись сравнительно небольшим числом - порядка одного или нескольких десятков наблюдений.