Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.06.2024
Просмотров: 220
Скачиваний: 0
-39-
Задаваясь различными значениями t, вычислим верхние границы вероятностей того, что отклонение случайной величины выйдет за пределы tσ : при t =1 p{X − M (x) >σ}≤1;
t = 2 |
p{ |
X − M (x) |
|
> 2σ}≤ |
1 |
; t = 3 |
p{ |
X − M (x) |
|
> 3σ}≤ |
1 |
. Вероятно- |
|
|
|||||||||||
|
|
|
|
|
4 |
|
|
|
|
|
9 |
|
|
|
|
|
|
|
|
|
|
|
|
сти рассматриваемых событий не могут превысить этих числовых значений ни при каком распределении случайной величины.
27. Теорема Чебышева Т. При достаточно большом числе попарно независимых слу-
чайных величин X1 , X2 ,K, Xn с математическими ожиданиями
M (x1), M (x2 ),K, M (xn ) и дисперсиями D(x1), D(x2 ),K, D(xn ) с ве-
роятностью, близкой к единице, можно утверждать, что разность между средней арифметической наблюдавшихся значений случайных величин X1 , X2 ,K, Xn и средней арифметической их математиче-
ских ожиданий по абсолютной величине окажется меньше сколь угодно малого числа τ > 0 при условии, что дисперсия всех этих величин не превосходит одного и того же постоянного числа В, то есть
|
|
1 |
n |
1 |
n |
|
|
>1−η, |
|
|
|||||||
p |
|
∑ Xi − |
∑M (xi ) |
|
≤τ |
|||
|
|
n i =1 |
n i =1 |
|
|
|
где η- положительное число, близкое к нулю.
Доказательство. Пусть X1 , X2 ,K, Xn - п попарно независимых случайных величин. Средняя арифметическая этих величин является,
в свою очередь, тоже случайной величиной. Обозначим её
|
|
1 |
n |
|
|
|
|
|
||||||
|
|
|
|
|
|
|
||||||||
X = |
|
∑ Xi . Определим математическое ожидание и дисперсию |
||||||||||||
|
||||||||||||||
|
|
n i =1 |
|
|
1 ∑M (xi ), |
|||||||||
|
|
|
M (x)= M 1 ∑ Xi = |
|||||||||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
n |
i =1 |
|
|
n |
|
i =1 |
||
|
|
|
D(x)= D 1 ∑ Xi = |
|
1 ∑D(xi ). |
|||||||||
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
n |
|
|
|
|
|
|
|
|
i =1 |
||||||
|
|
|
|
|
|
n |
i =1 |
|
n2 |
X :
X :
Применяя к случайной величине X неравенство Чебышева, получаем
p(X − M (x)≤τ )>1− Dτ(2x),
-40-
|
|
|
|
n |
|
||
|
|
|
|||||
или |
p |
|
|
1 |
∑ X |
i |
|
n |
|||||||
|
|
|
i=1 |
||||
|
|
|
|
|
|
1 |
n |
|
− |
∑M (xi ) |
||
|
|||
|
n i=1 |
≤τ >1−
1 |
n |
∑D(xi ). |
n2τ 2 i=1
Заменяя в правой части последнего неравенства дисперсии случайных величин величиной В, которую по условию теоремы не превосходит ни одна из дисперсий, получаем усиленное неравенство
|
|
1 |
n |
1 |
M (xi ) |
|
|
|
B |
|
|
|
|
|
|||||||
p |
|
∑ Xi − |
|
≤τ |
>1− |
. |
||||
|
|
n |
|
nτ 2 |
||||||
|
|
n i =1 |
|
|
|
|
|
Для любого сколь угодно малого числа η > 0 можно найти такое чис-
ло п, при котором выполняется неравенство |
B |
<η. Таким образом |
|
nτ 2 |
|||
|
|
получаем неравенство, которое требовалось доказать:
|
|
1 |
n |
1 |
n |
|
|
>1−η. |
|
|
|||||||
p |
|
∑ Xi − |
∑M (xi ) |
|
≤τ |
|||
|
|
n i =1 |
n i =1 |
|
|
|
Переходя в фигурных скобках к противоположному событию, можно
записать p |
1 |
n |
1 |
n |
>τ ≤η . |
∑ Xi − |
∑M (xi ) |
||||
|
n i =1 |
n i =1 |
|
Теорема Чебышева показывает, средняя арифметическая попарно независимых случайных величин обладает свойством устойчивости и при определённых условиях мало отличается от средней арифметической математических ожиданий этих величин.
-41-
МАТЕМАТИЧЕСКАЯ СТАТИСТИКА 28. Основные понятия математической статистики
Математическая статистика- это раздел математики, изу-
чающий методы сбора, систематизации и обработки результатов наблюдений массовых случайных явлений с целью выявления существующих закономерностей. Выводы о закономерностях, которым подчиняются явления, изучаемые методами математической статистики, всегда основываются на ограниченном, выборочном числе наблюдений. Поэтому естественно предположить, что эти выводы при большом числе наблюдений могут оказаться иными. Чтобы быть в состоянии высказать более определённое суждение об изучаемом явлении, математическая статистика опирается на теорию вероятностей.
Оценив неизвестные величины или зависимости между ними по данным наблюдений, исследователь выдвигает ряд гипотез, предположений о том, что рассматриваемое явление можно описать той или иной вероятностной теоретической моделью. Далее, используя мате- матико-статистические методы, можно дать ответ на вопрос, какую из гипотез или моделей следует принять. Именно эта модель и есть закономерность изучаемого явления.
Основные задачи математической статистики состоят в разработке методов:
1)организации и планирования статистических наблюдений;
2)сбора статистических данных;
3)«свертка информации», то есть методов группировки и сокращения статистических данных с целью сведения большого числа таких данных к небольшому числу параметров, которые в сжатом виде характеризуют всю исследуемую совокупность;
4)анализа статистических данных;
5)принятия решений, рекомендаций и выводов на основе анализа статистических данных;
6)прогнозирования случайных явлений.
Одним из основных методов статистического наблюдения является выборочный метод. Рассмотрим основные понятия этого метода.
-42-
29. Вариационные ряды О.1. Генеральной совокупностью называется совокупность всех
мыслимых наблюдений, которые могли бы быть сделаны при данном реальном комплексе условий измерений. Число членов, образующих генеральную совокупность, называется объёмом генеральной совокупности.
О.2. Выборочной совокупностью или просто выборкой объёмом
п называется совокупность п объектов, отобранных из исследуемой генеральной совокупности.
О.3. Вариантами называются различные значения признака, а варьированием – изменение значений признака.
О.4. Расположение наблюдаемых значений в порядке возрастания или убывания называется ранжированием выборки.
О.5. Если признак по своей сущности таков, что различные значения не могут отличаться друг от друга меньше чем на некоторую конечную величину, то говорят, что это дискретно варьирующийся признак.
О.6. Число, показывающее, сколько раз встречается вариант х в ряде наблюдений, называется частотой варианта mx.
Вместо частоты варианта х можно рассматривать её отношение к общему числу наблюдений п, которое называется частостью варианта х и обозначается ωх. Так как общее число наблюдений равно
сумме частот всех вариантов (n = ∑mx ), то справедлива следующая цепочка равенств: ωx = mnx = ∑mmx x .
О.7. Таблица, позволяющая судить о распределении частот (или частостей) между вариантами, называется дискретным вариацион-
ным рядом.
Наряду с понятием частоты используется понятие накопленной частоты, которую обозначают mнакx . Накопленная частота показы-
вает, во скольких наблюдениях признак принял значения, меньшие заданного значения х. Отношение накопленной частоты к общему числу наблюдений называют накопленной частостью и обозначают
ωнак. Очевидно, что ωнак = mxрак |
n |
. |
|
х |
x |
|
О.8. Признак называется непрерывно варьирующим, если он может принять любое значение в некотором числовом интервале.
-43-
По полученным данным такого признака трудно выявить характерные черты варьирования значений признака. Построение дискретного вариационного ряда также не даст желаемых результатов (слишком велико число вариантов). Для получения ясной картины нужно объединить полученные значения в несколько интервалов.
О.9. Таблицу, позволяющую судить о распределении частот (или частостей) между интервалами варьирования значений призна-
ка, называют интервальным вариационным рядом.
Интервальный вариационный ряд строят по данным наблюдений за непрерывно варьирующим признаком, а также за дискретно варьирующим, если велико число наблюдавшихся вариантов. Дискретный вариационный ряд строят только для дискретно варьирующего признака.
Для построения интервального вариационного ряда необходимо определить величину интервала, установить полную шкалу интервалов, в соответствии с ней сгруппировать результаты наблюдений. Для определения оптимального интервала h, то есть такого, при котором построенный интервальный ряд не был бы слишком громоздким и в то же время позволял выявить характерные черты рассматриваемого явления, можно использовать формулу Стэрджеса
h = |
|
xmax − xmin |
, где xmax и xmin - соответственно максимальный и |
|
1+3,322 lg n |
||||
|
|
минимальный варианты. Величина 1+3,322 lg n характеризует число
интервалов m, но так как количество интервалов целое число, то её округляют до целого значения. При этом желательно, чтобы ∆ = hm −(xmax − xmin )≥ 0 было минимальным для возможных значе-
ний m. Длина интервала имеет ту же точность, что и варианты. Пример 33. Найти оптимальную длину интервала по следую-
щим данным, xmax = 74, xmin =16 n = 50, причём значения вариантов целые числа.
Решение. Вычислим 1+ lg 50 ≈ 6,64 . Возможные количество интервалов 7 или 6. Соответствующие им длины интервалов равны
h = |
74 −16 |
≈ 9; |
h |
= |
74 −16 |
≈10 . Тогда ∆ = 9 7 −(74 −16)= 5 и |
|
|
|||||
1 |
7 |
|
2 |
|
6 |
1 |
∆2 =10 6 −(74 −16)= 2 . Так как ∆1 = 5 > ∆2 = 2, то для уменьшения
погрешностей желательно взять шесть интервалов, имеющих длину
10.