ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 28.02.2019

Просмотров: 800

Скачиваний: 2

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

В частном случае, когда генеральная совокупность содержит по одному значению каждой варианты, генеральная средняя равна:

 

.

(6.2а)





10. Выборочная дисперсия как точечная оценка генеральной дисперсии, ее смещенность и состоятельность. Несмещенная оценка генеральной дисперсии.



Для того, чтобы наблюдать рассеяние количественного признака значений выборки вокруг своего среднего значения , вводят сводную характеристику- выборочную дисперсию.

  •   Выборочной дисперсией называют среднее арифметическое квадратов отклонения наблюдаемых значений признака от их среднего значения .

Если все значения признака выборки различны, то

 если же все значения имеют частоты n1, n2,…,nk, то

Для характеристики рассеивания значений признака выборки вокруг своего среднего значения пользуются сводной характеристикой - средним квадратическим отклонением.

Вычисление дисперсии- выборочной или генеральной, можно упростить, используя формулу:

Замечание: если выборка представлена интервальным вариационным рядом, то за xi принимают середины частичных интервалов.  

  Для исправления выборочной дисперсии достаточно умножить ее на дробь

получим исправленную дисперсию S2. Исправленная дисперсия является несмещенной оценкой.

В качестве оценки генеральной дисперсии принимают исправленную дисперсию.

Для оценки среднего квадратического генеральной совокупности используют исправленное среднее квадратическое отклонение

Пример: По выборке объема N=41 найдена смещенная оценка генеральной дисперсии . Найти несмещенную оценку дисперсии генеральной совокупности.



Решение. Смещенной оценкой генеральной дисперсии служит выборочная дисперсия

Несмещенной оценкой генеральной дисперсии является «исправленная дисперсия»

 или 

Таким образом, мы получаем искомую несмещенную оценку дисперсии генеральной совокупности:



11. Интервальные оценки неизвестных параметров генеральной совокупности. Доверительная вероятность. Интервальная оценка мат. ожидания нормально распределенного признака при известном среднем квадратическом отклонении.

Интервальной оценкой называется числовой интервал, который определяется двумя числами – границами интервала, содержащего неизвестный параметр генеральной совокупности.

Доверительным интервалом называется интервал, в котором с той или иной заранее заданной вероятностью находится неизвестный параметр генеральной совокупности.

Доверительная вероятность   – вероятность, что событие вероятности 1- можно считать невозможным, a = 1-  – уровень значимости. В качестве доверительных вероятностей используют вероятности, близкие к 1 (например, 0,95; 0,99; 0,999).

Для малых выборок (n<30) нормально распределенного количественного признака Х доверительный интервал имеет вид:


 ,

где – коэффициент Стьюдента, значение которого определяется величиной доверительной вероятности  и числом степеней свободы f = n - 1.

Для больших выборок (n<30) нормально распределенного количественного признака Х доверительный интервал имеет вид:

 ,

где  – коэффициент Стьюдента, значение которого определяется величиной доверительной вероятности  и числом степеней свободы f = n – 1.

Пусть математическое ожидание выборочной средней нормального распределения равно a и среднее квадратическое отклонение – σ.

Требуется найти доверительные интервалы, покрывающие параметр a с надежностью γ, т.е.

Для решения воспользуемся формулой вычисления вероятности заданного отклонения из теории вероятностей:

Проведя замены X на и σ на , получим

Найдя из последнего равенства , можем написать

Приняв во внимание, что доверительная вероятность задана и равна γ, и заменив выборочную среднюю на окончательно имеем

Смысл полученного равенства:

С надежностью γ можно утверждать, что доверительный интервал ) покрывает неизвестный параметр a, точность оценки .

Число t определяется из соотношения .

По таблице функции Лапласа находят аргумент t, которому соответствует значение функции Лапласа

Замечание 1. Оценку называют классической. Из формулы точности оценки следуют выводы:

1) При возрастании объема выборки n число δ убывает, следовательно точность увеличивается;

2) Увеличение надежности оценки приводит к увеличению t. Как следствие, возрастает δ и уменьшается точность оценки.

Замечание 2. Как следует из равенства точности оценки, минимальный объем выборки, который обеспечит заданную точность оценки математического ожидания, равен:



12. Интервальная оценка мат. ожидания нормально распределенного признака при известном среднем квадратическом отклонении.

Интервальной называют оценку, которая определяется двумя числами – концами интервала, покрывающего оцениваемый параметр.

Доверительным называют интервал, который с заданной надежностью   покрывает заданный параметр.

1. Интервальной оценкой (с надежностью   ) математического ожидания   нормально распределенного количественного признака   по выборочной средней   при известном среднем квадратическом отклонении   генеральной совокупности служит доверительный интервал

 , (18)

где   – точность оценки;

 – объем выборки;

 – значение аргумента функции Лапласа   , при котором   ; при неизвестном   (и объеме выборки   )

 , (19)

где   – «исправленное» выборочное среднее квадратическое отклонение,   находят по таблице приложения 3 по заданным   и   .

2. Интервальной оценкой (с надежностью  ) среднего квадратичекого отклонения  нормально распределенного количественного признака   по «исправленному» выборочному среднему квадратическому отклонению   служит доверительный интервал


 (20)

где   находят по таблице приложения 4 с заданными   и   .

3. Интервальной оценкой (с надежностью  ) неизвестной вероятности   биноминального распределения по относительной частоте   служит доверительный интервал (с приближенными концами   и   )

 ,

где   (21)

где   – общее число испытаний;   – число появлений события;   – относительная частота, равная отношению   ;   – значение аргумента функции Лапласа (приложение 2), при котором   (   – заданная надежность).

Замечание. При больших значениях   (порядка сотен) можно принять в качестве приближенных границ доверительного интервала

   . (22)

Пример. Найти доверительный интервал для оценки с надежностью 0,975 неизвестного математического ожидания   нормально распределенного признака   генеральной совокупности, если генеральное среднее квадратическое отклонение   , выборочная средняя   и объем выборки   .

Решение. Требуется найти доверительный интервал

 . (23)

Все величины, кроме   , известны. Найдем   из соотношения   . По таблице приложения 1 находим   . Подставив   ,   ,   ,   в (23), окончательно получим искомый доверительный интервал   .

Пример. Найти минимальный объем выборки, при котором с надежностью 0,95 точность оценки математического ожидания   генеральной совокупности по выборочной средней равна   , если известно среднее квадратическое отклонение   нормально распределенной генеральной совокупности.

Решение. Воспользуемся формулой, определяющей точность оценки математического ожидания генеральной совокупности по выборочной средней:   .

Отсюда   . (24)

по условию,   ; следовательно,   . По таблице приложения 2 найдем   . Подставив   ,   и   в (24), получим искомый объем выборки   .

Пример. Произведено 15 измерений одним прибором (без систематической ошибки) некоторой физической величины, причем «исправленное» среднее квадратическое отклонение   случайных ошибок измерений оказалось равным 0,7. Найти точность прибора с надежностью 0,99. Предполагается, что результаты измерений распределены нормально.

Решение. Точность прибора характеризуется средним квадратическом отклонением случайных ошибок измерений. Поэтому задача сводится к отысканию доверительного интервала, покрывающего   с заданной надежностью   :

 . (25)

По данным   и   по таблице приложения 4 найдем   . Подставив   ,   в соотношение (25), окончательно получим   .



13. Определение необходимого объёма повторной и бесповторной выборок при оценке генеральной средней.

Таблица 9.4 Необходимый объем (n) выборки для разных видов организации выборочного наблюдения

При планировании выборочного наблюдения с заранее заданным значением допустимой ошибки выборки необходимо правильно оценить требуемый объем выборки. Этот объем может быть определен на основе допустимой ошибки при выборочном наблюдении исходя из заданной вероятности  , гарантирующей допустимую величину уровня ошибки (с учетом способа организации наблюдения). Формулы для определения необходимой численности выборки n легко получить непосредственно из формул предельной ошибки выборки. Так, из выражения для предельной ошибки:


непосредственно определяется объем выборки n:

Эта формула показывает, что с уменьшением предельной ошибки выборки Δсущественно увеличивается требуемый объем выборки  , который пропорционален дисперсии   и квадрату критерия Стьюдента  .

Для конкретного способа организации наблюдения требуемый объем выборки   вычисляется согласно формулам, приведенным в табл. 9.4.



14. Статистическая проверка статистических гипотез. Виды гипотез, ошибки первого и второго рода. Критическая область и область принятия гипотезы, определения, примеры.

Статистическая гипотеза – любое предположение, касающееся неизвестного распределения случайных величин (элементов), соответствующее некоторым представлениям об изучаемом явлении. В частном случае это может быть утверждение о значениях параметров распределения генеральной совокупности.

Различают нулевую и альтернативную гипотезы. Нулевая гипотеза – гипотеза, подлежащая проверке. Альтернативная гипотеза – каждая допустимая гипотеза, отличная от нулевой. Нулевую гипотезу обозначают Н0, альтернативную – Н1.

Конкретная задача проверки статистической гипотезы полностью описана, если заданы нулевая и альтернативная гипотезы. При обработке реальных данных большое значение имеет правильный выбор гипотез. Принимаемые предположения, например, нормальность распределения, должны быть тщательно обоснованы, в частности, статистическими методами. Необходимо помнить, что в подавляющем большинстве конкретных прикладных задач распределение результатов наблюдений в той или иной степени отлично от нормального.

При проверке статистической гипотезы возможны ошибки. Есть два рода ошибок.

Ошибка первого рода заключается в том, что отвергают нулевую гипотезу, в то время как в действительности эта гипотеза верна. Вероятность ошибки первого рода называется уровнем значимости и обозначается α.

Ошибка второго рода состоит в том, что принимают нулевую гипотезу, в то время как в действительности эта гипотеза неверна.

Обычно используют не вероятность ошибки второго рода, а ее дополнение до 1. Эта величина носит название мощности критерия. Итак, мощность критерия – это вероятность того, что нулевая гипотеза будет отвергнута, когда альтернативная гипотеза верна.

Понятия уровня значимости и мощности критерия объединяются в понятии функции мощности критерия – функции, определяющей вероятность того, что нулевая гипотеза будет отвергнута.

После выбора определенного критерия множество всех его возможных значений разбивают на два непересекающихся подмножества, одно из которых содержит значения критерия, при которых нулевая гипотеза отвергается, а другое – при которых она принимается.

Критической областью называют совокупность значений критерия, при которых нулевую гипотезу отвергают.


Областью принятия гипотезы (областью допустимых значений) называют совокупность значений критерия, при которых гипотезу принимают.

Основной принцип проверки статистических гипотез можно сформулировать так: если наблюдаемое значение критерия принадлежит критической области – гипотезу отвергают, если области принятия гипотезы – гипотезу принимают.

Так как критерий K – одномерная случайная величина, то все ее возможные значения принадлежат некоторому интервалу и, соответственно, должны существовать точки, разделяющие критическую область и область принятия гипотезы. Такие точки называются критическими точками.

Различают одностороннюю (правостороннюю и левостороннюю) и двустороннюю критические области.

Правосторонней называют критическую область, определяемую неравенством  , где – положительное число.

Левосторонней называют критическую область, определяемую неравенством  , где – отрицательное число.

Двусторонней называют критическую область, определяемую неравенствами  , где . В частности, если критические точки симметричны относительно нуля, двусторонняя критическая область определяется неравенствами или равносильным неравенством . Различия между вариантами критических областей иллюстрирует следующий рисунок.

Резюмируя, сформулируем этапы проверки статистической гипотезы:

Формулируется нулевая гипотеза  ; Определяется критерий K, по значениям которого можно будет принять или отвергнуть и выбирается уровень значимости ; По уровню значимости определяется критическая область; По выборке вычисляется значение критерия K, определяется, принадлежит ли оно критической области и на основании этого принимается или .



  1. Сравнение двух дисперсий нормальных генеральных совокупностей

Пусть имеются две выборки объемов п1 и п2, извлеченные из нормально распределенных генеральных совокупностей Х и Y. Требуется по исправлен-ным выборочным дисперсиям и проверить нулевую гипотезу о равен-стве генеральных дисперсий рассматриваемых генеральных совокупностей:

Ho: D (X) = D (Y).

Критерием служит случайная величина отношение большей исправленной дисперсии к меньшей, которая при условии справедливости нулевой гипотезы имеет распределение Фишера-Снедекора со степенями свободыk1 = n1 – 1 и k2 = n2 – 1. Критическая область зависит от вида конку-рирующей гипотезы:

  1. если H1: D (X) > D (Y), то критическая область правосторонняя:

Критическая точка находится по таблице критических точек распределения Фишера-Снедекора. Если нулевая гипотеза принимается, в противном случае – отвергается.

2) При конкурирующей гипотезе H1: D (X) ≠ D (Y) критическая область двусторонняя: При этом достаточно найти Тогда, если нет оснований отвергнуть нулевую гипотезу, если нулевую гипотезу отвергают.

Пример 6. Даны две независимые выборки объемов п1 = 10 и п2 = 15, извле-ченные из генеральных совокупностей Х и Y, распределенных по нормаль-ному закону. Найдены исправленные выборочные дисперсии и Проверим при уровне значимостиα = 0,05 нулевую гипотезу о равенстве генеральных дисперсий при конкурирующей гипотезе H1: D (X)> D (Y).