ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 28.02.2019
Просмотров: 801
Скачиваний: 2
Эмпирической функцией pacпpeдeлeнuя называется относительная частота (частость) того, что признак (случайная величина х) примет значение, меньшее заданного х, т.е.
Другими словами, для данного х эмпирическая функция распределения представляет накопленную частость: .
Вариационный ряд является статистическим аналогом (реализацией) распределения признака (случайной величины Х).
Вариационный ряд содержит достаточно полную информацию об изменчивости (вариации) признака. Однако обилие числовых данных, с помощью которых он задается, усложняет их использование. В то же время на практике часто оказывается достаточным знание лишь сводных характеристик вариационных рядов: средних или характеристик центральной тенденции; характеристик изменчивости (вариации) и др.
Средней арифметической вариационного ряда называется сумма произведений всех вариантов на соответствующие частоты, деленная на сумму частот:
где - варианты дискретного ряда или середины интервалов интервального вариационного ряда; - соответствующие им частоты;m - число неповторяющихся вариантов или число интервалов; .
Очевидно, что , где - частости вариантов или интервалов.
Основные свойства средней арифметической.
1. Средняя арифметическая постоянной равна самой постоянной.
2. Если все варианты увеличить (уменьшить) в одно и то же число раз, то средняя арифметическая увеличится (уменьшится) во столько же раз:
.
3. Если все варианты увеличить (уменьшить) на одно и то же число, то средняя арифметическая увеличится (уменьшится) на то же число:
.
4. Средняя арифметическая отклонений вариантов от средней арифметической равна нулю:
.
5. Средняя арифметическая алгебраической суммы нескольких признаков равна такой же сумме средних арифметических этих признаков:
.
6. Если ряд состоит из нескольких групп, общая средняя равна средней арифметической групповых средних, причем весами являются объемы групп:
где - общая средняя (средняя арифметическая всего ряда); - групповая средняя i-й группы, объем которой равен ;l - число групп.
Дисперсией вариационного ряда называется средняя арифметическая квадратов отклонений вариантов от их средней арифметической:
.
Формулу для дисперсии вариационного ряда можно записать в виде:
где .
Для несгруппированного ряда : .
Дисперсию часто называют эмпирической или выборочной, подчеркивая, что она (в отличие от дисперсии СВ) находится по опытным или статистическим данным.
Вычисление средней арифметической и дисперсии вариационного ряда можно упростить, если использовать не первоначальные варианты (i = 1, 2, ..., m), а новые варианты:
, (1)
где с и k - специально подобранные постоянные.
Согласно свойствам 2 и 3 средней арифметической и дисперсии:
, (2)
, (3)
Откуда
(4)
. (5)
Затем, получим (6)
Теперь, заменяя в (4) и (5) и их выражениями и через варианты , получим
, (7)
, (8)
где определяются по (1).
Формулы (7) и (8) дадут заметное упрощение расчетов, если в качестве постоянной k взять величину (ширину) интервала по x, а в качестве с - середину серединного интервала. Если серединных интервалов два (при четном числе интервалов), то в качестве с рекомендуется взять середину одного из этих интервалов, например, имеющего большую частоту.
6. Генеральная совокупность. Выборки и способы их получения. Репрезентативная выборка.
Генеральная совокупность – это совокупность всех мысленно возможных объектов данного вида, над которыми проводятся наблюдения с целью получения конкретных значений определенной случайной величины.
Генеральная совокупность может быть конечной или бесконечной в зависимости от того, конечна или бесконечна совокупность составляющих ее объектов.
Не следует смешивать понятие генеральной совокупности с реально существующими совокупностями. Например, на склад поступила продукция некоторого цеха за месяц, что является реально существующей совокупностью, которую нельзя назвать генеральной, поскольку выпуск продукции можно мысленно продолжить сколь угодно долго.
Выборкой (выборочной совокупностью) называется совокупность случайно отобранных объектов из генеральной совокупности.
Выборка должна быть репрезентативной (представительной), то есть ее объекты должны достаточно хорошо отражать свойства генеральной совокупности.
Выборка может быть повторной, при которой отобранный объект (перед отбором следующего) возвращается в генеральную совокупность, и бесповторной, при которой отобранный объект не возвращается в генеральную совокупность.
Применяют различные способы получения выборки.
Простой отбор – случайное извлечение объектов из генеральной совокупности с возвратом или без возврата.
2) Типический отбор, когда объекты отбираются не из всей генеральной совокупности, а из ее «типической» части.
3) Серийный отбор – объекты отбираются из генеральной совокупности не по одному, а сериями.
4) Механический отбор - генеральная совокупность «механически» делится на столько частей, сколько объектов должно войти в выборку и из каждой части выбирается один объект.
Число объектов генеральной совокупности и число объектов выборки называют объемами генеральной и выборочной совокупностей соответственно. При этом предполагают, что (значительно больше).
Полученные различными способами отбора данные образуют выборку, обычно это множество чисел, расположенных в беспорядке. По такой выборке трудно выявить какую-либо закономерность их изменения (варьирования).
Для обработки данных используют операцию ранжирования, которая заключается в том, что результаты наблюдений над случайной величиной, то есть наблюдаемые значения случайной величины располагают в порядке возрастания.
Конечной целью изучения выборочной совокупности всегда является получение информации о генеральной совокупности. Для этого выборочное исследование должно удовлетворять определенным условиям. Одно из главных условий — репрезентативность (представительность) выборки. Как обсуждалось ранее, выделяют качественную и количественную репрезентативность.
Случайность, гарантирующая качественную (структурную) репрезентативность статистических исследований, достигается выполнением ряда условий формирования выборочных групп (совокупностей):
1. Каждый член генеральной совокупности должен иметь равную вероятность попасть в выборку.
2. Отбор единиц наблюдения из генеральной совокупности необходимо проводить независимо от изучаемого признака.
3. Отбор должен проводиться из однородных групп.
Соблюдение условий, гарантирующих максимальную близость выборочной и генеральной совокупностей, обеспечивается специальными способами отбора.
7. Точечные статистические оценки неизвестных параметров генеральной совокупности и их свойства: несмещенность, состоятельность, эффективность.
Распределение случайной величины (распределение генеральной совокупности) характеризуется обычно рядом числовых характеристик:
для нормального распределения N(a, σ) — это математическое ожидание a и среднее квадратическое отклонение σ ;
для равномерного распределения R(a,b) — это границы интервала [a;b], в котором наблюдаются значения этой случайной величины.
Такие числовые характеристики, как правило, неизвестные, называются параметрами генеральной совокупности. Оценка параметра — соответствующая числовая характеристика, рассчитанная по выборке. Оценки параметров генеральной совокупности делятся на два класса: точечные и интервальные.
Когда оценка
определяется одним числом, она
называется точечной оценкой. Точечная
оценка, как функция от выборки, является
случайной величиной и меняется от
выборки к выборке при повторном
эксперименте.
К точечным оценкам
предъявляют требования, которым они
должны удовлетворять, чтобы хоть в
каком-то смысле быть «доброкачественными».
Это несмещённость, эффективность и состоятельность.
Интервальные оценки определяются двумя числами – концами интервала, который накрывает оцениваемый параметр. В отличие от точечных оценок, которые не дают представления о том, как далеко от них может находиться оцениваемый параметр, интервальные оценки позволяют установить точность и надёжность оценок.
В качестве точечных оценок математического ожидания, дисперсии и среднего квадратического отклонения используют выборочные характеристики соответственно выборочное среднее, выборочная дисперсия и выборочное среднее квадратическое отклонение.
СВОЙСТВО НЕСМЕЩЕННОСТИ ОЦЕНКИ.
Желательным требованием к оценке является отсутствие систематической ошибки, т.е. при многократном использовании вместо параметра θ его оценки среднее значение ошибки приближения равно нулю — это свойство несмещенности оценки.
Определение. Оценка называется несмещенной, если ее математическое ожидание равно истинному значению оцениваемого параметра:
Выборочное среднее арифметическое является несмещенной оценкой математического ожидания, а выборочная дисперсия — смещенная оценка генеральной дисперсии D. Несмещенной оценкой генеральной дисперсии является оценка
СВОЙСТВО СОСТОЯТЕЛЬНОСТИ ОЦЕНКИ.
Второе требование к оценке — ее состоятельность — означает улучшение оценки с увеличением объема выборки.
Определение. Оценка называется состоятельной, если она сходится по вероятности к оцениваемому параметру θ при n→∞.
Сходимость по
вероятности означает, что при большом
объеме выборки вероятность больших
отклонений оценки от истинного значения
мала.
СВОЙСТВО ЭФФЕКТИВНОЙ ОЦЕНКИ.
Третье требование позволяет выбрать лучшую оценку из нескольких оценок одного и того же параметра.
Определение. Несмещенная оценка является эффективной, если она имеет наименьшую среди всех несмещенных оценок дисперсию.
Это означает, что эффективная оценка обладает минимальным рассеиванием относительно истинного значения параметра. Заметим, что эффективная оценка существует не всегда, но из двух оценок обычно можно выбрать более эффективную, т.е. с меньшей дисперсией. Например, для неизвестного параметра a нормальной генеральной совокупности N(a,σ) в качестве несмещенной оценки можно взять и выборочное среднее арифметическое, и выборочную медиану. Но дисперсия выборочной медианы примерно в 1.6 раза больше, чем дисперсия среднего арифметического. Поэтому более эффективной оценкой является выборочное среднее арифметическое.
8. Метод наибольшего (максимального) правдоподобия, алгоритм нахождения точечной оценки с его помощью.
Существует несколько методов получения точечных оценок. Метод, который чаще приводит к наилучшим оценкам, называется метод максимального правдоподобия (предложен Р. Фишером).
Пусть – непрерывная случайная величина, которая в результате испытаний приняла значения . Пусть вид плотности распределения данной случайной величины известен, но не известен параметр , которым определяется эта функция.
Функция вида:
Называется функцией правдоподобия.
Метод максимального правдоподобия заключается в том, что в качестве оценок параметра принимается то значение , при котором функция принимает максимальное значение. Экстремум функций и достигается при одних и тех же значениях . Удобнее находить максимум функции . Поэтому критические значения определяются из системы уравнений правдоподобия:
Где – число оцениваемых параметров.
Данный метод дает состоятельные оценки. Если существует эффективная оценка, то метод максимального правдоподобия дает эту оценку. Оценки максимального правдоподобия асимптотически эффективны и имеют асимптотически нормальное распределение.
Пример: Найти методом наибольшего правдоподобия оценку параметра λ показательного распределения:
Если в результате испытаний случайная величина распределенная по показательному закону, приняла значения .
Решение:
Составим функцию правдоподобия, учитывая, что :
Отсюда следует:
Логарифмическая функция правдоподобия:
Найдем первую производную по переменной λ:
Напишем уравнение правдоподобия, для чего приравняем первую производную нулю:
Отсюда критическая точка равна:
Найдем вторую производную по λ:
При вторая производная отрицательна, следовательно, является точкой максимума. Значит, в качестве оценки наибольшего правдоподобия параметра показательного распределения надо принять величину, обратную выборочной средней: .
9. Выборочная средняя как точечная оценка генеральной средней, ее несмещенность и состоятельность.
Статистической оценкой или статистикой характеристики (параметра) генеральной совокупности называют приближенное значение искомой характеристики (параметра), полученное по данным выборки.
В статистике используются два вида оценок - точечные и интервальные.
Точечной статистической оценкой параметра генеральной совокупности называется конкретное числовое значение искомой характеристики.
Качество статистических оценок определяется следующими их свойствами:
• Состоятельность
Оценка считается состоятельной, если при неограниченном увеличении объема выборки [ n >» (N)], ее ошибка стремится к 0:
lim(c? - а) = 0, т. к. при n t lim а = а ;
n—>» n—>»
где а - значение характеристики генеральной совокупности; а - значение характеристики выборки; а -а - ошибка выборки. •
Несмещенность
Оценка считается несмещенной, если при данном объеме выборки n математическое ожидание ошибки равно 0.Для несмещенной оценки ее математическое ожидание точно равно математическому ожиданию характеристики выборки:
M[а - а] = 0 или M[а] = M[а].
Несмещенная оценка не всегда дает хорошее приближение оцениваемого параметра, так как возможные значения получаемой оценки могут быть сильно рассеяны вокруг своего среднего значения. Поэтому оценка должна соответствовать еще одному требованию - эффективности. •
Генеральная средняя и выборочная средняя
Пусть задана дискретная случайная величина Х в виде генеральной совокупности. Генеральной средней называют среднее арифметическое значений признака генеральной совокупности:
|
. |
(6.2) |
где xi – варианта генеральной совокупности, ni – частота варианты xi,
.
N– все возможные значения частот дискретной случайной величины Х.