Файл: Случайные события и предмет теории вероятностей.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 07.12.2023

Просмотров: 142

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

39. Двухвыборочный F-тест для дисперсий.

В математической статистике доказывается, что если гипотеза о равенстве дисперсий двух случайных величин выполняется: H0=, то величина   распределена в соответствии с законом распределения Фишера.

Это отношение F называют дисперсионным отношением Фишера и используют в качестве критерия проверки нулевой гипотезы.

Распределение Фишера характеризуется наличием степеней свободы, которые вычисляются по формулам:



Поскольку величина F - неотрицательная, то критическая область данной величины будет принадлежать интервалу (0;+).

Альтернативными гипотезами являются гипотезы:

Н1: > при >

Н1: < при <

Последовательность проверки гипотезы:

  1. Производится расчёт F-статистики Фишера.

  2. Задаёмся уровнем значимости, который находится в пределах от 0,01 до 0,05.

  3. Вычисляется число степеней свободы: df1 , df2 .

  4. Находим критическое значение Fкрравное F ,df1,df2, используя таблицы, либо с помощью функции FРАСПОБР.

  5. Сравниваем рассчитанное значение значения F-статистики и критическое: если Fрасч >Fкр , то гипотеза отвергается.


40. Парный двухвыборочный t-тест для средних значений.

Парный двухвыборочный t-тест для средних значений позволяет оценить разность между математическими ожиданиями двух генеральных совокупностей, связанных между собой, когда показатели первой группы зависят от показателей другой. Использование этого теста часто применяются для того, чтобы обнаружить результат какого-либо воздействия или, наоборот, доказать отсутствие этого воздействия. Чем более однородными окажутся выбранные для эксперимента объекты, чем меньше их различия, тем точнее будет ответ на вопрос о том, имеет ли место какое либо воздействие на результат или нет.


Различия между объектами, выбранными для обнаружения воздействия некоторого фактора на результат, будет меньше, если для воздействия и контроля выступает один и тот же объект.

Пусть хi и уi - результаты измерения для объекта i, где 1£ i£ n, тогда совокупность случайных величин: {(х11), …, (хn,yn)} образует парные данные. Все наблюдения считаются реализациями случайных величин X, Y. При этом предполагается, что для двух разных объектов они независимы. Однако наблюдения, входящие в одну пару нельзя считать независимыми, т.к. они относятся к одному объекту и, следовательно, они отражают свойства общего объекта и могут зависеть друг от друга. Поэтому, для того, чтобы характеризовать пару наблюдений (хi , уi )вводится новая случайная переменная  . Эту переменную можно считать независимой и нормально распределённой случайной величиной.

Таким образом, задача о парных данных сводится к задаче об одной нормальной выборке при неизвестной дисперсии  .

При неизвестной дисперсии  гипотеза выглядит следующим образом:

Н0: md=a0 , где md = mx – my –это математическое ожидание случайной величины d, a0 –заранее заданное число - гипотетическая разность, равная в данном случае нулю.

Для проверки этой гипотезы используется t-критерий, который вычисляется по формуле:

,

где

.

t-критерий имеет распределение Стьюдента с числом степеней свободы df=n-1.

Для проверки гипотезы о различиях между средними используется инструмент анализа «Парный двухвыборочный t-тест для средних» на основе парных выборочных данных. При этом равенства дисперсий генеральных совокупностей не предполагается. В диалоговом окне задаются интервалы переменной 1 и переменной 2, гипотетическая разность, равная нулю.

Если дисперсия случайной величины D известна, то можно использовать аналог z – критерия



который имеет нормальное распределение.
41. Однофакторный дисперсионный анализ.
Простейшим случаем дисперсионного анализа является одномерный однофакторный анализ для двух или нескольких независимых групп, когда все группы объединены по одному признаку. В ходе анализа проверяется 

нулевая гипотеза о равенстве средних. При анализе двух групп дисперсионный анализ тождественен двух выборочному t-критерию Стьюдента для независимых выборок, и величина F-статистики равна квадрату соответствующей t-статистики.

Для подтверждения положения о равенстве дисперсий обычно применяется критерий Ливена (Levene’s test). В случае отвержения гипотезы о равенстве дисперсий основной анализ неприменим. Если дисперсии равны, то для оценки соотношения межгрупповой и внутригрупповой изменчивости применяется F-критерий Фишера:

{\displaystyle F_{df_{\textrm {bg}},df_{\textrm {wg}}}={\frac {MS_{\textrm {bg}}}{MS_{\textrm {wg}}}}.}

Если F-статистика превышает критическое значение, то нулевая гипотеза не может быть принята (отвергается) и делается вывод о неравенстве средних. При анализе средних двух групп результаты могут быть интерпретированы непосредственно после применения критерия Фишера.

При наличии трёх и более групп требуется попарное сравнение средних для выявления статистически значимых отличий между ними. Априорный анализ включает метод контрастов, при котором межгрупповая сумма квадратов дробится на суммы квадратов отдельных контрастов:{\displaystyle SS_{\textrm {bg}}=SS_{\psi _{1}}+SS_{\psi _{2}}+…+SS_{\psi _{n}},}



где  {\displaystyle \psi } есть контраст между средними двух групп, и затем при помощи критерия Фишера проверяется соотношение среднего квадрата для каждого контраста к внутригрупповому среднему квадрату:

{\displaystyle F_{1,df_{\textrm {wg}}}={\frac {MS_{\psi _{i}}}{MS_{\textrm {wg}}}}.}

Апостериорный анализ включает post-hoc t-критерии по методам Бонферрони или Шеффе, а также сравнение разностей средних по методу Тьюки. Особенностью post-hoc-тестов является использование внутригруппового среднего квадрата {\displaystyle MS_{\textrm {wg}}}  для оценки любых пар средних. Тесты по методам Бонферрони и Шеффе являются наиболее консервативными, так как они используют наименьшую критическую область при заданном 
уровне значимости {\displaystyle \alpha }

Помимо оценки средних дисперсионный анализ включает определение коэффициента детерминации {\displaystyle R^{2}} , показывающего, какую долю общей изменчивости объясняет данный фактор:
42. Выявление отличающихся друг от друга групп с помощью процедура Тьюки – Крамера

Этот метод является примером процедур апостериорного сравнения (post hoc comparison), поскольку проверяемая гипотеза формулируется после анализа данных. Процедура Тьюки-Крамера позволяет одновременно сравнить все пары групп. На первом этапе вычисляются разности Xj– Xj’, где j ≠j’, между математическими ожиданиями с(с – 1)/2 групп. Критический размах процедуры Тьюки-Крамера вычисляется по формуле:



где QU — верхнее критическое значение распределения стьюдентизированного размаха, имеющего с степеней свободы в числителе и n– с степеней свободы в знаменателе.

Если объемы выборок не одинаковы, критический размах вычисляется для каждой пары математических ожиданий отдельно. На последнем этапе каждая из с(с – 1)/2 пар математических ожиданий сравнивается с соответствующим критическим размахом. Элементы пары считаются значимо различными, если модуль разности |Xj– Xj’| между ними превышает критический размах.

43. Проверка равенства дисперсий с помощью модифицированного критерия Левенэ.

Несмотря на то что F-критерий относительно устойчив к нарушениям условия о равенстве дисперсий в группах, грубое нарушение этого предположения существенно влияет на уровень значимости и мощность критерия. Возможно, одним из наиболее мощных является критерий Левенэ. Для проверки равенства дисперсий с генеральных совокупностей проверим следующие гипотезы:

Н0: σ12= σ22= … = σj2


Н1: не все σj2одинаковы (j = 1, 2, …, с)

Модифицированный критерий Левенэ основан на утверждении, что если изменчивость в группах одинакова, для проверки нулевой гипотезы о равенстве дисперсий можно применить анализ дисперсии абсолютных величин разностей между наблюдениями и медианами групп. Итак, сначала следует вычислить абсолютные величины разностей между наблюдениями и медианами в каждой группе, а затем выполнить однофакторный дисперсионный анализ полученных абсолютных величин разностей.
44. Двухфакторный дисперсионный анализ без повторений и с повторениями

Двухфакторный дисперсионный анализ без повторений:

Двухфакторный дисперсионный анализ применяется для того, чтобы проверить возможную зависимость результативного признака от двух факторов - A и B. Тогда a - число градаций фактора A и b - число градаций фактора B. В статистическом комплексе сумма квадратов остатков разделяется на три компоненты:

SS = SSa + SSb + SSe,

где

 - общая сумма квадратов отклонений,

 - объяснённая влиянием фактора A сумма квадратов отклонений,

 - объяснённая влиянием фактора B сумма квадратов отклонений,

 - необъяснённая сумма квадратов отклонений или сумма квадратов отклонений ошибки,

 - общее среднее наблюдений,

 - среднее наблюдений в каждой градации фактора A,