ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 28.02.2019
Просмотров: 799
Скачиваний: 2
Решение.
Найдем значение Критическая область – правосто-
ронняя. Вычислим наблюдаемое значение критерия:
Следовательно, нет оснований отвергнуть нулевую гипотезу.
16. Сравнение исправленной выборочной дисперсии с гипотетической дисперсией нормальной совокупности (распределение «хи-квадрат»).
Пусть генеральная совокупность распределена нормально, причем генеральная дисперсия хотя и неизвестна, но имеются основания предполагать, что она равна гипотетическому (предполагаемому) значению σ20. На практике σ20 устанавливается на основании предшествующего опыта или теоретически.
Пусть из генеральной совокупности извлечена выборка объема n и по ней найдена исправленная выборочная дисперсия S2 с k=n—1 степенями свободы. Требуется по исправленной дисперсии при заданном уровне значимости проверить нулевую гипотезу, состоящую в том, что генеральная дисперсия рассматриваемой совокупности равна гипотетическому значению σ20.
Учитывая, что S2 является несмещенной оценкой генеральной дисперсии, нулевую гипотезу можно записать так:
H0:М(S2)= σ20.
Итак, требуется проверить, что математическое ожидание исправленной дисперсии равно гипотетическому значению генеральной дисперсии. Другими словами, требуется установить, значимо или незначимо различаются исправленная выборочная и гипотетическая генеральная дисперсии.
На практике рассматриваемая гипотеза проверяется, если нужно проверить точность приборов, инструментов, станков, методов исследования и устойчивость технологических процессов. Например, если известна допустимая характеристика рассеяния контролируемого размера деталей, изготавливаемых станком-автоматом, равная σ20, а найденная по выборке окажется значимо больше σ20, то станок требует подналадки.
В качестве критерия проверки нулевой гипотезы примем случайную величину (n—1)S2/ σ20. Эта величина случайная, потому что в разных опытах S2 принимает различные, наперед неизвестные значения. Поскольку можно доказать, что она имеет распределение χ2 с k=n—1 степенями свободы (см. гл. XII, § 13), обозначим ее через χ2.
Итак, критерий проверки нулевой гипотезы
Χ2=(n - 1)S2/ σ20.
Критическая область строится в зависимости от вида конкурирующей гипотезы.
Первый случай. Нулевая гипотеза Н0: σ2 = σ20. Конкурирующая гипотеза Н1: σ2 > σ20.
В этом случае строят правостороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости:
Р[χ2> χ2кр(α,k)]=α.
Критическую точку χ2кр(α,k) находят по таблице критических точек распределения χ2 (см. приложение 5), и тогда правосторонняя критическая область определяется неравенством χ2 > χ2кр, а область принятия нулевой гипотезы — неравенством χ2 < χ2кр.
Обозначим значение критерия, вычисленное по данным наблюдений, через χ2набл и сформулируем правило проверки нулевой гипотезы.
Правило 1. Для того чтобы при заданном уровне значимости α проверить нулевую гипотезу Н0: σ2 = σ20 о равенстве неизвестной генеральной дисперсии нормальной совокупности гипотетическому значению при конкурирующей гипотезе Н1: σ2 > σ20, надо вычислить наблюдаемое значение критерия χ2набл=(n - 1)S2/ σ20 и по таблице критических точек распределения χ2, по заданному уровню значимости α и числу степеней свободы k = n—1 найти критическую точку χ2кр(α,k).
Если χ2набл < χ2кр —нет оснований отвергнуть нулевую гипотезу. Если χ2набл > χ2кр —нулевую гипотезу отвергают.
Пример 1. Из нормальной генеральной совокупности извлечена выборка объема n=13 и по ней найдена исправленная выборочная дисперсия s2= 14,6. Требуется при уровне значимости 0,01 проверить нулевую гипотезу Н0: σ2 = σ20 = 12, приняв в качестве конкурирующей гипотезы Н1: σ2 > 12.
Решение. Найдем наблюденное значение критерия:
χ2набл=(n - 1)S2/ σ20 = ((13-1)·14,6)/12=14,6.
По условию, конкурирующая гипотеза имеет видσ2 > 12, поэтому критическая область правосторонняя.
По таблице приложения 5, по уровню значимости 0,01 и числу степеней свободы k = n— 1 == 13— 1 == 12 находим критическую точку χ2кр (0,01; 12) =26,2.
Так как χ2набл < χ2кр —нет оснований отвергнуть нулевую гипотезу. Другими словами, различие между исправленной дисперсией (14,6) и гипотетической генеральной дисперсией (12) — незначимое.
Второй случай. Нулевая гипотеза Н0: σ2 = σ20. Конкурирующая гипотеза Н1: σ2 ≠ σ20.
В этом случае строят двустороннюю критическую область, исходя из требования, чтобы вероятность попадания критерия в эту область в предположении справедливости нулевой гипотезы была равна принятому уровню значимости α.
Критические точки—левую и правую границы критической области—находят, требуя, чтобы вероятность попадания критерия в каждой из двух интервалов критической области была равна α/2:
P[ χ2 < χ2лев.кр(α/2,k) ]=α/2,
P[ χ2 > χ2лев.кр(α/2,k) ]=α/2.
В таблице критических точек распределения χ2 указаны лишь «правые» критические точки, поэтому возникает кажущееся затруднение в отыскании «левой» критической точки. Это затруднение легко преодолеть, если принять во внимание, что события χ2 < χ2лев.кр и χ2 > χ2лев.кр противоположны и, следовательно, сумма их вероятностей равна единице:
Р (χ2 < χ2лев.кр) + Р (χ2 > χ2лев.кр) =1.
Отсюда
Р (χ2 < χ2лев.кр) =1- Р (χ2 > χ2лев.кр) =1-(α/2).
Мы видим, что левую критическую точку можно искать как правую (и значит, ее можно найти по таблице), исходя из требования, чтобы вероятность попадания критерия в интервал, расположенный правее этой точки, была равна 1—(α/2).
Правило 2. Для того чтобы при заданном уровне значимости а проверить нулевую гипотезу о равенстве неизвестной генеральной дисперсии σ2 нормальной совокупности гипотетическому значению σ20 при конкурирующей гипотезе Н1: σ2 ≠ σ20 надо вычислить наблюдаемое значение критерия χ2набл=(n - 1)S2/ σ20 и по таблице найти левую критическую точку χ2кр (1—α/2; k) и правую критическую точку χ2кр (α/2;k).
Если χ2лев.кр < χ2набл < χ2прав.кр — нет оснований отвергнуть нулевую гипотезу.
Если χ2набл < χ2лев.кр или χ2набл > χ2прав.кр — нулевую гипотезу отвергают.
Пример 2. Из нормальной генеральной совокупности извлечена выборка объема n=13 и по ней найдена исправленная выборочная дисперсия s2=10,3. Требуется при уровне значимости 0,02 проверить нулевую гипотезу Н0: σ2 = σ20 = 12, приняв в качестве конкурирующей гипотезы Н1: σ2 ≠ 12.
Решение. Найдем наблюдавшееся значение критерия:
χ2набл=(n - 1)S2/ σ20 = ((13-1)·10,3)/12= 10,3.
Так как конкурирующая гипотеза имеет вид σ2 ≠ 12, то критическая область — двусторонняя.
По таблице приложения 5 находим критические точки: левую — χ2кр (1—α/2; k) = χ2кр (1-0,02/2; 12) = χ2кр (0,99; 12) =3,57 и правую - χ2кр (α/2; k) = χ2кр (0,01; 12)=26,2. Так как наблюдавшееся значение критерия принадлежит области принятия гипотезы (3,57 < 10,3 < 26,2)—нет оснований ее отвергнуть. Другими словами, исправленная выборочная дисперсия (10,3) незначимо отличается от гипотетической генеральной дисперсии (12).
Третий случай. Конкурирующая гипотеза Н1: σ2 < σ20.
Правило 3. При конкурирующей гипотезе Н1: σ2 < σ20 находят критическую точку χ2кр (1—α; k).
Если χ2набл > χ2кр (1—α; k)—нет оснований отвергнуть нулевую гипотезу.
Если χ2набл < χ2кр (1—α; k)—нулевую гипотезу отвергают.
Замечание 1. В случае, если найдена выборочная дисперсия Dв, в качестве критерия принимают случайную величину χ2 =Dв/ σ20, которая имеет распределение χ2 с k=n—1 степенями свободы, либо переходят к s2 = [n/(n— 1)] Dв.
Замечание 2. Если число степеней свободы k > 30, то критическую точку можно найти приближенно по равенству Уилсона – Гилферти
.
где zα определяют, используя функцию Лапласа (см. приложение 2), по равенству Ф(zα)=(1—2α)/2.
17. Сравнение двух средних нормальных генеральных совокупностей, дисперсии которых неизвестны и одинаковы.
Пусть Х и Y – распределены нормально, дисперсии неизвестны, но есть основания предполагать, что D(X)=D(Y).
( можно проверить гипотезу о равенстве дисперсий по критерию Фишера- Снедекора)
Критерий имеет t-распределение Стьюдента с k=n+m-2 степенями свободы; и - направленные дисперсии.
Правило 1. : - основная гипотеза,
: - конкурирующая гипотеза.
Критическая область – двусторонняя.
t(α;k) – правая граница критической области;
-t(α;k) – левая граница критической области. (здесь α – уровень значимости; k=m+m-2 – степень свободы)
Если - принимаем основную гипотезу
Если - отвергаем основную гипотезу
Правило 2. : - основная гипотеза,
: - конкурирующая гипотеза.
Критическая область – правосторонняя.
Если - принимаем основную гипотезу
Если - отвергаем основную гипотезу
Правило 3. : - основная гипотеза,
: конкурирующая гипотеза.
Критическая область- левосторонняя.
Если - принимаем основную гипотезу
Если - отвергаем основную гипотезу .
18. Функциональная, статистическая и корреляционная зависимости. Различия между ними. Основные задачи теории корреляции.
Функциональная зависимость (связь), когда каждому значению одной переменной соответствует вполне определенное значение другой.
Функциональная зависимость может иметь место как между детерминированными (неслучайными) переменными, так и между случайными величинами.
Статистическая (или стохастическая, вероятностная) зависимость - каждому значению одной переменной соответствует определенное (условное) распределение другой переменной.
Т.е. когда каждому значению одной переменной соответствует не какое-то определенное, а множество возможных значений другой переменной.
Возникновение понятия статистической связи обусловливается тем, что зависимая переменная подвержена влиянию ряда неконтролируемых или неучтенных факторов, а также тем, что измерение значений переменных неизбежно сопровождается некоторыми случайными ошибками.
В силу неоднозначности статистической зависимости между Y и Х для исследователя, в частности, представляет интерес усредненная по х схема зависимости, т.е. закономерность в изменении среднего значения - условного математического ожидания (математического ожидания случайной переменнойY, вычисленного в предположении, что переменная Х приняла значение х) в зависимости от х.
Определение. Статистическая зависимость между 2мя переменными, при которой каждому значению 1 переменной соответствует определенное условное математическое ожидание (среднее значение) другой, называется корреляционной.
Иначе, корреляционной зависимостью между двумя переменными величинами называется функциональная зависимость между значениями одной из них и условным математическим ожиданием другой.
Корреляционная зависимость м.б. представлена в виде:
(1)
(2)
Предполагается, что и , т.е. если при изменении х или у условные математические ожидания и не изменяются, то говорят, что корреляционная зависимость между переменными Х иY отсутствует.
Сравнивая различные виды зависимости между Х и Y, можно сказать, что с изменением значений переменной Х при функциональной зависимостиоднозначно изменяется определенное значение переменной Y, при корреляционной - определенное среднее значение (условное математическое ожидание) Y, а при статистической - определенное (условное) распределение переменной Y. Т.о., из рассмотренных зависимостей наиболее общей выступает статистическая зависимость. Каждая корреляционная зависимость является статистической, но не каждая статистическая зависимость является корреляционной. Функциональная зависимость представляет частный случай корреляционной.
Уравнения (1) и (1) называются модельными уравнениями регрессии (или просто уравнениями регрессии) соответственно Y по Х и Х по Y, функции и -модельными функциями регрессии (или функциями регрессии), а их графики - модельными линиями регрессии (или линиями регрессии).
19. Линейная парная регрессия. Система нормальных уравнений для определения параметров прямых регрессий. Выборочная ковариация.
20. Оценка тесноты связи. Выборочный коэффициент корреляции и его свойства.
При изучении корреляционных зависимостей возникает необходимость в измерении тесноты связи. Тесноту связи удобно оценивать в единицах общей дисперсии. Эта величина называется теоретическим корреляционным отношением.
Перед тем как начать исследование формы связи, когда вид зависимости еще не установлен, а коэффициенты регрессии не вычислены, необходимо убедиться в наличии какой бы то ни было связи между переменными. Ибо может оказаться, что связь не существенна и вычисление коэффициентов регрессии не оправдано и проведено в пустую. Для обнаружения связи вычисляется эмпирическое корреляционное отношение.
В отличие от теоретического корреляционного отношения, при выводе формулы эмпирического отношения пользуются эмпирической линией регрессии и оценками дисперсии s2.
Эмпирическое корреляционное отношение систематически завышает тесноту связи и тем сильнее, чем меньше число наблюдений. Поэтому эмпирическое корреляционное отношение рекомендуется использовать для предварительной оценки тесноты связи, для окончательной же оценки используется теоретическое корреляционное отношение.
Выборочным коэффициентом корреляции называется величина:
r = [(xy)/n-xсрyср]/(xy) (7.3.1)
(м. б. еще дать через центральные моменты?)
Коэффициент корреляции есть частный случай теоретического корреляционного отношения, а именно, случай линейной связи между переменными X и Y. Поэтому коэффициент корреляции можно рассматривать как показатель тесноты связи только тогда, когда зависимость между X и Y линейна.
Коэффициент корреляции принимает значения в интервале от –1 до +1.
Если коэффициент корреляции положительный, то связь между переменными положительная. Это значит, что с ростом значений x увеличивается y.
Коэффициент корреляции не зависит от выбора начала отсчета и единицы измерения, т. е. переменные x и y можно уменьшать или увеличивать в араз, можно также вычитать или прибавлять к значениям переменных одно и то же число b. От этих операций значение коэффициента корреляции не изменится.
В целом коэффициент корреляции есть мера близости статистической связи между случайными величинами к линейной функциональной зависимости. Значение коэффициента корреляции показывает, насколько зависимость между случайными переменными близка к линейной функциональной.