Файл: Лекция 1 Основные понятия теории вероятностей.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.01.2024

Просмотров: 33

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


Теорема 2. Дисперсия суммы двух случайных величин равна сумме их дисперсий и удвоенного корреляционного момента этих величин. D [X  Y]  D[X]  D[Y]  2Kxy.

Теорема 3. Математическое ожидание произведения двух случайных величин равна сумме произведения их математических ожиданий и их корреляционного момента. M [XY]  M [X] M [Y]  Kxy.

Теорема 4. Дисперсия произведения независимых центрированных случайных величин равна произведению их дисперсий. D[XY] = D[X]  D[Y].

Лекция 8

Функция случайного аргумента

Распределение функции случайного аргумента

Пусть непрерывная случайная величина X имеет плотность распределения f x . Другая, непрерывная величина Y связала с X функциональной связью y  x . Рассмотрим участок оси абсцисс, на котором лежат все возможные значения величины X. Причем должно выполняться Pa  X  b 1. Пусть зависимость y  x будет монотонно возрастающей.

Лекция 9

Центральная предельная теорема

Неравенство Чебышева

Как уже неоднократно отмечалось, наличие закономерностей в случайных явлениях обусловлено их массовостью. Только при большом количестве опытов или объектов исследования проявляются закономерности в устойчивости некоторых средних характеристик. Например, при большом числе бросков монеты, число выпадения решки к общему числу бросков будет стремиться к значению 0,5. Устойчивость средних характеристик и составляет закон больших чисел. Суть его заключается в следующем: при очень большом числе случайных явлений средний их результат практически перестает быть случайным и может быть предсказан с большой степенью точности. Под законом больших чисел понимают целый ряд теорем, где устанавливается при различных условиях опыта, факт приближения средних характеристик к некоторым постоянным при увеличении числа этих опытов.

Теорема Бернулли. При неограниченном увеличении числа независимых опытов, частота события A сходится по вероятности к его вероятности PA  P в отдельном опыте.

Центральная предельная теорема В законе больших, чисел мы рассматривали предельные значения самих случайных величин. Теперь рассмотрим предельные законы законов распределения случайных величин. Основная идея продельной теоремы состоит в том, что при суммировании достаточно большого числа случайных величин распределение суммы случайных величин стремится к нормальному закону. И чем больше членов в сумме, тем точнее она будет описываться нормальным законом распределения. При этом не играет роли, как распределены сами члены суммы.
Перечислим требования, предъявляемые к сумме случайных величин: вопервых, члены суммы должны быть одного порядка малости (равномерно малыми) и, во-вторых, сумма должна состоять из достаточно большого числа слагаемых n  20 . Отметим, что центральная предельная теорема на самом деле – это целый комплекс теорем для различных условий опыта. Приведем самую простую из них.

Лекция 10

Статистический и вариационный ряд, гистограмма

Задачи математической статистики

Типичные задачи статистики сводятся к следующим:

1 Оценка закона распределения случайной величины X на основе наблюдаемых данных x1, x2, x3, …, xn.

2 Оценка неизвестных параметров известного распределения случайной величины X.

3 Задача о проверке статистических гипотез. Проверяется совместность выдвинутой гипотезы с наблюдаемыми данными. Гипотезы могут быть как о параметрах известного распределения, так и о виде неизвестного распределения. К этим задачам относится и дисперсионный и корреляционный анализ.

Генеральная совокупность объектов и выборка

Генеральной совокупностью называется совокупность значений признака всех изделий (опытов, испытаний) данного типа. Такая совокупность характеризуется числом N изделий (опытов). Выборочной совокупностью или выборкой называют совокупность случайно отобранных изделий из генеральной совокупности. По выборке определяют характеристики самой выборки, которые принимаются в качестве приближенных значений соответствующих значениям характеристик генеральной совокупности. Например, по небольшой партии изделий сделать вывод о качестве всей партии изделий. Выборка должна быть представительной или, как говорят, репрезентативной, то есть правильно отражать все особенности генеральной совокупности. Способы организации выборки делятся на требующие расчленения генеральной совокупности на части и не требующие этого. Выборки бывают повторные (отобранные изделия после проверки возвращаются в генеральную совокупность) и бесповторные.

Вариационный ряд

Простое статистическое распределение. Пусть измеряется случайная величина X. Ее значения наблюдаются: xk – nk. Наблюдаемые значения x1, x2, x3, …, xn называют вариантами. Если варианты расположить в порядке их возрастания, то получим вариационный ряд.



Статистический ряд. Гистограмма.

При большом числе наблюдений простой статистический ряд перестает быть удобной формой записи статистического материала. Он становится громоздким и мало наглядным. Поэтому такой ряд подвергается дополнительной обработке. Обычно данные группируют по признаку их попадания в какие-либо интервалы, разряды. Составляют таблицу, в которой указывают не саму случайную величину, а группу, куда ее те или иные значения входят. Соответственно, указывается относительная частота появления наблюдаемых значений случайной величины, относящихся к этой группе. Совокупность групп, на которые разбиваются результаты наблюдений, и относительных частот результатов наблюдений для каждой группы, называют статистическим рядом. Графическим изображением статистического ряда является гистограмма.

Лекиця 11

Метод моментов и метод наибольшего правдоподобия

Итак, по данным эксперимента имеем n чисел n x1 , x2 , x3 ,… , xn . При условии, что известен закон распределения генеральной совокупности случайной величины X, требуется найти параметры (числовые характеристики) этого закона распределения. Существуют два метода решения этой задачи. Метод моментов и метод наибольшего правдоподобия.

Метод наибольшего правдоподобия

Метод наибольшего правдоподобия , является более общим методом, приводящим всегда к состоятельным оценкам, но, к сожалению, не всегда несмещенным. Итак, пусть закон распределения генеральной совокупности известен. Задана плотность распределения случайной величины f x,a , где a – неизвестный параметр. Требуется на основании опытных данных x1, x2, x3, …,xn определить параметр a. Составим функцию правдоподобия L x1, x2, x3, …, xn; a=P1a P2a Pna, где Pia=Pxi, a) для дискретных случайных величин. Для непрерывных случайных величин L x1, x2, x3, …, xn; a) f(x1, a)*f(x2, a)*…*f(xn, a). Сущность метода правдоподобия заключается в том, что в качестве оценки a выбирают значение, для которого функция правдоподобия экстремальна. Так как 0  P 1 , то находится ее максимальное значение.

Лекция 12

Интервальные оценки

Понятие о доверительном интервале для математического ожидания и дисперсии

Доверительным интервалом называют такой интервал, который покрывает неизвестный параметр a с заданной надежностью B. Доверительной вероятностью называют вероятность того, что доверительный интервал покроит истинное значение a.

Приближенные методы построения доверительного интервала


Рассмотрим приближенный метод построения доверительного интервала для средней наблюдаемых выборки. Для простоты и наглядности сделаем некоторые упрощения. Пусть измерения будут независимыми, равноточными и не иметь кратных значений. По наблюдаемым значениям определяем среднее выборочное и исправленную выборочную дисперсию. Так как Bx есть сумма случайных величин, то ее распределение при достаточно большом количестве изменений, согласно ЦПТ, близко к нормальному.

Построение доверительного интервала для малых выборок

Для точного нахождения доверительного интервала необходимо знать заранее вид закола распределения случайной величины X. Закон распределения оценки a зависит от законов распределения X, а значит и от параметров этих законов и количества изменений (опытов) n. Иногда удается от случайной величины a перейти к другой случайной величине, закон распределения которой, хотя и зависит от законов распределения случайных величин X, однако, не зависит от их параметров. Такие случайные величины наиболее изучены в тех ситуациях, когда случайные величины распределены по нормальному закону.

Лекция 13

Статистическая проверка гипотез

Статистической гипотезой называют гипотезу о виде неизвестного распределения или о параметрах известного распределения. Принцип идеи статистической проверки гипотез можно сформулировать следующим образом. Для того, чтобы ответить на вопрос о правильности или ложности гипотезы, выбирают границы допустимых (толерантных) для нее отклонений. Необходимо назначить такие критические отклонения исследуемого параметра, превышение которых при данной гипотезе было бы настолько маловероятным событием, что его можно считать невозможным.

Ошибки первого и второго рода. Критерии проверки.

В итоге статистической проверки гипотез могут быть приняты два верных решения:

1. гипотезу принимают и она правильная,

2. гипотезу отвергают и она неправильная, ложная.

Кроме того, могут быть приняты два неверных решения:

3. отвергают правильную гипотезу – ошибка I рода,

4. принимают неправильную гипотезу – ошибка II рода

Мощность критерия. Выбор альтернативной гипотезы

Мощностью критерия называют вероятность попадания статистического критерия проверки в критическую область при условии, что конкурирующая гипотеза верна.

Теорема Неймана-Пирсона: Критическая область выбирается таким образом, чтобы мощность критерия была максимальной.


Правило статистической проверки гипотез.

Правило проверки статистических гипотез.

1. Формулируем H0 и H1 .

2. Назначаем уровень значимости .

3. Выбираем статистику критерия K для проверки H0 .

4. Определяем Kнабл по выборке при условии, что H0 верна.

5. В зависимости от H1 определяем критическую область (левую, правую или двухстороннюю).

6. Из таблицы определяем Kкр .

7. Делаем выбор. Если Kнабл  Kкр , то H0 неверна и ее отбрасываем, если же Kнабл  Kкр , то H0 оставляем, как непротиворечивую наблюдаемым данным.

Лекция 14

Критерий согласия Пирсона

Проверка такой гипотезы осуществляется с помощью специально подобранной случайной величины – критерия согласия. Критерием согласия называют статистический критерий проверки гипотезы о предполагаемом законе распределения. Имеется целый ряд критериев согласия – Пирсона, Колмогорова и т.д. Итак, по выборке экспериментальных данных получают статистическую плотность распределения f *x , которая изображается в виде гистограммы. Гипотезу о законе распределения генеральной совокупности выдвигают либо из каких то общих положений о данной случайной величине (например, ошибки измерений всегда распределены по нормальному закону) либо из характера самого распределения f *x . В этом случае получают сглаженную или, как говорят, выровненную теоретическую кривую f x , которая и выдвигается как гипотеза. Затем эту гипотезу проверяют на соответствие экспериментальным данным. Проверка отвечает на вопрос – значимо или случайно различие эмпирических f *x и теоретических частот f x. Критерий согласия Пирсона устанавливает, при принятом уровне значимости а, согласуется или нет гипотеза с данными наблюдениями. Если данные не согласуются, то гипотезу отбрасывают и проверяют другую.

Лекция 15

Элементы теории корреляции

Перейдем к рассмотрению статистической обработки совместных измерений двух случайных величин. Стохастической зависимостью называют зависимость, при которой изменение одной из случайных величин влечет изменение распределения другой случайной величины. Частным случаем стохастической связи является корреляционная связь. Корреляционной зависимостью называют такую зависимость, при которой изменение одной из случайных величин влечет изменение средних значений другой случайной величины.

Корреляционное соотношение

Если f x и фy – линейные функции, то говорят о линейной корреляции. Обе линии регрессии являются прямыми. Если же эти функции нелинейны, то говорят о нелинейной корреляции. Заметим, что в этом случае уже нельзя пользоваться коэффициентом корреляции, так как он определен только для линейной связи. Для исследования нелинейных корреляционных связей необходимо ввести понятие корреляционного соотношения. Основными задачами теории корреляции являются, во-первых,