ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 28.02.2019
Просмотров: 798
Скачиваний: 2
1. Понятие двумерной (n-мерной) случайной величины. Примеры.
Одномерные распределения ее составляющих. Условные распределения.
Зачастую результат опыта описывается несколькими случайными величинами: . Например, погоду в данном месте в определенное время суток можно охарактеризовать следующими случайными величинами: Х1 – температура, Х2 – давление, Х3 – влажность воздуха, Х4 – скорость ветра. Рассмотрим двумерную случайную величину , возможные значения которой есть пары чисел . Геометрически двумерную случайную величину можно истолковать как случайную точку на плоскости .
Пример 1. Найти законы распределения составляющих Х и Y, если задано распределение двумерной случайной величины в виде таблицы
Y X |
2 |
5 |
7 |
-1 |
0,11 |
0,13 |
0,23 |
3 |
0,1 |
0,12 |
0,09 |
4 |
0,11 |
0,08 |
0,03 |
Решение. Так как
-1 |
3 |
4 |
0,47 |
0,31 |
0,22 |
Аналогично суммируя по столбцам, получим распределение Y:
2 |
5 |
7 |
0,32 |
0,33 |
0,35 |
Если зафиксировать значение одного из аргументов, например , то полученное распределение величины Х называется условным распределением. Аналогично определяется условное распределение Y.
Пример 2. По распределению двумерной случайной величины, заданной табл., найти: а) условный закон распределения составляющей Х при условии ; б) условный закон распределения Y при условии, что .
Решение. Условные вероятности составляющих Х и Y вычисляются по формулам
, .
Тогда
а) , ,
.
Условный закон распределения Х при условии имеет вид
-1 |
3 |
4 |
0,394 |
0,364 |
0,242 |
Контроль: .
б) Аналогично находим условный закон Y при условии .
2 |
5 |
7 |
0,5 |
0,364 |
0,136 |
Контроль: .
2. Функция распределения и плотность вероятности 2-мерной случайной величины, их свойства, примеры.
Двумерной случайной величиной называется функция вероятного события, наступившего в результате принятия величинами х и y случайных значений.
где
X и Y случайные величины, которые могут быть как дискретными, так и непрерывными.
Для дискретной случайной величины функция распределения имеет следующий вид:
где вероятность суммируется для всех xi < x и yi < y.
Свойства функции распределения двумерной случайной величины.
1.Функция 0 ≤ F(x,y) ≤ 1, т.е. величина неотрицательная меньше 1.
2.Функция F(x,y) есть возрастающая функция по каждому из аргументов.
3.Функция распределения F(x,y) = 0, если хотя бы один из аргументов x или y стремится к минус бесконечности.
4.Функция F(x,y) равна функции от одного аргумента F(x) (F(y)), если y (x) стремится к бесконечности.
5. Функция F(x,y) равна 1, если оба аргумента стремятся к плюс бесконечности.
3.Числовые характеристики 2-мерной случайной величины и свойства этих характеристик. Примеры.
Рассмотрим числовые характеристики двумерных случайных величин и их свойства.
Пусть (x , h ) - двумерная случайная величина, тогда M(x , h )=(M(x ), M(h )), т.е. математическое ожидание случайного вектора - это вектор из математических ожиданий компонент вектора.
Если (x , h ) - дискретный случайный вектор с распределением
|
y1 |
y2 |
... |
ym |
x1 |
p11 |
p12 |
... |
p1m |
x2 |
p12 |
p12 |
... |
p2m |
... |
... |
... |
pij |
... |
xn |
pn1 |
pn2 |
... |
pnm |
то математические ожидания компонент вычисляются по формулам:
, .
Эти формулы можно записать в сокращенном виде.
Обозначим и , тогда и .
Если p(x , h )(x, y)- совместная плотность распределения непрерывной двумерной случайной величины (x , h ), то
и .
Поскольку -плотность распределения случайной величины x , то и, аналогично, .
-
Дисперсия
Приведем формулы для вычисления дисперсии компонент двумерного случайного вектора.
Если (x , h ) - двумерная случайная величина, то
Dx = M(x - Mx )2 = Mx 2 - M(x )2, Dh = M(h - Mh )2 = Mh 2 - M(h )2.
Входящие в эту формулу математические ожидания вычисляются по приведенным выше формулам.
Между случайными величинами может существовать функциональная зависимость. Например, если x - случайная величина и h =x 2, то h - тоже случайная величина, связанная с x функциональной зависимостью. В то же время между случайными величинами может существовать зависимость другого рода, называемая стохастической.
Математическое ожидание, вычисленное по условному распределению, называется условным математическим ожиданием.
Для двумерного дискретного случайного вектора (x , h ) с распределением
|
y1 |
y2 |
... |
ym |
x1 |
p11 |
p12 |
... |
p1m |
x2 |
p12 |
p12 |
... |
p2m |
... |
... |
... |
pij |
... |
xn |
pn1 |
pn2 |
... |
pnm |
условное математическое ожидание случайной величины x при условии, что случайная величина hпринимает значение yj, вычисляется по формуле .
Аналогично, условное математическое ожидание случайной величины h при условии, что случайная величина x принимает значение xi, равно .
Видно, что условное математическое ожидание случайной величины x является функцией значений случайной величины h , т.е. M(x /h = y) = f1(y) и, совершенно аналогично, M(h /x = x) = f2(x).
Функцию f1(y) называют регрессией случайной величины x на случайную величину h , а f2(x) - регрессией случайной величины h на случайную величину x .
Если p(x ,h )(x, y) совместная плотность вероятностей двумерной случайной величины (x ,h ), то
и .
-
Ковариация
Если между случайными величинами x и h существует стохастическая связь, то одним из параметров, характеризующих меру этой связи является ковариация cov(x , h ). Ковариацию вычисляют по формулам cov(x , h )=M[(x - Mx )(h - Mh )] = M(x h) - Mx Mh .
Если случайные величины x и h независимы, то cov(x ,h )=0.
Свойства ковариации:
cov(x , x ) = Dx ;
;
;
,
где C1 и C2 - произвольные константы.
Ковариационной матрицей случайного вектора (x ,h ) называется матрица вида
.
Эта матрица симметрична и положительно определена. Ее определитель называется обобщенной дисперсией и может служить мерой рассеяния системы случайных величин (x ,h ).
Как уже отмечалось ранее, дисперсия суммы независимых случайных величин равна сумме их дисперсий: . Если же случайные величины зависимы, то .
Понятно, что значение ковариации зависит не только от “тесноты” связи случайных величин, но и от самих значений этих величин, например, от единиц измерения этих значений. Для исключения этой зависимости вместо ковариации используется безразмерный коэффициент корреляции .
Этот коэффициент обладает следующими свойствами:
- он безразмерен;
- его модуль не превосходит единицы, т.е. ;
если x и h независимы, то k(x ,h )=0 (обратное неверно!);
если , то случайные величины x и h связаны функциональной зависимостью вида h = ax +b, где a и b- некоторые числовые коэффициенты;
;
Корреляционной матрицей случайного вектора называется матрица
.
Если и , то ковариационная и корреляционная матрицы случайного вектора (x ,h ) связаны соотношением , где .
4. Зависимые и независимые случайные величины. Ковариация и коэффициент корреляции случайных величин. Связь между некоррелированностью и независимостью случайных величин.
Случайные величины называются независимыми, если закон распределения одной из них не зависит от того какое значение принимает другая случайная величина.
Условные распределения независимых случайных величин равны их безусловным распределениям.
Теорема. Для того, чтобы случайные величины Х и Y были независимы, необходимо и достаточно, чтобы функция распределения системы (X, Y) была равна произведению функций распределения составляющих.
Аналогичную теорему можно сформулировать и для плотности распределения:
Теорема. Для того, чтобы случайные величины Х и Y были независимы, необходимо и достаточно, чтобы плотность совместного распределения системы (X, Y) была равна произведению плотностей распределения составляющих.
Пусть имеется двумерная СВ (Х,Y), распределение которой известно, т.е. известна табл. 5.1 или совместная плотность вероятности . Тогда можно найти математические ожидания М(Х) = ах, М(Y) = ау и дисперсии и одномерных составляющих Х иY. Однако математические ожидания и дисперсии случайных величин Х и Y недостаточно полно характеризуют двумерную случайную величину (Х,Y), т.к. не выражают степени зависимости ее составляющих Х и Y эту роль выполняют ковариация и коэффициент корреляции.
Определение. Ковариацией (или корреляционным моментом) Кху случайных величин Х и Y называется математическое ожидание произведения отклонений этих величин от своих математических ожиданий, т.е.
, Или ,
Где , .
Из определения следует, что . Кроме того, .
т.е. ковариация СВ с самой собой есть ее дисперсия.
Для дискретных случайных величин:
.
Для непрерывных случайных величин:
.
Ковариация двух случайных величин характеризует как степень зависимости случайных величин, так и их рассеяние вокруг точки . Об этом, в частности, свидетельствуютсвойства ковариации случайных величин.
-
Ковариация двух независимых случайных величин равна нулю.
-
Ковариация двух случайных величин равна математическому ожиданию их произведения минус произведение математических ожиданий, т.е. , или .
-
Ковариация двух случайных величин по абсолютной величине не превосходит произведения их средних квадратических отклонений, т.е. .
Ковариация, как уже отмечено, характеризует не только степень зависимости двух случайных величин, но и их разброс, рассеяние. Кроме того, она - величина размерная, ее размерность определяется произведением размерностей случайных величин. Это затрудняет использование ковариации для оценки степени зависимости для различных случайных величин. Этих недостатков лишен коэффициент корреляции.
Определение. Коэффициентом корреляции двух случайных величин называется отношение их ковариации к произведению средних квадратических отклонений этих величин:
.
Из определения следует, что . Очевидно также, что коэффициент корреляции естьбезразмерная величина.
Свойства коэффициента корреляции:
-
Коэффициент корреляции принимает значения на отрезке [-1;1], т.е. .
-
Если случайные величины независимы, то их коэффициент корреляции равен нулю, т.е. .
Случайные величины называются некоррелированными, если их коэффициент корреляции равен нулю. Т.о., из независимости случайных величин следует их некоррелированность. Обратное утверждение, вообще говоря, неверно: из некоррелированности двух случайных величин еще не следует их независимость.
-
Если коэффициент корреляции двух случайных величин равен (по абсолютной величине) единице, то между этими случайными величинами существует линейная функциональная зависимость.
Закон распределения дискретной с.в.задан таблицей
-1 |
0 |
1 |
|
0 |
|||
1 |
Найти коэффициент корреляции
Решение. Находим законы распределения составляющих и :
Теперь вычислим м.о. составляющих:
.
Этих величин можно было находить на основании таблицы распределения с.в.
из равенства (1) пункта 12.1. Например,
.
Аналогично, находите самостоятельно.
Вычислим дисперсии составляющих при это будем пользоваться вычислительной формулой:
Следовательно, Далее, на основании первой формулы
(6) имеем:
Составим закон распределения , а затем найдём :
При составлении таблицы закона распределения следует выполнять действия:
1) оставить лишь различные значения всевозможных произведений .
2) для определения вероятности данного значения , нужно
складывать все соответствующие вероятности, находящиеся на пересечении основной таблицы, благоприятствующие наступлению данного значения.
В нашем примере с.в. принимает всего три различных значения . Здесь первое значение ( ) соответствует произведению из второй строки и из первого столбца, поэтому на их пересечении находится вероятностное число аналогично
,
которое получено из суммы вероятностей, находящихся на пересечениях соответственно первой строки и первого столбца (0,15 ; 0,40; 0,05) и одно значение , которое находится на пересечении второй строки и второго столбца, и наконец, , которое находится на пересечении второй строки и третьего столбца.
Из нашей таблицы находим:
Находим корреляционный момент, используя формулу (38):
Находим коэффициент корреляции по формуле (41)
Таким образом, отрицательная корреляция.
5. Вариационный ряд, его разновидности. Средняя арифметическая и дисперсия ряда. Эмпирическая функция распределения. Полигон и гистограмма.
Вариационным рядом называется ранжированный в порядке возрастания (или убывания) ряд вариантов с соответствующими им весами (частотами или частостями).
При изучении вариационных рядов наряду с понятием частоты используется понятие накопленной частоты (обозначаем ). Накопленная частота показывает, ск-ко наблюдалось вариантов со значением признака, меньшим х. Отношение на копленной частоты к общему числу наблюдений n назовемнакопленной частостью .
Накопленные частоты (частости) для каждого интервала находятся последовательным суммированием частот (частостей) всех предшествующих интервалов, включая данный.
Для задания вариационного ряда достаточно указать варианты и соответствующие им частоты (частости) или накопленные частоты (частости).
Вариационный ряд называется дискретным, если любые его варианты отличаются на постоянную величину, и - непрерывным (интервальными), если варианты могут отличаться один от другого на сколь угодно малую величину.
Для графического изображения вариационных рядов наиболее часто используются полигон, гистограмма, кумулятивная кривая:
Полигон, как правило, служит для изображения дискретного вариационного ряда и представляет собой ломаную, в которой концы отрезков прямой имеют координаты ( ), i = 1, 2,..., m.
Гистограмма служит только для изображения интервальных вариационных рядов и представляет собой ступенчатую фигуру из прямоугольников с основаниями, равными интервалам значений признака , i = 1, 2, ...,m, и высотами, равными частотам (частостям) ( ) интервалов. Если соединить середины верхних оснований прямоугольников отрезками прямой, то можно получить полигон того же распределения.
Кумулятивная кривая (кумулята) - кривая накопленных частот (частостей). Для дискретного ряда кумулята представляет ломаную, соединяющую точки ( , ) или ( , ), i = 1, 2, ..., m. Для интервального вариационного ряда ломаная начинается с точки, абсцисса к-ой равна началу первого интервала, а ордината - накопленной частоте (частости), равной нулю. Другие точки этой ломаной соответствуют концам интервалов.