ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 10.09.2024
Просмотров: 177
Скачиваний: 0
По результатам |
наблюдений двумерной |
случайной |
величины |
||||||||||||||||||||||||||||||||||
(X1; Y1), (X2; Y2 ),…, (Xn ; Yn ) можно вычислить выборочную ковариацию |
|||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑(Xi − |
|
|
|
)(Yi − |
|
) |
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
Y |
|
||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
cov(X, Y) =(X − |
X |
)(Y − |
Y |
) = |
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
(5.1.3) |
|||||||||||||||||
|
|
|
|
|
n |
|
|
|
|
|
|
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
и выборочный коэффициент корреляции |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
ˆρ(X, Y) = |
cov(X, Y) |
. |
|
|
|
|
|
|
|
|
|
|
|
|
(5.1.4) |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ˆˆσ σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
Для выборочной дисперсии и выборочной ковариации несложно доказать |
|||||||||||||||||||||||||||||||||||||
формулы |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
n |
|
|
|
2 |
|
|
|
|
|
|
|
||||||||
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑Xi |
|
∑Xi |
|
|
|
|
|
|
|
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||
2 |
|
|
2 |
|
|
|
|
2 |
|
|
|
|
|
i=1 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||
ˆσ |
= X |
|
−(X) = |
|
− |
i=1 |
|
|
|
|
, |
|
|
|
|
|
(5.1.5) |
||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
n |
|
|
|
|
|
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
и |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
∑Xi Yi |
|
|
|
|
|
|
|
|
|
|
|
|
|||||
cov(X, Y) = |
XY |
− |
X |
|
Y |
= |
i=1 |
|
|
− |
X |
|
Y |
, |
(5.1.6) |
||||||||||||||||||||||
|
|
|
|||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
n |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
но пользоваться этими формулами можно только в теоретических выкладках, так как при практических расчетах эти формулы обладают существенно большей вычислительной погрешностью, чем их аналоги (5.1.2) и (5.1.3). Дока зать формулы (5.1.5) и (5.1.6) мы предлагаем читателю в задачах 422 и 423.
Несложно также показать, что выборочный коэффициент корреляции заключен в пределах от –1 до 1 и характеризует близость зависимости между выборками X и Y к линейной (рис. 5.1.1).
Чем ближе точки (xi; yi) расположены к некоторой прямой, тем ближе значение модуля выборочного коэффициента корреляции ˆ| ρ(X, Y) | к единице, и наоборот, чем ближе ˆ| ρ(X, Y) | к единице, тем ближе точки (xi; yi) расположе ны к некоторой прямой. При этом выборочный коэффициент корреляции ˆρ(X, Y) положителен [отрицателен] тогда и только тогда, когда при увеличении одной из величин X, Y значения другой имеют тенденцию к увеличению [соот ветственно, к уменьшению], т. е. прямая, около которой расположены точки (xi; yi), имеет положительный [соответственно, отрицательный] наклон.
Значение выборочного коэффициента корреляции, близкое к нулю, озна чает отсутствие линейной связи между переменными, но при этом может на блюдаться сильная нелинейная корреляционная зависимость (как на рис. 5.1.1, е, где точки расположены близко к некоторой п а р а б о л е ) или ста тистическая связь, которую в виде функциональной зависимости переменных представить невозможно, так, на рис. 5.1.1, ж приведен пример статистиче ской зависимости, когда с увеличением x растет разброс точек вдоль оси y, однако никакой функцией y = f(x) (линейной или нелинейной) такую зави симость выразить нельзя.
38
y |
y |
y |
x |
x |
x |
а) |
в) |
д) |
y |
y |
y |
x |
x |
x |
б) |
г) |
е) |
|
y |
|
x
ж)
Рис. 5.1.1. Виды зависимости между выборками: сильная линейная прямая,ˆρ(X, Y) ≈1 (а);
слабая линейная прямая,ˆρ(X, Y) ≈−0,5 (б);
сильная линейная обратная,ˆρ(X, Y) ≈−1 (в);
слабая линейная обратная,ˆρ(X, Y) ≈−0,5 (г);
отсутствие зависимости,ˆρ(X, Y) ≈0 (д);
сильная нелинейная,ˆρ(X, Y) ≈0 (е);
зависимость, не являющаяся корреляционной,ˆρ(X, Y) ≈0 (ж)
39
Задачи
420. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
xi |
|
3 |
|
|
|
|
|
|
|
4 |
|
6 |
7 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
yi |
|
5 |
|
|
|
|
|
10 |
|
9 |
12 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2 |
2 |
, cov(X, Y) , заполняя столбцы табл. 5.1.1. |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||
|
|
Решение. Последовательно вычисляем x, y,ˆσ |
,ˆσ |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Т а б л и ц а 5.1.1 |
|||||||||||
|
|
|
|
|
|
|
|
|
|
Расчет выборочных характеристик в задаче 420 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
|
|
x |
|
|
|
|
y |
x − |
x |
|
|
|
y− |
y |
|
|
|
|
|
(x − |
x |
)2 |
|
|
|
|
|
|
(y − |
y |
)2 |
|
|
|
|
(x − |
x |
)(y− |
y |
) |
||||||||||||||||||||||||||||
3 |
5 |
|
|
–2 |
|
|
|
4 |
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
16 |
|
|
|
|
8 |
|
|
|
|
|
|||||||||||||||||||||||||||
4 |
10 |
|
|
–1 |
|
|
|
1 |
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
–1 |
||||||||||||||||||||||||
6 |
9 |
|
|
1 |
|
|
|
|
0 |
|
|
|
|
|
|
|
|
|
1 |
|
|
|
|
|
|
|
|
|
|
|
|
0 |
|
|
|
|
|
|
0 |
|
|
|
|
|
||||||||||||||||||||||||
7 |
12 |
|
|
2 |
|
|
|
|
3 |
|
|
|
|
|
|
|
|
|
4 |
|
|
|
|
|
|
|
|
|
|
|
|
9 |
|
|
|
|
|
|
6 |
|
|
|
|
|
||||||||||||||||||||||||
|
|
=5 |
|
|
|
|
=9 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
=3,25 |
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
(x − |
|
)2 =2,5 |
|
|
(y− |
|
)2 =6,5 |
|
|
|
|
(x − |
|
)(y− |
|
) |
||||||||||||||||||||||||||||||||
|
|
y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||||||||||||||||||||||||||||
|
x |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
x |
|
|
y |
x |
y |
||||||||||||||||||||||||||||||||||||||||||||
|
|
Получили следующие значения: |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||
|
|
|
x =5; y =6,5;ˆσ |
=(x −x) |
=2,5;ˆσ |
|
=(y−y) |
=6,5; cov(X, Y) =(x −x)(y−y) =3,25. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
X |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Затем находимˆσ |
2 |
|
|
≈ |
1,58;ˆσ |
|
|
|
|
|
|
|
|
|
2 |
|
=2,55 и подставляем рассчитанные значения |
|||||||||||||||||||||||||||||||||||||||||||||||||
|
|
= ˆσ |
|
= ˆσ |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
X |
|
|
|
X |
|
|
|
|
|
|
|
|
|
Y |
|
|
|
|
|
|
|
|
|
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||
в формулу (5.1.4): ˆρ(X, Y) = |
cov(X, Y) |
= |
|
|
3,25 |
|
|
|
|
≈0,81. |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||||||
ˆˆσ σ |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1,58 2,55 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
X |
Y |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
421. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины:
xi −2 −1 0 1 2
yi 4 1 0 1 4
422.Доказать формулу (5.1.5).
423.Доказать формулу (5.1.6).
40
41
5.1.2. Д о п у с т и м ы й о б ъ е м в ы б о р к и д л я о б е с п е ч е н и я е е р е п р е з е н т а т и в н о с т и
Из теоремы Чебышева (4.3.2) следует, что если DX <B , то
P{| X −MX |<ε} .1− B ,
nε2
поэтому при объеме выборки
n > |
B |
(5.1.7)) |
|
||
(1−γ)ε2 |
|
с вероятностью, большей γ , выполняется неравенство | X −MX |<ε, т. е. гаран тируется меньшая, чем ε, ошибка репрезентативности при замене математи ческого ожидания MX выборочным средним X .
Пусть выборка состоит из n испытаний Бернулли, в которых произошло m успехов. Тогда выборочным аналогом вероятности успеха является отно% сительная частота
ˆp = m . n
Из теоремы Бернулли (4.3.4) следует, что
ˆ |
p(1−p) |
, |
|||
|
nε2 |
||||
P{| p −p |<ε}.1− |
|
||||
поэтому при объеме выборки |
|
|
|
||
n > |
p(1−p) |
|
(5.1.8) |
||
(1−γ)ε2 |
|||||
|
|
с вероятностью, большей γ , выполняется неравенство ˆ|p −p| <ε, т. е. гаранти руется меньшая, чем ε, ошибка репрезентативности при замене вероятности
p относительной частотой ˆp . Поскольку для любых p [0,1] |
p(1−p) <1/4 , то |
||
при неизвестной p неравенство для n можно заменить на |
|
||
1 |
|
|
|
n> |
|
. |
(5.1.9) |
4(1−γ)ε2 |
|||
Если математическое ожидание случайной величины |
X равно a , ее |
среднее квадратичное отклонение равно σ, а объем выборки велик, то соглас но следствию (4.4.3) из центральной предельной теоремы
|
|
|
|
|
|
|
P{| |
X |
−MX |<ε} = |
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ε |
|
|
X −MX |
|
ε |
|
ε |
|
ε |
|
ε |
||||||||||
|
< |
|
< |
|
|
=Φ0 |
|
|
−Φ0 |
− |
|
=2Φ0 |
|
|
|||||||
=P − |
|
|
|
|
|
|
|
|
|
|
|
|
, |
||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
σ/ n |
|
|
σ/ n |
|
|
|
|
|
σ/ n |
|
|
σ/ n |
|
|
σ/ n |
||||||
|
|
|
|
σ/ n |
|
|
|
|
|
|
поэтому при объеме выборки
|
Bu2 |
|
|
n > |
γ/2 |
(5.1.10) |
|
ε2 |
|||
|
|
42
(где uγ/2 — такое число, что Φ0 (uγ/2 ) = γ/2 ) с вероятностью, большей γ, вы полняется неравенство | X −MX |<ε, т. е. гарантируется меньшая, чем ε, ошиб ка репрезентативности при замене математического ожидания MX выбороч ным средним X . Эту же формулу для объема выборки используют и в случае, когда n велико, и есть основания пользоваться центральной предельной тео ремой.
В частности, при большом числе испытаний Бернулли n и не очень малой вероятности p (такой, что np >10 ) в силу локальной и интегральной теорем Му авра — Лапласа (4.4.6)—(4.4.7) относительная частота ˆp имеет нормальный за
кон распределения с параметрами a =p, σ= |
p(1−p)/n , поэтому при объеме |
|||
выборки |
|
|
|
|
|
u2 |
/2 |
p(1−p) |
|
n > |
γ |
|
(5.1.11) |
|
|
|
ε2 |
||
|
|
|
|
(где uγ/2 — такое число, что Φ0 (uγ/2 ) = γ/2 ) с вероятностью, большей γ, вы полняется неравенство ˆ|p −p|<ε, т. е. гарантируется меньшая, чем ε, ошибка репрезентативности при замене вероятности p относительной частотой p .
Задачи
424.Дисперсия случайной величины X не превышает 10. Требуется
оценить |
вероятность того, что отклонение выборочного среднего |
16 000 |
|
X = ∑ Xi |
16 000 , рассчитанного по 16 000 результатов наблюдений случай |
i=1 |
|
ной величины (независимых, проведенных в одинаковых с вероятностной точ ки зрения условиях) от математического ожидания MX не превысит 0,25.
|
|
Решение. |
По формуле |
(5.1.7), |
в |
|
которой |
n = 16 000, |
|
B = 10, |
ε=0,25 , получаем: |
|||||||||||||||||
|
|
|
|
|
B |
|
10 |
|
|
=0,99 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||
P{| X −MX |<ε} .1−nε2 =1− |
16 000 0,252 |
. Если обратить внимание на то, что n велико, то |
||||||||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||
|
|
|
|
|
|
|
|
|
|
|
ε |
|
|
|
|
|
ε |
|
|
|
|
0,25 |
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||||||||||||||
согласно (5.1.10) |
P{| X −MX |<ε} =2Φ0 |
|
|
|
|
|
.2Φ0 |
|
|
|
|
|
=2Φ0 |
|
|
|
|
=2Φ0 (10) |
≈1 . |
|||||||||
|
|
|
|
|
|
|
|
|||||||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
|
|
|
|
|
|
|
|
σ/ |
n |
|
|
|
B / |
n |
|
|
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
10/16 000 |
|
|
425. В условиях задачи 424 требуется определить, сколько следует провести наблюдений, чтобы с вероятностью, не меньшей 0,99, можно было утверждать, что ошибка репрезентативности при замене математического
ожидания MX выборочным средним X не превысит 0,2.
Решение. |
По |
формуле (5.1.7), в которой B =10, γ =0,99, ε=0,2 , получим: |
||||
n > |
B |
= |
|
10 |
|
=0,99 . Предположив же нормальность распределения случайной |
|
(1−0,99)0,22 |
|||||
(1−γ)ε2 |
|
|
величины X и воспользовавшись формулой (5.1.10), в которой uγ/2 =u0,99/2 =u0,495 =2,55 [так как
Φ0 |
(2,55) =0,495 ], получим: n > |
Buγ2 |
/2 |
= |
10 2,552 |
=1625,6 — значительно меньше 25 000. |
|
ε2 |
|
|
0,22 |
||||
|
|
|
|
|
426. Известно, что в среднем из каждой тысячи кредитов, выданных на развитие малого предпринимательства 30 не возвращаются. Определить, сколько нужно отобрать предприятий, чтобы с вероятностью, не меньшей 0,9,
43