ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.09.2024

Просмотров: 177

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

По результатам

наблюдений двумерной

случайной

величины

(X1; Y1), (X2; Y2 ),…, (Xn ; Yn ) можно вычислить выборочную ковариацию

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(Xi

 

 

 

)(Yi

 

)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

cov(X, Y) =(X

X

)(Y

Y

) =

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

(5.1.3)

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и выборочный коэффициент корреляции

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆρ(X, Y) =

cov(X, Y)

.

 

 

 

 

 

 

 

 

 

 

 

 

(5.1.4)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆˆσ σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Для выборочной дисперсии и выборочной ковариации несложно доказать

формулы

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi

 

Xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

2

 

 

 

 

2

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆσ

= X

 

(X) =

 

i=1

 

 

 

 

,

 

 

 

 

 

(5.1.5)

 

 

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

и

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Xi Yi

 

 

 

 

 

 

 

 

 

 

 

 

cov(X, Y) =

XY

X

 

Y

=

i=1

 

 

X

 

Y

,

(5.1.6)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

но пользоваться этими формулами можно только в теоретических выкладках, так как при практических расчетах эти формулы обладают существенно большей вычислительной погрешностью, чем их аналоги (5.1.2) и (5.1.3). Дока зать формулы (5.1.5) и (5.1.6) мы предлагаем читателю в задачах 422 и 423.

Несложно также показать, что выборочный коэффициент корреляции заключен в пределах от –1 до 1 и характеризует близость зависимости между выборками X и Y к линейной (рис. 5.1.1).

Чем ближе точки (xi; yi) расположены к некоторой прямой, тем ближе значение модуля выборочного коэффициента корреляции ˆ| ρ(X, Y) | к единице, и наоборот, чем ближе ˆ| ρ(X, Y) | к единице, тем ближе точки (xi; yi) расположе ны к некоторой прямой. При этом выборочный коэффициент корреляции ˆρ(X, Y) положителен [отрицателен] тогда и только тогда, когда при увеличении одной из величин X, Y значения другой имеют тенденцию к увеличению [соот ветственно, к уменьшению], т. е. прямая, около которой расположены точки (xi; yi), имеет положительный [соответственно, отрицательный] наклон.

Значение выборочного коэффициента корреляции, близкое к нулю, озна чает отсутствие линейной связи между переменными, но при этом может на блюдаться сильная нелинейная корреляционная зависимость (как на рис. 5.1.1, е, где точки расположены близко к некоторой п а р а б о л е ) или ста тистическая связь, которую в виде функциональной зависимости переменных представить невозможно, так, на рис. 5.1.1, ж приведен пример статистиче ской зависимости, когда с увеличением x растет разброс точек вдоль оси y, однако никакой функцией y = f(x) (линейной или нелинейной) такую зави симость выразить нельзя.

38


y

y

y

x

x

x

а)

в)

д)

y

y

y

x

x

x

б)

г)

е)

 

y

 

x

ж)

Рис. 5.1.1. Виды зависимости между выборками: сильная линейная прямая,ˆρ(X, Y) ≈1 (а);

слабая линейная прямая,ˆρ(X, Y) ≈−0,5 (б);

сильная линейная обратная,ˆρ(X, Y) ≈−1 (в);

слабая линейная обратная,ˆρ(X, Y) ≈−0,5 (г);

отсутствие зависимости,ˆρ(X, Y) ≈0 (д);

сильная нелинейная,ˆρ(X, Y) ≈0 (е);

зависимость, не являющаяся корреляционной,ˆρ(X, Y) ≈0 (ж)

39

Задачи

420. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

3

 

 

 

 

 

 

 

4

 

6

7

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

yi

 

5

 

 

 

 

 

10

 

9

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

2

, cov(X, Y) , заполняя столбцы табл. 5.1.1.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Решение. Последовательно вычисляем x, y,ˆσ

,ˆσ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а 5.1.1

 

 

 

 

 

 

 

 

 

 

Расчет выборочных характеристик в задаче 420

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

y

x

x

 

 

 

y

y

 

 

 

 

 

(x

x

)2

 

 

 

 

 

 

(y

y

)2

 

 

 

 

(x

x

)(y

y

)

3

5

 

 

–2

 

 

 

4

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

16

 

 

 

 

8

 

 

 

 

 

4

10

 

 

–1

 

 

 

1

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

–1

6

9

 

 

1

 

 

 

 

0

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

0

 

 

 

 

 

 

0

 

 

 

 

 

7

12

 

 

2

 

 

 

 

3

 

 

 

 

 

 

 

 

 

4

 

 

 

 

 

 

 

 

 

 

 

 

9

 

 

 

 

 

 

6

 

 

 

 

 

 

 

=5

 

 

 

 

=9

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=3,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(x

 

)2 =2,5

 

 

(y

 

)2 =6,5

 

 

 

 

(x

 

)(y

 

)

 

 

y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x

 

 

y

x

y

 

 

Получили следующие значения:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x =5; y =6,5;ˆσ

=(x x)

=2,5;ˆσ

 

=(yy)

=6,5; cov(X, Y) =(x x)(yy) =3,25.

 

 

 

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Затем находимˆσ

2

 

 

1,58;ˆσ

 

 

 

 

 

 

 

 

 

2

 

=2,55 и подставляем рассчитанные значения

 

 

= ˆσ

 

= ˆσ

 

 

 

 

 

 

 

 

 

 

X

 

 

 

X

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

в формулу (5.1.4): ˆρ(X, Y) =

cov(X, Y)

=

 

 

3,25

 

 

 

 

≈0,81.

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆˆσ σ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1,58 2,55

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

X

Y

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

421. Вычислить выборочный коэффициент корреляции по результатам наблюдений двумерной случайной величины:

xi −2 −1 0 1 2

yi 4 1 0 1 4

422.Доказать формулу (5.1.5).

423.Доказать формулу (5.1.6).

40



41

5.1.2. Д о п у с т и м ы й о б ъ е м в ы б о р к и д л я о б е с п е ч е н и я е е р е п р е з е н т а т и в н о с т и

Из теоремы Чебышева (4.3.2) следует, что если DX <B , то

P{| X MX |<ε} .1− B ,

nε2

поэтому при объеме выборки

n >

B

(5.1.7))

 

(1−γ)ε2

 

с вероятностью, большей γ , выполняется неравенство | X MX |<ε, т. е. гаран тируется меньшая, чем ε, ошибка репрезентативности при замене математи ческого ожидания MX выборочным средним X .

Пусть выборка состоит из n испытаний Бернулли, в которых произошло m успехов. Тогда выборочным аналогом вероятности успеха является отно% сительная частота

ˆp = m . n

Из теоремы Бернулли (4.3.4) следует, что

ˆ

p(1−p)

,

 

nε2

P{| p p |<ε}.1−

 

поэтому при объеме выборки

 

 

 

n >

p(1−p)

 

(5.1.8)

(1−γ)ε2

 

 

с вероятностью, большей γ , выполняется неравенство ˆ|p p| <ε, т. е. гаранти руется меньшая, чем ε, ошибка репрезентативности при замене вероятности

p относительной частотой ˆp . Поскольку для любых p [0,1]

p(1−p) <1/4 , то

при неизвестной p неравенство для n можно заменить на

 

1

 

 

n>

 

.

(5.1.9)

4(1−γ)ε2

Если математическое ожидание случайной величины

X равно a , ее

среднее квадратичное отклонение равно σ, а объем выборки велик, то соглас но следствию (4.4.3) из центральной предельной теоремы

 

 

 

 

 

 

 

P{|

X

MX |<ε} =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

X MX

 

ε

 

ε

 

ε

 

ε

 

<

 

<

 

 

0

 

 

−Φ0

 

=2Φ0

 

 

=P

 

 

 

 

 

 

 

 

 

 

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ/ n

 

 

σ/ n

 

 

 

 

 

σ/ n

 

 

σ/ n

 

 

σ/ n

 

 

 

 

σ/ n

 

 

 

 

 

 

поэтому при объеме выборки

 

Bu2

 

n >

γ/2

(5.1.10)

ε2

 

 

42


(где uγ/2 — такое число, что Φ0 (uγ/2 ) = γ/2 ) с вероятностью, большей γ, вы полняется неравенство | X MX |<ε, т. е. гарантируется меньшая, чем ε, ошиб ка репрезентативности при замене математического ожидания MX выбороч ным средним X . Эту же формулу для объема выборки используют и в случае, когда n велико, и есть основания пользоваться центральной предельной тео ремой.

В частности, при большом числе испытаний Бернулли n и не очень малой вероятности p (такой, что np >10 ) в силу локальной и интегральной теорем Му авра — Лапласа (4.4.6)—(4.4.7) относительная частота ˆp имеет нормальный за

кон распределения с параметрами a =p, σ=

p(1−p)/n , поэтому при объеме

выборки

 

 

 

 

 

u2

/2

p(1−p)

 

n >

γ

 

(5.1.11)

 

 

ε2

 

 

 

 

(где uγ/2 — такое число, что Φ0 (uγ/2 ) = γ/2 ) с вероятностью, большей γ, вы полняется неравенство ˆ|p p|<ε, т. е. гарантируется меньшая, чем ε, ошибка репрезентативности при замене вероятности p относительной частотой p .

Задачи

424.Дисперсия случайной величины X не превышает 10. Требуется

оценить

вероятность того, что отклонение выборочного среднего

16 000

 

X = Xi

16 000 , рассчитанного по 16 000 результатов наблюдений случай

i=1

 

ной величины (независимых, проведенных в одинаковых с вероятностной точ ки зрения условиях) от математического ожидания MX не превысит 0,25.

 

 

Решение.

По формуле

(5.1.7),

в

 

которой

n = 16 000,

 

B = 10,

ε=0,25 , получаем:

 

 

 

 

 

B

 

10

 

 

=0,99

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

P{| X MX |<ε} .1−nε2 =1−

16 000 0,252

. Если обратить внимание на то, что n велико, то

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ε

 

 

 

 

 

ε

 

 

 

 

0,25

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

согласно (5.1.10)

P{| X MX |<ε} =2Φ0

 

 

 

 

 

.2Φ0

 

 

 

 

 

=2Φ0

 

 

 

 

=2Φ0 (10)

≈1 .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

σ/

n

 

 

 

B /

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

10/16 000

 

 

425. В условиях задачи 424 требуется определить, сколько следует провести наблюдений, чтобы с вероятностью, не меньшей 0,99, можно было утверждать, что ошибка репрезентативности при замене математического

ожидания MX выборочным средним X не превысит 0,2.

Решение.

По

формуле (5.1.7), в которой B =10, γ =0,99, ε=0,2 , получим:

n >

B

=

 

10

 

=0,99 . Предположив же нормальность распределения случайной

 

(1−0,99)0,22

(1−γ)ε2

 

 

величины X и воспользовавшись формулой (5.1.10), в которой uγ/2 =u0,99/2 =u0,495 =2,55 [так как

Φ0

(2,55) =0,495 ], получим: n >

Buγ2

/2

=

10 2,552

=1625,6 — значительно меньше 25 000.

ε2

 

 

0,22

 

 

 

 

 

426. Известно, что в среднем из каждой тысячи кредитов, выданных на развитие малого предпринимательства 30 не возвращаются. Определить, сколько нужно отобрать предприятий, чтобы с вероятностью, не меньшей 0,9,

43