ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.09.2024

Просмотров: 182

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Рис. 5.2.1. Окно ввода данных программы «Описательная статистика»

В результате работы программы «Описательная статистика» получены значения выборочных характеристик ежедневного объема продаж (рис. 5.2.2):

 

n

выборочное среднее x = xi n =49,6 ;

 

i=1

n

исправленная выборочная дисперсия s2X = (xi x)2

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

2

 

n

i

2

 

n −1

числить выборочную

X

=

x)

n =

 

дисперсию ˆσ

 

(x

n

 

 

 

 

 

 

i=1

 

 

 

Шеппарда σ

2

2

2

/12 =113,12 ;

 

 

 

 

 

 

X

=ˆσ

−∆

 

 

 

 

 

 

 

X

 

 

 

 

 

 

 

 

(n −1) =117,8 , откуда легко вы

s2X =116,6 ; с учетом поправки

стандартное отклонение sX =

s2X =10,85 (выборочное среднее квадратичное отклоне

ниеˆσ

 

2

 

=

10,80 , с учетом поправки Шеппарда σ

 

=

2

=10,64 );

 

 

= ˆσ

X

σ

X

 

 

 

X

 

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

исправленная выборочная асимметрия

AX =

 

 

 

 

 

ˆ

(n −2) =0,091 , откуда легко

n(n −1)AX

вычислить

 

 

выборочную

 

асимметрию

 

 

 

ˆ

=ˆµ

 

 

3

 

 

(n −2)A

 

/ n(n −1) =0,089

 

 

 

 

 

 

 

A

X

/ˆσ =

X

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

3

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆµ

=

(x

k

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

здесь

x)

n ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

k

 

i

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

исправленный выборочный эксцесс EX =

 

(n −1)[(n +1)EX +6]

=−0,47 , откуда легко вы

 

(n −2)(n −3)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

4

(n −2)(n −3)EX

 

 

 

 

6

 

 

 

 

 

числить выборочный эксцесс E

X

=ˆµ

/ˆσ −3 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=−0,51 ;

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

4

 

 

(n +1)(n −1)

 

 

 

n +1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=sX / x =0,2188 =21,88% .

 

 

выборочный коэффициент вариации VX

 

 

Значения некоторых характеристик могут изменяться при переходе от несгруппиро ванных данных к сгруппированным (интервальному вариационному ряду). Такими величи

нами являются, в том числе, выборочная медиана ˆx

и выборочная мода ˆx

. Программа

med

mod

 

«Описательная статистика» вычисляет все характеристики п о н е с г р у п п и р о в а н н ы м д а н н ы м. Между тем, указанные две характеристики несут в себе гораздо больше смысла, если их вычислять п о и н т е р в а л ь н о м у в а р и а ц и о н н о м у р я д у (по лученному в задаче 432 — см. табл. 5.1.3) при помощи формул (5.119) и (5.1.20) соответственно:

62


 

 

 

 

 

 

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

ˆx

=a +∆

0,5−F(al )

,

где

a — начало медианного интервала; в нашем случае

 

 

 

med

l

 

 

ˆp

 

 

 

 

 

l

 

 

 

 

 

 

 

 

 

 

 

 

l

 

 

 

 

 

 

 

 

 

 

 

 

 

al = 46,911, поэтомуˆx =46,911+

6,49

(0,5−0,45)=48,71 ;

 

 

 

 

 

 

 

med

 

 

 

0,18

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=am

+∆

ˆp

−ˆp

 

 

 

 

 

 

 

 

 

 

ˆx

 

m

 

m−1

 

 

, где am — начало модального интервала; в нашем случае

p

−ˆp

−ˆp

 

 

 

m o d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

m

 

m−1

m+1

 

 

 

 

 

 

am = 40,422, поэтомуˆx

=40,422+

6,49

0,25−0,12

=44,64 .

 

 

2 0,25−0,12

−0,18

 

 

 

 

 

 

 

m o d

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Итак, все требуемые выборочные характеристики получены.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Объем продаж за 100 дней

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Среднее

 

 

 

 

 

 

 

49,6

 

 

 

 

 

 

 

 

 

Стандартная ошибка

 

 

1,09

 

 

 

 

 

 

 

 

 

Медиана

 

 

 

49,15

 

 

 

 

 

 

 

 

 

Мода

 

 

 

 

 

 

 

37,2

 

 

 

 

 

 

 

 

 

Стандартное отклонение

 

 

10,85

 

 

 

 

 

 

 

 

 

Дисперсия выборки

 

 

117,8

 

 

 

 

 

 

 

 

 

Эксцесс

 

 

 

 

 

 

 

–0,47

 

 

 

 

 

 

 

 

 

Асимметричность

 

 

0,091

 

 

 

 

 

 

 

 

 

Интервал

 

 

 

49,6

 

 

 

 

 

 

 

 

 

Минимум

 

 

 

24,2

 

 

 

 

 

 

 

 

 

Максимум

 

 

 

73,8

 

 

 

 

 

 

 

 

 

Сумма

 

 

 

 

 

 

 

4959,6

 

 

 

 

 

 

 

 

 

Счет

 

 

 

 

 

 

 

100

 

 

 

Рис. 5.2.2. Результаты работы программы «Описательная статистика»

 

434.

В условиях задачи 432 требуется с помощью программы «Описа

тельная статистика» пакета Microsoft Excel требуется, заменив параметры нор мального закона распределения их выборочными характеристиками, скоррек тированными на поправку Шеппарда, рассчитать и построить графики функ ции плотности и функции распределения нормального закона, «наложив» эти графики соответственно на полигон и кумуляту.

Решение. По данным табл. 5.1.3 построим полигон и гистограмму на рис. 5.2.3 и кумуляту

на рис. 5.2.4.

 

 

 

 

 

 

 

 

 

 

f(x)

 

 

 

 

 

 

 

 

0,0450

 

 

 

 

 

 

 

 

 

0,0400

 

 

 

 

 

 

 

 

 

0,0350

 

 

 

 

 

 

 

 

 

0,0300

 

 

 

 

 

 

 

 

 

0,0250

 

 

 

 

 

 

 

 

 

0,0200

 

 

 

 

 

 

 

 

 

0,0150

 

 

 

 

 

 

 

 

 

0,0100

 

 

 

 

 

 

 

 

 

0,0050

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

0

24,20

30,69

37,18

43,67

50,16

56,64

63,13

69,62

76,11

Гистограмма

Полигон

Функция плотности нормального закона

Рис. 5.2.3. Гистограмма, полигон и функция плотности нормального закона

63


F(x)

 

 

 

 

 

 

 

 

 

1,0000

 

 

 

 

 

 

 

 

 

0,8000

 

 

 

 

 

 

 

 

 

0,6000

 

 

 

 

 

 

 

 

 

0,4000

 

 

 

 

 

 

 

 

 

0,2000

 

 

 

 

 

 

 

 

 

0,0000

 

 

 

 

 

 

 

 

x

 

 

 

 

 

 

 

 

 

27,444

33,933

40,422

46,911

53,399

59,888

66,377

72,866

79,354

Кумулята

 

 

Функция распределения нормального закона

Рис. 5.2.4. Кумулята и функция распределения нормального закона

Заменим параметры

нормального

закона

a и

σ их выборочными оценка

ми: a = x =49,6, σ=σX =10,64 и рассчитаем значения функции плотности нормального закона

(xa)2

fN (x) = σ 1 π e− 2σ2 2

в серединах

интервалов

[воспользовавшись функцией Microsoft Excel fN(x) =

= НОРМРАСП(<x>; <a>; <σ>; ЛОЖЬ)] и функции распределения

 

 

 

1

x

e

(ta)2

F

(x) =

 

2

dt = НОРМРАСП(<x>; <a>; < σ>; ИСТИНА)

 

 

N

 

σ

 

 

 

 

 

 

 

−∞

 

 

 

в правых концах интервалов. Результаты расчетов представлены в седьмом и восьмом столбцах табл. 5.2.1 (первые шесть столбцов табл. 5.2.1 взяты из табл. 5.1.3). Графики функ ций fN(x) и FN(x) построены на рис. 5.2.3 и 5.2.4 соответственно.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Т а б л и ц а

5.2.1

 

 

 

Результаты раасчетов в задаче 434

 

 

 

 

 

 

 

Сере

Интер

Ин

Оценка

Оценка

Функция

Функция рас

 

 

дина

валь

терваль

функции

плотности

 

 

функции

 

Интервал

ин

 

ная

 

ная отно

распре

нормаль

пределения

 

 

 

плотности

 

(aj; aj + 1)

 

 

нормального

 

терва

часто

сительная

деления

ного зако

 

ˆ

 

 

закона F (a

)

 

 

ла x

 

 

ˆ

f

(x′)

ˆ

 

 

 

на f

)

 

 

j

та m

j

частота pj

 

 

F

(a

j+1

)

(x

 

 

 

 

 

 

 

 

 

X

 

 

N

j

 

 

 

 

[20,956; 27,444)

24,20

1

 

0,01

0,0015

0,01

 

0,0022

 

0,0187

 

 

[27,444; 33,933)

30,69

7

 

0,07

0,0108

0,08

 

0,0077

 

0,0704

 

 

[33,933; 40,422)

37,18

12

 

0,12

0,0185

0,20

 

0,0190

 

0,1942

 

 

[40,422; 46,911)

43,67

25

 

0,25

0,0385

0,45

 

0,0321

 

0,4002

 

 

[46,911; 53,399)

50,16

18

 

0,18

0,0277

0,63

 

0,0374

 

0,6395

 

 

[53,399; 59,888)

56,65

20

 

0,20

0,0308

0,83

 

0,0301

 

0,8332

 

 

[59,888; 66,377)

63,14

9

 

0,09

0,0139

0,92

 

0,0167

 

0,9426

 

 

[66,377; 72,866)

69,63

7

 

0,07

0,0108

0,99

 

0,0064

 

0,9856

 

 

[72,866; 79,354)

76,12

1

 

0,01

0,0015

1,00

 

0,0017

 

1,0000

 

 

Итого

 

100

 

1,00

 

 

 

 

 

435.По данным задачи 429 вычислить выборочные характеристики: коэффициент вариации, асимметрию, эксцесс, моду, медиану.

436.Доказать, что выборочное среднее X (5.1.1) является эффективной (в классе линейных несмещенных оценок) оценкой математического ожидания MX .

64


437.Доказать, что относительная частота является состоятельной, не смещенной и эффективной (в классе всех несмещенных оценок) оценкой веро ятности наступления события.

438.Доказать, что выборочная дисперсия и исправленная выборочная дисперсия являются состоятельными оценками дисперсии.

65

66

5.2.2. М е т о д ы п о с т р о е н и я т о ч е ч н ы х о ц е н о к

Будем считать, что известен общий вид p(x;θ) закона распределения слу чайной величины X , соответствующей генеральной совокупности, из которой извлечена выборка x1,x2,…,xn (функция вероятности p(xi ;θ) =P{X =xi } для дискретной случайной величины или плотность распределения p(x;θ) = fX (x) для непрерывной случайной величины), где θ — некоторый неизвестный па раметр закона распределения.

Метод моментов заключается в следующем. Определяется зависимость

θ=g1, ν2,…, νk , µ1, µ2,…, µl )

(5.2.8)

параметра θ от начальных моментов с первого по k й и центральных моментов с первого по l й, после чего для вычисления оценки θмм параметра θ по мето% ду моментов в эту зависимость (5.2.7) вместо неизвестных теоретических мо

ментов подставляют их выборочные аналогиˆν

иˆµ

:

 

 

 

i

j

 

 

θ

мм

ˆˆ ˆ

(5.2.9)

 

=gˆˆ(ν1, ν2,…,ˆνk , µ1, µ2

,…, µl ).

Очевидным достоинством метода моментов является его простота, одна ко качество оценок, полученных с помощью этого метода, не всегда бывает вы соким, особенно при небольших объемах выборки.

Изложим теперь алгоритм метода максимального правдоподобия. По выборке x1,x2,…,xn составляется функция правдоподобия

L(θ) =p(x1;θ)p(x2;θ) p(xn ;θ) ,

(5.2.10)

равная вероятности получения и м е н н о набора x1, x2,…, xn

при извлечении

выборки объемом n из генеральной совокупности в случае дискретной слу чайной величины (и плотности распределения этой вероятности — в случае непрерывной случайной величины). Чем больше L(θ), тем вероятнее (или п р а в д о п о д о б н е е) получить при наблюдениях и м е н н о д а н н у ю к о н к р е т н у ю в ы б о р к у x1, x2,…, xn .

Оценкой максимального правдоподобия параметра θ называют при этом такое значение θммп , которое максимизирует функцию правдоподобия L(θ):

Lммп) =max L(θ) .

(5.2.11)

θ

 

Для многих распределений вместо оптимизационной задачи (5.2.11) удоб

нее решать эквивалентную задачу

 

ln Lммп) =max ln L(θ) ,

(5.2.12)

θ

 

так как натуральный логарифм является монотонно возрастающей функцией. Если существует состоятельная и эффективная оценка θ параметра θ (в классе всех оценок — несмещенных и смещенных), то при весьма общих усло виях такой оценкой является θммп , если при этом оценка θммп оказывается смещенной, то ее подправляют аналогично тому, как это было сделано с выбо

рочной дисперсией [см. формулу (5.2.5)].

67


Задачи

439.По выборке x1, x2,…, xn найти оценку ˆλ параметра λ случайной

величины, распределенной по закону Пуассона: а) методом моментов; б) методом максимального правдоподобия.

Решение. а) Известно, что начальный момент первого порядка распределения Пуассона равен ν1 =MX =λ, откуда λ =ν1 =MX . Поэтому оценкой метода моментов для параметра λ

ˆ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

=ˆν = x .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

будет λ

мм

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

б) Для распределения Пуассона p(x;λ) =P{X = x} = λx e−λ . Составим функцию правдо

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

x!

 

 

 

 

 

подобия:

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

L(λ) =p(x1;λ)p(x2 ;λ)

p(xn ;λ)=

λx1

−λ λx2

−λ

λxn −λ

=

λx1+x2 + +xn

nλ

.

 

 

x1!

e

 

x2!

e

e

x1!x2!

e

 

 

 

 

 

 

 

 

 

 

 

 

xn!

 

xn!

 

 

Ее логарифм равен

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xi

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

 

 

 

λ

 

 

 

 

nλ

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

e

 

 

 

=ln λxi nλ−ln(x1 !x2 !

xn !) .

 

 

 

 

 

 

 

 

 

 

 

 

 

 

l(λ) =ln L(λ) =ln

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

xn !

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

x1 !x2 !

 

 

 

 

 

 

 

 

 

 

Чтобы функция l(λ) достигала максимального значения, необходимо, чтобы ее произ водная l′(λ) =0 , а вторая производная l′′(λ) <0 . В нашем случае

d

n

l′(λ) = ln λxi nλ−ln(x1 !x2 !

dλ

i=1

 

 

 

n

 

 

 

xi

 

 

=

i=1

x

!)

 

n

 

 

λ

 

 

 

 

 

 

n

 

 

 

xi

 

 

 

n, l′′(λ) =

d i=1

 

 

 

 

 

 

dλ

λ

 

 

n

 

 

 

 

xi

 

 

 

 

 

 

i=1

,

n

=−

 

 

λ

2

 

 

 

 

 

 

 

 

 

 

 

n

 

 

 

 

 

 

 

 

xi

 

поэтому оценку

максимального правдоподобия найдем из условия

i=1

n =0 :

ˆ

 

 

 

 

 

 

 

λммп

 

 

 

n

 

 

 

 

 

 

ˆ

 

xi

 

 

 

 

 

 

 

i=1

 

 

 

 

 

 

 

 

 

 

 

 

 

λммп

=

 

= x .

При этом вторая производная отрицательна, так как в числителе дроби

n

 

 

 

 

 

 

 

 

стоит положительное число (поскольку генеральная совокупность распределена по закону Пуассона и ее элементы не могут принимать отрицательных значений), в знаменателе дроби

также стоит положительное числоˆλ2 , а перед дробью стоит знак «минус».

ммп

440.Случайная величина X =U(a;b) . По выборке x1, x2,…, xn найти

оценки параметров a и b: а) методом моментов; б) методом максимального правдоподобия.

Решение.

 

а) Найдем

оценки

ˆa

 

и

ˆ

методом

 

моментов.

Известно,

что

 

 

b

 

 

 

 

 

 

 

 

 

 

 

 

 

мм

 

 

мм

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a +b

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

2

 

 

 

 

 

ν =

 

 

,

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

a +b

 

 

 

 

 

 

 

 

 

 

1

2

 

 

 

 

 

ν1(X) =MX =

,

µ1(X) =DX =

(b a)

. Решив систему

 

 

 

относительно a

и b

 

 

 

 

 

 

 

2

 

 

 

 

2

 

 

 

 

 

12

 

 

 

 

 

 

 

(ba)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

µ2 =

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

12

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

(учитывая,

 

 

что

a <b ),

получим:

 

 

a 1

2 ,

 

b 1 +

2 ,

а потому

ˆa =ˆν − 3ˆµ = x − 3ˆσ , b =ˆν +

3ˆµ = x +

3ˆσ .

 

 

 

 

 

 

 

 

 

мм 1

2

 

 

 

 

2

мм

 

 

2

 

 

2

 

 

 

 

 

 

 

 

 

 

 

 

 

X

1

 

 

X

 

 

 

 

 

 

 

 

 

68