Файл: Е.Н. Грибанов Теория вероятностей и математическая статистика. Методические указания для студентов специальности 230500 - Социальный сервис и туризм.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.06.2024
Просмотров: 257
Скачиваний: 0
-44-
30. Графическое изображение вариационного ряда. Графическое изображение вариационного ряда позволяет пред-
ставить в наглядной форме закономерности варьирования значений признака. Наиболее широко используются следующие виды графического изображения вариационных рядов: полигон, гистограмма, кумулятивная кривая.
Полигон, как правило, служит для изображения дискретного вариационного ряда. Для его построения в прямоугольной системе координат наносят точки с координатами (xi ;mi ), где xi -вариант, mi -
соответствующая ему частота. Иногда вместо точек (xi ;mi ) строят точки (xi ;ωi ). Затем эти точки последовательно соединяют отрезками в порядке возрастания xi . Полученная линия носит название по-
лигон частот или полигон относительных частот. Иногда интервальный ряд изображают с помощью полигона. В этом случае интервалы заменяют их серединными значениями и к ним относят интервальные частоты. Для полученного дискретного ряда строят полигон.
Гистограмма служит для изображения только интервального вариационного ряда. Для её построения в прямоугольной системе координат по оси абсцисс откладывают отрезки, изображающие интервалы варьирования, и на них строят прямоугольники с высотами, равными частотам (или частостям) соответствующего интервала. В результате получают ступенчатую фигуру, состоящую из прямоугольников, которую называют гистограммой.
Кумулятивная кривая (кривая накопленных частот или накопленных частостей) строится следующим образом. Если вариационный ряд дискретный, то в прямоугольной системе координат строят
точки с координатами (xi ;miнак ), где xi- вариант, тiнак - соответствующая накопленная частота. Иногда вместо точек (xi ;miнак )строят
точки (xi ;ωiнак ). Полученные точки соединяют отрезками.
Если вариационный ряд интервальный, то по оси абсцисс откладывают интервалы. Верхним границам интервалов соответствуют накопленные частоты (или накопленные частости); нижней границе первого интервала – накопленная частота, равная нулю. Построив кумулятивную кривую, можно приблизительно установить число наблюдений (или их долю в общем количестве наблюдений), в которых
-45-
признак принял значения, меньшие заданного. Иногда кумулятивную кривую называют кумулятой.
Пример 34. Построить полигон частот, гистограмму, кумуляту для интервального вариационного ряда.
Интервалы |
4 - 8 |
8 - 12 |
12 -16 |
16 - 20 |
20 –24 |
24 -28 |
Частоты |
4 |
6 |
12 |
14 |
8 |
6 |
Решение. Построим полигон частот. Вынесем на координатную плоскость точки (xi ;mi ), где xi - середины соответствующих интер-
валов, то есть точки (6;4),(10;6),(14;12),(18;14),(22;8),(26;6) . Соединив их ломаной кривой, получим полигон частот.
16
14
12
10
8
6
4
2
0
6 |
10 |
14 |
18 |
22 |
26 |
Для построения гистограммы отложим на оси абсцисс интервалы варьирования и на них как на основаниях построим прямоугольники высотами, равными соответствующим частотам.
16
14
12
10
8
6
4
2
0
[4 - 8] [8 - 12] [12 - 16] [16 - 20] [20 - 24] [24 - 28]
-46-
Для построения кумулятивной кривой отложим на координатной плоскости точки (4;0), (8;4), (12;10), (16;22), (20;36), (24;44), (28;45) и
соединим их ломаной линией, получим кумуляту.
60
50
40
30
20
10
0
4 |
8 |
12 |
16 |
20 |
24 |
28 |
31. Эмпирическая функция распределения Эмпирической функцией распределения случайной величины Х
называют функцию F * (x), определяющую для каждого значения х частость события (X < x): F * (x)= nnx , где пх – число вариантов хi,
меньших х; п – объём выборки.
Эмпирическая функция распределения обладает всеми свойствами интегральной функции распределения. Действительно, из определения эмпирической функции распределения следует, что:
1)значения эмпирической функции распределения принадлежат отрезку [0;1];
2)F * (x) - неубывающая функция;
3)если х1 - наименьшее, а хп – наибольшее наблюденное значе- )= 0 при x ≤ x1 и F * (x)=1 при x > xn .
Основное значение эмпирической функции распределения состоит в том, что она используется в качестве оценки функции распределения F (x)= p{X < x}.
Пример 35. Построить эмпирическую функцию распределения для интервального вариационного ряда
Варианты |
6 |
10 |
14 |
18 |
Частота |
4 |
8 |
6 |
2 |
-47-
Решение. Согласно определению эмпирическая функция распределения имеет вид
|
0 |
, |
x ≤ 6; |
|
0 |
,2, 6 < x ≤10; |
|
F * (x)= |
|
,5, 10 < x ≤14; |
|
0 |
|||
|
|
|
|
|
0 |
,8, 14 < x ≤18; |
|
|
|
|
|
|
|
|
x >18. |
|
1, |
И её график имеет вид
1,5
1
0,5
0
0 |
6 |
10 |
14 |
18 |
22 |
32. Средние величины Средние величины являются как бы «представителями» всего
ряда наблюдений, поскольку вокруг них концентрируются наблюдавшиеся значения признака. Заметим, что только для качественно однородных наблюдений имеет смысл вычислять средние величины.
Различают несколько видов средних величин: средняя арифметическая, средняя геометрическая, средняя гармоническая, средняя квадратическая, средняя кубическая и так далее. При выборе вида средней величины необходимо ответить на вопрос: какое свойство ряда мы хотим представить средней величиной или, иначе говоря, какая цель преследуется при вычислении средней? Это свойство, получившее название определяющего, и определяет вид средней. Понятие определяющего свойства впервые введено советским статистиком А. Я. Боярским.
Наиболее распространенной средней величиной является сред-
няя арифметическая. Пусть х1 , х2, K, хn - данные наблюдений; x -
средняя арифметическая. Свойство, определяющее среднюю арифметическую, формулируется следующим образом: сумма результатов наблюдений должна остаться неизменной, если каждое из них заме-
-48-
n |
n |
|
|
нить средней арифметической, то есть ∑ xi = ∑ |
x |
. Так как |
|
i =1 |
i =1 |
n
x = const , то ∑ xi = nx . Отсюда получаем следующую формулу для
i =1
вычисления средней арифметической по данным наблюдений:
1 n
x = n i∑=1xi . Если по наблюдениям построен вариационный ряд, то
средняя арифметическая x = n1 ∑ xi mi , где xi - вариант, если ряд
дискретный, и середина интервала, если ряд интервальный; mi -
соответствующая частота.
Очевидно, что если по данным наблюдений построен дискретный вариационный ряд, то обе формулы дают одинаковые значения средней арифметической. Если же по наблюдениям построен интервальный ряд, то средние арифметические, вычисленные по этим формулам могут не совпадать, так как во второй формуле значения признака внутри каждого интервала принимаются равными центрам интервалов. Ошибка, возникающая в результате такой замены, вообще говоря, очень мала, если наблюдения распределены равномерно вдоль каждого интервала, а не скапливаются к одноимённым границам интервалов.
Основные свойства средней арифметической.
1.Сумма отклонений результатов наблюдений от средней арифметической равна нулю, или сумма произведений отклонений вариантов от средней арифметической на соответствующие частоты равна нулю.
2.Если все результаты наблюдений уменьшить (увеличить) на одно и то же число, то средняя арифметическая уменьшится (увеличится) на это же число.
3.Если все результаты наблюдений уменьшить (увеличить) в одно и то же число раз, то средняя арифметическая уменьшится (увеличится) во столько же раз.
4.Средняя арифметическая алгебраической суммы соответствующих значений признака нескольких рядов наблюдений с одинаковым числом наблюдений равна алгебраической сумме средних арифметических этих рядов.
-49-
О.1. Среднюю арифметическую вычисленную по данным выборки называют выборочной средней.
Пример 36. Найти выборочную среднюю для выборки, представленной интервальным вариационным рядом
Интервалы |
|
3 - 7 |
7 - 11 |
11 - 15 |
15 - 19 |
|
19 - 23 |
|
23 – 27 |
|
||||||
Частоты |
|
6 |
9 |
|
11 |
12 |
|
8 |
|
|
4 |
Сум- |
||||
Решение. Середины интервалов равны: 5; 9; 13; 17; 21; 25. |
||||||||||||||||
ма частот равна n = ∑mi |
= 6 +9 +11+12 +8 + 4 = |
50. Тогда выбороч- |
||||||||||||||
ная средняя равна |
|
|
|
|
|
|
|
|
|
|
|
|||||
|
|
= |
1 |
(5 6 +9 9 +13 11+17 12+21 8 + |
25 4) |
= |
726 |
=14,52. |
|
|||||||
|
x |
|
||||||||||||||
|
|
|
|
|||||||||||||
|
|
|
50 |
|
|
|
|
|
|
50 |
|
|
33. Медиана и мода Наряду со средними величинами в качестве описательных ха-
рактеристик вариационного ряда применяют медиану и моду.
(~ )
О.1. Медианой Me называют значение признака, приходящее
на середину ранжированного ряда наблюдений.
Пусть проведено нечётное число наблюдений, то есть n = 2q −1,
и результаты наблюдений проранжированы и выписаны в следующий ряд x(1), x(2),K, x(q−1), x(q), x(q+1),K, x(n). Здесь x(i )- значение при-
знака, занявшее i-е порядковое место в ранжированом~ряду. На сере- |
|
дину ряда приходится значение x(q). Следовательно: Me = x(q). |
|
Если проведено чётное число наблюдений, то есть n = 2q , |
то на |
середину ранжированного ряда x(1),x(2),K,x(q−1),x(q),x(q+1),K,x(n) |
при- |
ходятся значения x(q) и x(q+1). В этом случае за медиану принимают
среднюю |
арифметическую значений |
x(q) и |
x(q+1), то |
есть |
|||||||||||||||
~ |
|
= |
(x |
(q) |
+ x |
(q+1) |
) |
|
. |
|
|
|
|
|
|
|
|
|
|
M |
e |
|
|
|
2 |
|
|
|
|
|
|
|
|
|
|
||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
||
|
|
Для интервального вариационного ряда медиана определяется |
|||||||||||||||||
|
|
|
|
|
|
|
|
|
|
n |
−m |
нак |
|
|
|
(0,5 −ωeнак ) |
|
||
|
|
|
|
|
|
~ |
|
|
|
|
|
e |
|
|
~ |
|
|
||
|
|
|
|
|
|
|
|
|
2 |
|
|
|
|||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|||||
по формуле Me = ae + h |
|
|
|
|
|
или |
Me = ae |
+ h |
|
, где |
|||||||||
|
|
me |
|
|
me |
||||||||||||||
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
ae - начало медианного интервала, то есть такого, которому соответствует первая из накопленных частот (накопленных частостей),