Файл: И государственной службы при президенте российской федерации.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 26.10.2023

Просмотров: 131

Скачиваний: 24

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Федеральное государственное бюджетное образовательное
учреждение высшего образования
«РОССИЙСКАЯ АКАДЕМИЯ НАРОДНОГО ХОЗЯЙСТВА
И ГОСУДАРСТВЕННОЙ СЛУЖБЫ
ПРИ ПРЕЗИДЕНТЕ РОССИЙСКОЙ ФЕДЕРАЦИИ»
СЕВЕРО-ЗАПАДНЫЙ ИНСТИТУТ УПРАВЛЕНИЯ
Факультет экономики и финансов
Кафедра бизнес-информатики
Задание расчетно-графической работы по теории вероятности и
математической статистике
Вариант 4
Автор работы:
студент 2 курса учебной группы БИ-3-21-08 очной формы обучения
Гусейнов Руслан Арифович
Руководитель работы:
Доцент
Полянская Светлана Владимировна
Санкт-Петербург
2023г.

2
Оглавление
Задание расчетно-графической работы по теории вероятности и математической статистике ............................................................................................................................ 1
Оглавление ........................................................................................................................... 2
ВВЕДЕНИЕ .......................................................................................................................... 3
Задание 1. ............................................................................................................................. 4 1.1
Составить интервальный вариационный ряд; ......................................................... 4 1.2
Вычислить относительные частоты; вычислить эмпирическую функцию распределения; ..................................................................................................................... 5 1.3
Построить графики (гистограммы) относительных частот и эмпирической функции распределения; ..................................................................................................... 6 1.4.
Вычислить выборочные: среднее значение, дисперсию, среднеквадратическое отклонение и определить выборочные моду и медиану, коэффициенты асимметрии, эксцесса, вариации, децильный и квартильный коэффициенты вариации. Сделать вывод
8 1.5.
Вычислить точечные и интервальные оценки генеральной средней, генеральной дисперсии и среднеквадратического отклонения с доверительной вероятностью 0,95. 12 1.6
Найти необходимый объем выборки для определения генерального среднего с предельной ошибкой 0,8 с доверительной вероятностью 0,05. ....................................... 13 1.7
Проверить гипотезу о том, что генеральная совокупность имеет нормальное распределение на уровне значимости 0,05........................................................................ 13 1.8
Проверить гипотезу о том, что генеральная совокупность имеет равномерное распределение на уровне значимости 0,03........................................................................ 14 1.9
Проверить гипотезу о том, что генеральная совокупность имеет показательное распределение на уровне значимости 0,02. ...................................................................... 16
Задание 2. ........................................................................................................................... 18
Задание 3. ........................................................................................................................... 22
Задание 4. ........................................................................................................................... 26
Задание 5. ........................................................................................................................... 29


3
ВВЕДЕНИЕ
В современном мире теория вероятности и математическая статистика широко применяются в различных областях науки и техники. Они позволяют оценивать риски и вероятности событий, анализировать данные и принимать важные решения на основе статистических выводов. В данной расчетно- графической работе будет проведен анализ данных и рассчитаны вероятности событий с использованием различных статистических методов. Работа будет полезна для студентов, изучающих теорию вероятности и математическую статистику, а также для специалистов, работающих в области анализа данных и прогнозирования.

4
Задание 1.
Для 100 элементов из заданной статистической совокупности (см файл
«Данные для расчетно-графической работы. 1-ая часть»).
1.1
Составить интервальный вариационный ряд;
По условию дана статистическая совокупность, состоящая из 100 вариантов. И на первом шаге нам требуется сформировать интервальный вариационный ряд. Так как данный ряд у нас предоставлен в едином столбце, то мы упорядочиваем его с помощью фильтра в Excel и выбираем «Сортировка по возрастанию». Благодаря этому мы отсортировали ряд и можем указать минимальное и максимальное значения предоставленного ряда.
Минимальное значение (????
????????????
) = Началу отсортировнного ряда или же ячейке B3. Так же можно найти минимальное значение вариационного ряда через встроенную функцию Excel =МИН(B3:B102).
Минимальное значение (????
????????????
) = -3,34.
Максимальное значение (????
????????????
) находится аналагично, как и минимальное, только тут мы выделяем последнюю ячейку нашего ряда B102 или встроенная функция Excel =МАКС(B3:B102).
Максимальное значение (????
????????????
) = 19,57.
Размах вариации R вычислим по формуле: из максимального значения одиночное левое вычитаем минмиальное =19,57-(-3,34)=22,91.
R=22,91.
Оптимальное количество интервалов (k) на которое нужно разделить весь диапазон в пределах которого варьируется значения. Можно использовать рекомендательную формулу Стерджесса. Формула в Excel выглядит следующим образом, =1+ЦЕЛОЕ(LOG(100;2)). k=7.

5
Длина частичного интервала (h) состовляет R/k, таким образом h=3,2734146.
Далее,округляем h до целого числа в большую сторону по функции Excel
=ОКРУГЛВВЕРХ(F7;0). h=4.
По каждому частичному интервалу мы допустили перебор. Из 4 вычитаем
3,2734146 и получаем перебор равный 0,0034146. По 7 интервалам наш перебор получился 0,0239. Делим на 2 и получаем 0,01195, что означает отступ по половине ребра.
Начинаем строить наш интервальный вариационный ряд:
Интервалы n
i
∑n i
w i
w i
/h w
n
-3,35
-0,08 4
4 0,04 0,012232 0,04
-0,08 3,19 6
10 0,06 0,018349 0,10 3,19 6,46 9
19 0,09 0,027523 0,19 6,46 9,73 27 46 0,27 0,082569 0,46 9,73 13,00 28 74 0,28 0,085627 0,74 13,00 16,27 15 89 0,15 0,045872 0,89 16,27 19,54 10 99 0,1 0,030581 0,99 19,54 22,81 1
100 0,01 0,003058 1,00 n
i
– частоты по интервалам.
W
i
– относительные частоты, чтобы их найти нужно разделить текущие частоты на объем совокупности. w
i
/h – плотности на интервалах. Текущая относительная частота делиться на длину частичного интервала.
Таким образом, интервальный вариационный ряд составлен.
1.2
Вычислить
относительные
частоты;
вычислить
эмпирическую функцию распределения;
Эмпирической функцией распределения (функцией распределения выборки) называют функцию F* (x), определяющую для каждого значения х относительную частоту события Х. F* (x)=n х/ n где n х – число вариант, меньшее


6 х, n – объем выборки. Таким образом, для того, чтобы найти, например F* (x 2), надо число вариант, меньшее x 2, разделить на объем выборки n: F* (x 2)=n х /n.
Прежде всего определяется объем выборки, в нашем случае он равняется
100. Далее рассчитываем относительные частоты и относительные накопленные частоты. w
i w
n
0,04 0,04 0,06 0,10 0,09 0,19 0,27 0,46 0,28 0,74 0,15 0,89 0,1 0,99 0,01 1,00
1.3
Построить графики (гистограммы) относительных частот и
эмпирической функции распределения;
X
Y
-3,35 0
-3,35 0,04
-0,08 0,04
-0,08 0
-0,08 0,06 3,19 0,06 3,19 0
3,19 0,09 6,46 0,09 6,46 0
6,46 0,27 9,73 0,27

7 9,73 0
9,73 0,28 13,00 0,28 13,00 0
13,00 0,15 16,27 0,15 16,27 0
16,27 0,1 19,54 0,1 19,54 0
19,54 0,01 22,81 0,01 22,81 0
-10 0
-3,35 0
-0,08 0,04 3,19 0,1 6,46 0,19 9,73 0,46 13,00 0,74 16,27 0,89 0
0.05 0.1 0.15 0.2 0.25 0.3
-5.00 0.00 5.00 10.00 15.00 20.00 25.00
Гистограмма относительных частот

8 19,54 0,99 22,81 1
25 1
1.4. Вычислить
выборочные:
среднее
значение,
дисперсию,
среднеквадратическое отклонение и определить выборочные моду и
медиану, коэффициенты асимметрии, эксцесса, вариации, децильный и
квартильный коэффициенты вариации. Сделать вывод
Для вычисления выборочного среднего нужно найти середины интервалов, поэтому складываем границы интервала и делим на 2:
Среднее
-6,87738 9,303937 43,38591 218,4477 318,0984 219,4598 179,0066 21,17066 0
0.2 0.4 0.6 0.8 1
1.2
-15
-10
-5 0
5 10 15 20 25 30
Эмпирическая функция распределения

9
Формула Excel: =СУММ(M13:M20)/G21
Среднее значение = 10,019956.
Формула нахождения дисперсии:
∑(????
????
−????
ср
)^2∗????
????
. Для начала высчитываем
∑ ???????? числитель:
Дисп
551,24 430,37 243,29 100,50 50,33 318,88 621,05 124,34
И теперь подставляем в формулу: =СУММ(N13:N20)/(G21).
Дисперсия=24,4.
Среднее квадратическое отклонение: √???? = √24,4= 4,939.
Мода: ???? + ℎ
????
2
−????
1
, где
????

10
– начало модального интервала; ℎ –
0
(????
2
−????
1
)+(????
2
−????
3
)
0 величина интервала; ????
2
–частота, соответствующая модальному интервалу;
????
1
– предмодальная частота; ????
3
– послемодальная частота. Выбираем в качестве начала интервала 9,73, так как именно на этот интервал приходится наибольшее количество. Высчитываем по формуле: =E17+((G17-G16)/((G17-
G16)+(G17-G18)))*F8
Мода=9,959.
Медиана делит выборку на две части: половина меньше медианы, половина — больше. Медиана: ???? +

(
∑ ????
i
− ???? ) , где ????
– начало модального
0
????
2 2
1 0 интервала; ℎ – величина интервала; ????
2
–частота, соответствующая модальному интервалу; ????
1
– предмодальная накопленная частота. Медиана =
=E17+F8*(G21/2-H16)/G17.
Медиана=10,192.
Асимметрия находится по формуле
Σ(????
????
−????
????????
)
3
∗????
????
???? ????
3
. Находим 3 центральный момент по формуле
Σ(????
????
−????
????????
)
3
∗????
????
????
= -37,56. Далее находим коэффициент асимметрии: As = -0,311. As < 0, значит распределение скошено влево.
Для расчета коэффициента эксцесса используется такая формула:
М4
− 3.
????
4
Поэтому надо рассчитать четвертые центральные моменты:


11
????
4
≈ 1746,891.
Коэффициент эксцесса: ≈ −0,06585389.
Коэффициент вариации:
????
????
ср
∗ 100% = 49%
Децильный коэффициент вариации:
????9
∗ 100%. Для этого надо найти
????
1 первый и девятый децили. ???? = ???? +

(
∑ ????
i
− ???? ) , где ????
– начало модального
1 0
????
2 10 1
0 интервала; ℎ – величина интервала; ????
2
–частота, соответствующая модальному интервалу; ????
1
– предмодальная накопленная частота. ????
1
== ????14 + (????14 −
????14) ∗ ((1/10 ∗ ????21 − ????13)/????14) = 3,185656. ????
9
= ????19 + (????19 − ????19) ∗
((9/10 ∗ ????21 − ????18)/????19) = 16,59. Таким образом, 10% единиц совокупности будут меньше по величине 3,185656; 90% будут заключены между 3,185656 и 16,59; остальные превосходят 16,59. Децильный коэффициент вариации:
????9
= 5,20855.
????
1
Квартильный коэффициент вариации:
????3−????1
∗ 100%. Находим сначала
????
3
+????
1 первый квартиль: ???? = ???? +

(
∑ ????
i
− ???? ) , где ????
– начало модального
1 0
????
2 4
1 0 интервала; ℎ – величина интервала; ????
2
–частота, соответствующая модальному интервалу; ????
1
– предмодальная накопленная частота. ????
1
= ????16 + ????8 ∗ (1/4 ∗
????21 − ????15)/????16 = 7,182323. Третий квартиль: ????
3
= ????18 + ????8 ∗ (3/4 ∗ ????21 −
????17)/????18 = 13,21366. Квартильный коэффициент вариации:
????3−????1
∗ 100% =
????
3
+????
1 29%.
Выводы:

Среднее, медиана и мода имеют близкие значения, что значит наше распределение близко к нормальному.

Слабая левосторонняя скошенность и распределение почти симметрично.

12

Меньше 0, поэтому распределение более сглажено по сравнению с нормальным распределением.

49%-данные неоднородные.

Нижние значения в 5 раз больше верхних.

Небольшой размах, узкое распределение.
1.5. Вычислить точечные и интервальные оценки генеральной средней,
генеральной дисперсии и среднеквадратического отклонения с
доверительной вероятностью 0,95.
Чтобы найти точечную оценку для генеральной средней, используется формула: ???? = ????
????
, где
????
− квантиль нормального распределения. Для
???? √???? его нахождения:
????
2Ф(????
????
) = 0,95
Ф(????
????
) =
0,95
=0,475 2
????
????
= 1,96
Следовательно, точечная оценка генеральной средней равна 10,02.
Чтобы найти точечную оценку для генеральной дисперсии, используется формула:
∑(????
????
−????
ср
)^2∗????
????
≈ 24,6466.
∑ ???????? −1
Интервальная оценка генеральной дисперсии находится: ???? =
[
????
2
(????−1)
;
????
2
(????−1)
, где

- «кси»
= [19; 33,26].
????
21+????
2
????
21−????
]
2
Чтобы найти точечную оценку для генерального среднеквадратического отклонения, используется формула: √????
2
= 4,9645.


13

21−????
Интервальная оценка генерального среднеквадратического отклонения находится: ???? = [√
????
2
(????−1)
;
????
21+????
2
????
2
(????−1)
] = [4,35889; 5,76718].
????
2
1.6
Найти необходимый объем выборки для определения
генерального среднего с предельной ошибкой 0,8 с доверительной
вероятностью 0,05.
Λ=0,05.
Ошибка для определения генерального среднего равняется 0,8.
Найдем критическую точку через формулу: =ХИ2.ОБР.ПХ(0,8;7-2).
Получается, что критическая точка равняется 2,34253406.
Также найдем tλ с доверительным интервалом 0,05 через формулу:
=СТЬЮДРАСПОБР(0,05;100-1)=1,984217.
Необходимый объем выборки: =ОКРУГЛВНИЗ(AC62(точечная оценка дисперсии)^2*W36(tλ )/0,8^2;0)=151.
Необходимый объем выборки для определения генерального среднего с предельной ошибкой 0,8 с доверительной вероятностью 0,05 равняется 151.
1.7
Проверить гипотезу о том, что генеральная совокупность
имеет нормальное распределение на уровне значимости 0,05.
Итак, на уровне значимости 0,05 нам нужно проверить нулевую гипотезу, о том, что генеральная совокупность распределена нормально против конкурирующей гипотезы о том, что она таковой не является.
Выдвигаем гипотезы:

14 1
(????−????)
2
????
0
: ????(????) =
????

????√2????
2????
2 1
(????−????)
2
????
1
: ????(????) ≠
????

????√2????
2????
2
Переходим от интервального вариационного ряда к дискретному. Потом вычисляем выборочное среднее и выборочное среднее квадратического отклонения. Рассчитываем суммы. Находим теоретические частоты и так далее.
????2 наблюдаемое найдем как сумму столбца (p????−mp????′)/2mp????′, тогда. ????^2набл=
4,30277.
Уровень значимости α=0,05. Количество степеней свободы k=m-r-1=6-2-
1=2.
χ
2
находим с помощью формулы =ХИ2ОБР (0,05;3). χ
2
(0,05;3)=7,814. кр кр
Вывод: Так как X^2 наблюдаемое меньше X^2 критического, то мы принимаем данную гипотезу, что значит генеральная совокупность скорее всего распределена нормально при данном уровне значимости.
1.8
Проверить гипотезу о том, что генеральная совокупность
имеет равномерное распределение на уровне значимости 0,03.
Уровень значимости α для проверки гипотезы о равномерном распределении выборочной совокупности 2 выбираем равным 0,03, а число степеней свободы r определяется по формуле r=k-3.

15
Выдвигаем гипотезы:
1
????
0
: ????(????) =
???? − ????
1
????
1
: ????(????) ≠
???? − ????
Проверять гипотезы будем с помощью критерия согласия Пирсона.
Определяем выборочное среднее ???? =
10,13441
, исправленную дисперсию и среднеквадратическое отклонение ???? =
5,250007
. Также нужно оценить параметры a и b - концы интервала, в котором наблюдались возможные значения X, по формулам:
???? = ???? − √3????; ???? = ???? + √3????
Подставив значения в формулу, получаем ???? = 1,04113; ???? =19,2277.
Составим расчетную таблицу:
Лев
Прав m
i
Ср
СКО p
i np i
набл.
-3,35 3,19 10 -0,84344 1044,229 0
0 0
3,19 6,46 9 43,38591 254,1235 0,297721 29,77215 14,49281 6,46 9,73 27 218,4477 112,7767 0,179803 17,98031 4,524656 9,73 13,00 28 318,0984 42,10329 0,179803 17,98031 5,583557 13,00 16,27 15 219,4598 303,244 0,179803 17,98031 0,494 16,26566 22,80566 11 214,8922 972,2185 0,162869 16,28691 1,71619 100 10,13441 5,250007 1
100 26,81121
Критерий Пирсона вычисляется по формуле:
????
χ
2
= ∑
????=1
(????
????
− ????????
????
)
2
????????
????
Теоритические частоты находим по формуле:
????
????
=
????
????
− ????
????−1
???? − ????

????
????
− нижняя граница интервала

????
????−1
− верхняя граница интервала