Файл: Лекции_по_дисциплине.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 20.04.2024

Просмотров: 418

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тарова Инна Николаевна

связанные со случайной выборкой, при увеличении ее объема переходят в нормальное.

Однако следует отметить, что в природе встречаются экспериментальные распределения, для описания которых модель нормального распределения малопригодна.

Плотность вероятностей нормально распределенной случайной величины задается формулой

 

 

1

 

( x a)2

 

f (x)

 

 

e 2 2

, x (8.12)

 

 

 

2

 

 

 

 

 

Здесь а и — параметры распределения. Иногда используют краткое обозначение N(a, ).

График плотности (нормальная кривая) представлен на рис.8.4. f(x)

а - 2 а - а а + а + 2 х

Рис. 8.4. Плотность вероятностей нормального распределения

Можно сказать, что нормальное распределение это совокупность объектов, в которой крайние значения некоторого признака — наименьшее и наибольшее — появляются редко; чем ближе значение признака к математическому ожиданию, тем чаще оно встречается. Например, распределение студентов по их весу приближается к нормальному распределению. Математическое ожидание и дисперсия случайной величины , распределенной как N(a, 2), равны:

M =a, D = 2

(8.13)

Диаграмма нормального распределения симметрична относительно точки а, то есть положительные и отрицательные равновеликие отклонения от центра распределения (математического ожидания)

142


Компьютерное моделирование

встречаются одинаково часто. Поэтому медиана нормального распределения равна а. При этом в точке а функция f(x) достигает сво-

его максимума, который равен 1 /( 2 ). Параметр а характеризует положение диаграммы функции на числовой оси (параметр положения). При х —> ± функция f(x) стремится к нулю.

Параметр а характеризует степень сжатия или растяжения (плотности) диаграммы. Чем больше а, тем «шире» кривая, а ее максимальная высота ниже. Кривая как бы растягивается в стороны.

В выделенную на рис. 8.4 область от а- до а+ нормально распределенная случайная величина попадает с вероятностью 0,683. В пределы от -2 до +2 случайная величина попадает с вероятностью 0,955, а в пределы от -3 до +3 — с вероятностью 0,997. Последняя закономерность трактуется как правило трех сигм.

Формула (8.13) описывает целое семейство нормальных кривых, зависящих, как было сказано ранее, от двух параметров — а и , которые могут принимать любые значения, поэтому существует бесконечно много нормально распределенных совокупностей.

Особую роль играет нормальное распределение с параметрами а=0 и а=1, то есть распределение N(0,1), которое часто называют

стандартным или нормированным нормальным распределением.

Плотность стандартного нормального распределения вычисляют по формуле:

Функция распределения стандартного нормального распределения равна:

В Excel для вычисления значений нормального распределения используются функции НОРМРАСП, НОРМСТРАСП, НОРМОБР, НОРМСТОБР и НОРМАЛИЗАЦИЯ.

Функция НОРМРАСП вычисляет значения вероятности нормальной функции распределения для указанного среднего и стандартного

143

Тарова Инна Николаевна

отклонения. Эта функция имеет очень широкий круг приложений в статистике, включая проверку гипотез.

Функция имеет параметры — НОРМРАСП (х; среднее; стан-

дартное_откл.; интегральная). Здесь:

х — значение, для которого строится распределение;

среднее — среднее арифметическое распределения;

стандартное_откл — стандартное отклонение распределения;

интегральная — логическое значение, определяющее форму функции. Если интегральная имеет значение ИСТИНА, то функция НОРМРАСП возвращает интегральную функцию распределения; если это аргумент имеет значение ЛОЖЬ, то

вычисляет значение функция плотности распределения.

Если среднее=0 и стандартное_откл=1, то функция НОРМРАСП возвращает стандартное нормальное распределение, то есть НОРМСТРАСП.

Функция НОРМСТРАСП используется для вычисления стандартного нормального интегрального распределения. Это распределение имеет среднее равное нулю и стандартное отклонение равное единице. Эта функция может использоваться вместо таблицы для стандартной нормальной кривой.

Функция имеет параметры — HOPMCTPACП(z), где z — значение случайной величины, для которого строится распределение.

Функция НОРМОБР вычисляет значения квантилей для указанного среднего и стандартного отклонения (решения уравнения F(x) =р).

Функция имеет параметры — НОРМОБР(вероятность; среднее; стандартное_откл). Здесь:

вероятность — вероятность, соответствующая нормальному распределению;

среднее — среднее арифметическое распределения;

стандартное_откл — это стандартное отклонение распределения;

Функция НОРМСТОБР аналогична функции НОРМОБР в случае,

если среднее = 0 и стандартное_отклонение = 1. При этом исполь-

144


Компьютерное моделирование

зуется стандартное нормальное распределение. Единственным параметром функции НОРМСТОБР является вероятность;

Функция НОРМАЛИЗАЦИЯ позволяет по значению х и параметрам распределения найти нормализованное значение, соответствующее заданному х. Формат функции — НОРМАЛИЗАЦИЯ(х; сред-

нее; стандартное_отклоне-ние).

8. 4. ДРУГИЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

На практике помимо уже рассмотренных биномиального и нормального распределений часто приходится сталкиваться со случайными величинами, распределенными по равномерному закону, закону Пуассона, с показательным распределением, а также использовать распределения, связанные с нормальным: хи-квадрат, Стьюдента и Фишера.

8.4.1. Равномерное распределение

Равномерное распределение вероятностей является простейшим и может быть как дискретным, так и непрерывным.

Дискретное равномерное распределение — это такое распределе-

ние, для которого вероятность каждого из значений случайной величины одна и та же, то есть: P(x)=1/N, где N — количество возможных значений случайной величины.

Для непрерывного равномерного распределения плотность вероятности и функция распределения определены формулами:

Графики обеих функций представлены на рис. 8.5.

Рис. 8.5. Плотность вероятности и функция распределения для непрерывного равномерного закона распределения

145

Тарова Инна Николаевна

8.4.2. Распределение Пуассона

Распределение Пуассона — это дискретное распределение. Оно проявляется в ситуациях, когда в течение определенного отрезка времени или на определенном пространстве происходит случайное число каких-либо событий (число радиоактивных распадов, выпадение частиц аэрозоля, случаи заболеваний и т. п.).

Случайная величина , которая принимает только целые неотрицательные значения 0, 1, 2,..., имеет закон распределения Пуассона с параметром > 0, если

где = пр — интенсивность. Основное отличие этого закона распределения — резко выраженная асимметрия. Если в биномиальном распределении обозначить вероятность одного события через р, то вероятность другого события q будет равна (1-р). Распределение этих событий будет тем асимметричней, тем больше различаются р и q. В крайнем случае, когда p очень мало, a q, соответственно, близко к 1 (или наоборот), получается крайне асимметричное распределение — распределение Пуассона. Особенностью этого распределения является то, что дисперсия и среднее арифметическое при таком распреде-

лении равны между собой.

 

M = , D =

(8.14)

Равенство дисперсий и среднего в распределении Пуассона позволяет проводить ориентировочную оценку эмпирических (опытных) распределений.

Например, если в ходе статистической обработки дискретных рядов, получены среднее и дисперсия, которые равны между собой, то распределение можно считать, подчиняющимся закону Пуассона.

Распределение Пуассона и биномиальное распределение связаны между собой, а также с нормальным распределением и рядом других.

В Excel для вычисления значений пуассоновского распределения используется функция ПУАССОН (х; среднее; интегралъный). Она

146


Компьютерное моделирование

позволяет вычислить вероятность заданного числа появлений событий х при заданном значении среднего.

8.4.3. Показательное распределение

Показательное распределение (экспоненциальное) — это непре-

рывное распределение. Обычно используется в задачах массового обслуживания и в задачах, связанных с «временем жизни». Так, например, распределены интервалы между обращениями граждан во многие организации.

Положительная случайная величина X имеет показательное распределение с параметром > 0, если ее плотность задана функцией:

р(х, ) = е- х (х>=0).

(8.15)

Математическое ожидание и дисперсия случайной величины X, распределенной по показательному закону с параметром , равны:

MX=1/ , DX=1/ 2. (8.16)

В Excel для вычисления значений показательного распределения используется функция ЭКСРАСП (х ;лямбда; интегралъный). Она позволяет вычислить вероятность заданного значения функции х при заданном значении параметра лямбда.

8.4.4. Распределение хи-квадрат

Это непрерывное распределение, связанное с нормальным. Если случайные величины 1, 2, … , n независимы, и каждая из них имеет стандартное нормальное распределение N(0,1), то случайная величина n2 определенная как:

имеет распределение хи-квадрат с п степенями свободы. Математическое ожидание и дисперсия случайной величины n2

равны:

 

M n2 =n, D n2 =2n.

(8.17)

В Excel для вычисления значений распределения хи-квадрат используются функции ХИ2РАСП (x; степени_свободы) и ХИ2РОБ (вероятностъ; степени_свободы), которые при заданном числе сте-

147

Тарова Инна Николаевна

пеней свободы вычисляют вероятность (по заданному значению n2 для которого требуется вычислить распределение) и значение случайной величины n2 (по заданной вероятности), соответственно.

8.4.5. Распределение Стьюдента

Это также непрерывное распределение, связанное с нормальным. Если случайные величины 1, 2, … , n независимы, и каждая из них имеет стандартное нормальное распределение N(0,1), то случайная

величина:

имеет распределение, называемое распределением Стьюдента. Математическое ожидание и дисперсия случайной величины равны:

Mtn=0, Dtn=n/(n-2)

(8.18)

В Excel для вычисления значений распределения Стьюдента ис-

пользуются функции СТЬЮДРАСП (x; степени_свободы; хвосты) и СТЬЮДРАСПОБР (вероятность; степени_свободы), которые при заданном числе степеней свободы вычисляют вероятность (по заданному численному значению х, для которого требуется вычислить распределение) и t — значение распределения Стьюдента (по заданной вероятности), соответственно.

8.4.6. F-распределение (Фишера)

Это также непрерывное распределение, связанное с нормальным. Если случайные величины и 1, 2, … , n (n и m — натуральные числа) — независимы, и каждая из них имеет стандартное нормальное распределение N(0,1), то случайная величина Fm,n:

имеет F-распределение с параметрами m и п, называемыми степенями свободы. Математическое ожидание и дисперсия случайной величины Fmn равны:

148


Компьютерное моделирование

В Excel для вычисления значений F-распределения используются функции FРАСП и FРАСПОБР (x; cmeneни_cвободы1; cmeneни_cвободы2), которые при заданном числе степеней свободы т и п вычисляют вероятность (по заданному численному значению Fm,n для которого требуется вычислить распределение) и численное значение Fm,n (по заданной вероятности), соответственно.

8.4.7. Другие распределения в Excel

Excel позволяет также рассчитывать параметры еще нескольких распределений вероятностей. К ним относятся бета-распределение (функции БЕТАРАСП и БЕТАОБР), распределение Вейбулла (функция ВЕЙБУЛЛ), гамма-распределение (функции ГАММАРАСП и ГАММАОБР), гипергеометрическое распределение (функция ГИПЕРГЕОМЕТ), распределение Паскаля (функция ОТРБИНОМРАСП) и логнормальное распределение (функции ЛОГНОРМ-

РАСП и ЛОГНОРМОБР).

8.5. ГЕНЕРАЦИЯ СЛУЧАЙНЫХ ЧИСЕЛ

Еще одним аспектом использования законов распределения вероятностей является генерация случайных чисел. Бывают ситуации, когда необходимо получить последовательность случайных чисел. Это, в частности, требуется для моделирования объектов, имеющих случайную природу, по известному распределению вероятностей. Например, можно использовать нормальное распределение для моделирования совокупности данных по росту индивидуумов, или использовать биномиальное распределение для двух вероятных исходов, чтобы описать совокупность результатов бросания монетки.

В этом случае можно воспользоваться процедурой Генерация случайных чисел, которая является одним из инструментов пакета анализа. Эта процедура используется для заполнения диапазона случайными числами, извлеченными из одного или нескольких распределений.

149

Тарова Инна Николаевна

Можно также воспользоваться функциями из категории Математические Мастера функций: СЛЧИС() (в результате ее выполнения на листе вычислений будет получено равномерно распределенное случайное число, большее или равное 0 и меньшее 1) и СЛУЧМЕЖДУ() (в результате будет получено случайное число, лежащее между произвольными заданными значениями).

Вслучае использования процедуры Генерация случайных чисел необходимо заполнить рабочие поля диалогового окна Генерация случайных чисел.

Вполе Число переменных вводится число столбцов значений, которые необходимо разместить в выходном диапазоне. Если это число не введено, то все столбцы в выходном диапазоне будут заполнены.

Вполе Число случайных чисел вводится число случайных значений, которое необходимо вывести для каждой переменной. Каждое случайное значение будет помещено в строке выходного диапазона. Если число случайных чисел не будет введено, все строки выходного диапазона будут заполнены.

Вполе Распределение необходимо выбрать тип распределения, которое следует использовать для генерации случайных переменных.

Вих число входят:

равномерное — характеризуется верхней и нижней границами. Переменные извлекаются с одной и той же вероятностью для всех значений интервала. Обычно приложения используют равномерное распределение в интервале 0...1;

нормальное — характеризуется средним значением и стандартным отклонением. Обычно приложения для этого распределения используют среднее значение 0 и стандартное отклонение 1;

биномиальное — характеризуется вероятностью успеха (величина р) для некоторого числа попыток. Например, можно сгенерировать случайные двухальтернативные переменные по числу попыток, сумма которых будет биномиальной случайной переменной;

дискретное — характеризуется значением и соответствующим

150