Файл: Лекции_по_дисциплине.pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 20.04.2024

Просмотров: 421

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тарова Инна Николаевна

Принято считать, что асимметрия в какой-то степени характеризует несимметричность распределения случайной величины, а эксцесс

— степень выраженности «хвостов» распределения, то есть частоту появления удаленных от среднего значений. Иногда значения асимметрии и эксцесса используют для проверки гипотезы о том, что данные (выборка) над которыми велось наблюдение, принадлежат заданному семейству распределений, например нормальному. Так, для любого нормального распределения асимметрия равна нулю, а эксцесс — трем.

Для случайных величин, принимающих вещественные значения, часто используются такие характеристики, как квантили.

Квантилью хр случайной величины, имеющей функцию распределения F(x), называется решение хр уравнения F(x) =p, где р — заданная вероятность.

Величина хр часто называется р-квантилью или квантилью уровня р распределения F(x). Среди квантилей чаще всего используют ме-

диану и квартили распределения.

Медианой называется квантиль, соответствующая значению р = 0,5. Верхней квартилью называется квантиль, соответствующая значению р = 0,75. Нижней — квантиль, соответствующая значению р =

0,25.

В описательной статистике нередко используют децили, то есть квантили уровней 0,1; 0,2;...; 0,9. Значение децилей позволяет неплохо представлять поведение графика у = F(x) в целом.

Отметим, что уравнение F(x) =p, определяющее р-квантили, для некоторых значений р, 0<p< 1, может не иметь решений либо иметь неединственное решение. Для соответствующей случайной величины это означает, что некоторые р-квантили не существуют, а некоторые определены неоднозначно.

В MS Excel для вычисления некоторых числовых характеристик дискретных распределений вероятностей могут быть использованы специальные функции СРЗНАЧ, ДИСПР, СТАНДОТКЛОНП, КВАРТИЛЬ и ПЕРСЕНТИЛЬ.

СРЗНАЧ — вычисляет математическое ожидание для всей сово-

136

Компьютерное моделирование

купности значений дискретной случайной величины;

ДИСПР— позволяет оценить дисперсию дискретного распределения;

СТАНДОТКЛОНП — вычисляет стандартное отклонение дискретного распределения;

КВАРТИЛЬ — позволяет определить квартили распределения. Функция КВАРТИЛЬ имеет формат КВАРТИЛЬ (массив; значение). Массив представляет собой интервал ячеек, содержащих все значения дискретной случайной величины, или сами значения, а значение определяет, какая квартиль должна быть найдена (0 — минимальное значение распределения, 1 — нижний квартиль, 2 — медиана, 3 — верхний квартиль, 4 — максимальное значение распределения).

ПЕРСЕНТИЛЬ позволяет получить р-квантили заданного распределения.

8.2. ЗАКОНЫ РАСПРЕДЕЛЕНИЯ ВЕРОЯТНОСТЕЙ

Зная распределения вероятностей интересующих нас случайных величин, можно делать выводы о событиях, в которых участвуют эти величины. Правда, эти выводы будут также носить случайный характер.

Среди всех вероятностных распределений есть такие, которые на практике используют особенно часто. Эти распределения детально изучены, и свойства их хорошо известны. Многие из этих распределений лежат в основе целых областей знания — таких как теория массового обслуживания, теория надежности, теория измерений, теория игр и т. п.

Большинство применяемых на практике распределений являются дискретными или непрерывными. Среди дискретных распределений наиболее важные — биномиальное и пуассоновское, среди непрерыв-

ных — нормальное, показательное и распределения, связанные с нормальным: Стьюдента, хи-квадрат и F-распределение Фишера. Далее будут рассмотрены некоторые из наиболее важных распределений вероятностей.

137


Тарова Инна Николаевна

8.2.1. Биномиальное распределение

Биномиальное распределение — это одно из самых распростра-

ненных дискретных распределений, оно служит вероятностной моделью для многих явлений. Оно возникает в тех случаях, когда нас интересует, сколько раз происходило некоторое событие в серии из определенного числа независимых наблюдений (опытов), выполняемых в одинаковых условиях. При этом распределении разброс вариант (в простейшем случае есть событие или нет события) является следствием влияния ряда независимых и случайно сочетающихся факторов.

Примером дискретной случайной величины, подчиняющейся биномиальному закону распределения, является число появлений события А при выполнении п испытаний. Возможными значениями этой случайной величины т являются 0,1,2,.., n.

Если для каждого отдельного испытания ввести случайную величину , которая может принимать только два значения — 1 с вероятностью р и 0 с вероятностью q=(1-р), то соответствующие вероятности появления т успешных (то есть 1) случайных величин вычисляются по формуле:

p

(m)

n!

p m q n m C m p m q n m

(8.10)

 

 

n

 

m!(n m)!

n

 

 

 

 

 

Формула (8.10) называется формулой Бернулли. Условие равенства суммы всех вероятностей единице (8.3) легко проверяется. В самом деле, поскольку (8.10) представляет собой выражение для общего члена разложения бинома Ньютона, то, имея в виду, что р+q=1, находим:

n

n

n!

 

pn

(m)

p m q n m ( p q)n 1

 

 

m!(n m)!

m 0

m 0

 

 

 

 

Таким образом, выражение (8.10) определяет распределение случайной величины — числа появлений события А при п испытаниях. Это распределение, вследствие того, что оно имеет такой же вид, как и общий член разложения бинома Ньютона, называют биномиальным распределением.

138


Компьютерное моделирование

Если число испытаний п велико, а вероятность р реализации события А в одном испытании не очень близка к нулю и не очень близка к единице, то маловероятно, чтобы событие А при п испытаниях случилось очень малое число раз или число раз, близкое к п. Очевидно, что при т, равном малому числу единиц, вероятность pn(т) растет с увеличением т, а для т, близких к п, она убывает при увеличении т.

Математическое ожидание и дисперсия случайной величины, имеющей биномиальное распределение, соответственно, равны:

MA=np, DA=np(1-p) (8.11)

Эти выражения легко получить, если А представить в виде:

A= 1+ 2+…+ n

где случайные слагаемые в данной формуле статистически независимы и одинаково распределены. Для любого k от 0 до п выполняется M k=p, D k=p(1-p), поэтому, согласно свойствам математического ожидания и дисперсии («Числовые характеристики распределения вероятностей»): MA = пМ , DA = nD , что и приводит к указанным выше выражениям (8.11).

При большом количестве испытаний биномиальное распределение стремится к нормальному (рис. 8.3).

Рис. 8.3. Биномиальные распределения при различных р и п

Примером практического использования биномиального распределения может являться контроль качества партии фармакологического препарата. Здесь требуется подсчитать число изделий (упаковок), не соответствующих требованиям. Все причины, влияющие на качество препарата, принимаются одинаково вероятными и не зависящими друг от друга. Сплошная проверка качества в этой ситуации

139

Тарова Инна Николаевна

не возможна, поскольку изделие, прошедшее испытание, не подлежит дальнейшему использованию. Поэтому для контроля из партии наудачу выбирают определенное количество образцов изделий (п). Эти образцы всестороннее проверяют и регистрируют число бракованных изделий (т). Теоретически число бракованных изделий может быть любым, от 0 до п, но вероятности этих чисел различны. В основе принятия решения лежит сравнение распределения результатов контроля, то есть данных, полученных опытным путем, и теоретического распределения, при котором гарантируется необходимое качество всей партии — достаточно низкая вероятность брака P(m<k), где k — предельное число бракованных изделий.

В Excel для вычисления вероятности отдельного значения биномиального распределения или значения случайной величины по заданной вероятности используются функции БИНОМРАСП и КРИТБИНОМ.

Функция БИНОМРАСП применяется для вычисления вероятности в задачах с фиксированным числом тестов или испытаний, когда результатом любого испытания может быть только успех или неудача, испытания независимы, и вероятность успеха постоянна на протяжении всего эксперимента.

Функция использует следующие параметры — БИНОМРАСП

(число_успехов; число_испытаний; вероятностъ_успеха; интегралъ-

иая). Здесь:

число_ успехов — это количество успешных испытаний;

число_испытаний — это число независимых испытаний. При этом число успехов и число_испытаний являются целыми числа-

ми;

вероятность_ успеха — это вероятность успеха каждого испытания;

интегральная — это логическое значение, определяющее форму функции. Если аргумент интегральная имеет значение ИСТИНА (1), то функция БИНОМРАСП возвращает интегральную функцию распределения, то есть вероятность того, что число успешных испытаний не менее значения аргумента число_ успехов; если

140



Компьютерное моделирование

этот аргумент имеет значение ЛОЖЬ (0), то вычисляется значение функции плотности распределения, то есть вероятность того, что число успешных испытаний в точности равно значению ар-

гумента число_ успехов.

Интегральное биномиальное распределение имеет следующий вид:

k

k

n!

 

P(k) pn (m)

p m q n m

 

 

 

 

m 0

m 0 m!(n m)!

 

Функция КРИТБИНОМ вычисляет наименьшее значение числа успешных исходов случайной величины, для которого интегральное биномиальное распределение больше или равно заданной величине (критерию). Эта функция наиболее часто используется в приложениях, связанных с контролем качества. Функция использует параметры:

КРИТБИНОМ (число_испытаний; вероятностъ_успеха; алъфа).

Здесь:

число_испытаний — это число независимых двухальтернативных испытаний;

вероятность_yспеха — это вероятность успеха в каждом испытании;

альфа — это значение критерия, которое фактически является уровнем значимости.

8.3. НОРМАЛЬНЫЙ ЗАКОН РАСПРЕДЕЛЕНИЯ

Большинство экспериментальных исследований в биологии, медицине, технике и других областях связаны с измерениями, результаты которых могут принимать практически любые значения в заданном интервале, и описываются моделью непрерывных случайных величин. Одним из важнейших непрерывных распределений являет-

ся нормальное, или гауссово распределение.

Нормальное распределение получило широкое распространение для приближенного описания многих случайных явлений, в которых на результат воздействует большое количество независимых случайных факторов, среди которых нет сильно выделяющихся. Например, рассеяние снарядов при стрельбе. Кроме того, многие распределения,

141