ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 06.12.2023
Просмотров: 180
Скачиваний: 3
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
(угол близок к нулю), то связь сильная и близка к линейной. В случае промежуточного значения rxy (и угла) связь достаточно сильна и существенно нелинейная.
Пусть для изучаемой случайной величины X получен ряд ее значений x1, x2, …, xn, который называют выборкой объема n из множества всех возможных значений X (генеральной совокупности). Эти значения xi являются случайными величинами, так как меняются от выборки к выборке.
Важно, чтобы опыты для получения достоверных и правильно представляющих (репрезентативных) генеральную совокупность результатов проводились в одинаковых условиях и независимо друг от друга. Значит, случайные величины xi будут независимы и одинаково распределены. Согласно центральной предельной теореме (ЦПТ) распределение среднего значения будет приближаться к нормальному распределению при .
Если число n невелико ( ), то полученные значения можно упорядочить по величине и указать число повторений (частоту) каждого из значений: x1 < x2 < … < xk с частотами m1, m2, …, mk, где m1 + m2 + …+ mk = n (вариационный ряд). При большом числе наблюдений вводятся интервалы группировки , которые охватывают все значения вариационного ряда (причем, первое и последнее значения – с запасом). Интервалы выбираются равными, а их концы возможно более простыми (в целых точках или в целых десятках: 10, 20,…). Обычно удобно ввести не более двух-трех десятков таких интервалов. Например, если x1 = 0, …, xk = 20, то вводим промежутки [–10, 0], [0, 10], [10, 20], [20, 30]. Каждому интервалу сопоставляется его середина xi и частота mi, равная сумме частот значений ряда, попадающих в этот интервал. При этом для значения, попавшего на границу двух интервалов, частота делится пополам между ними. Таким образом, составляется сгруппированный вариационный ряд, для которого определяются относительные частоты (или эмпирические вероятности)
и эмпирические плотности . По этим данным строятся полигон эмпирического распределения (см. рис.1), гистограмма (рис.3) и эмпирическая функция распределения по накопленной эмпирической вероятности (рис.4).
Рис.3. Гистограмма
Рис.4. Эмпирическая функция
распределения
По теореме Бернулли (т.е. по следствию закона больших чисел) эмпирическая вероятность приближается к теоретической вероятности при , что справедливо и для значений эмпирической функции распределения и гистограммы на интервалах группировки.
Пример 14. Выборка задана вариационным рядом:
(k = 1,2,…,17).
Произвести группировку значений и по сгруппированному вариационному ряду построить эмпирическую функцию распределения и гистограмму плотности.
Решение. Вводим интервалы группировки:
(чтобы первое значение включалось с запасом),
, , , , (последнее значение включается с запасом).
Для сгруппированного вариационного ряда значения равны серединам интервалов: , , , , , , а частоты для этих значений (т.е. для интервалов ) получаем, складывая частоты значений , попавшие в соответствующий интервал группировки, причем для значения , попавшего на границу двух интервалов, частота делится между этими интервалами поровну:
Объем выборки
Эмпирические вероятности равны:
Отметим, что Если же значения вычисляются приближенно, то при подсчете следует взять запасные знаки за запятой и, округляя (до 0,01; затем до 0,001 и т.д.) найти те значения, при которых равенство выполнится.
Накопленные вероятности:
за : за и :
за , , :
за , , ,
2.ОСНОВЫ МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ
Пусть для изучаемой случайной величины X получен ряд ее значений x1, x2, …, xn, который называют выборкой объема n из множества всех возможных значений X (генеральной совокупности). Эти значения xi являются случайными величинами, так как меняются от выборки к выборке.
Важно, чтобы опыты для получения достоверных и правильно представляющих (репрезентативных) генеральную совокупность результатов проводились в одинаковых условиях и независимо друг от друга. Значит, случайные величины xi будут независимы и одинаково распределены. Согласно центральной предельной теореме (ЦПТ) распределение среднего значения будет приближаться к нормальному распределению при .
Если число n невелико ( ), то полученные значения можно упорядочить по величине и указать число повторений (частоту) каждого из значений: x1 < x2 < … < xk с частотами m1, m2, …, mk, где m1 + m2 + …+ mk = n (вариационный ряд). При большом числе наблюдений вводятся интервалы группировки , которые охватывают все значения вариационного ряда (причем, первое и последнее значения – с запасом). Интервалы выбираются равными, а их концы возможно более простыми (в целых точках или в целых десятках: 10, 20,…). Обычно удобно ввести не более двух-трех десятков таких интервалов. Например, если x1 = 0, …, xk = 20, то вводим промежутки [–10, 0], [0, 10], [10, 20], [20, 30]. Каждому интервалу сопоставляется его середина xi и частота mi, равная сумме частот значений ряда, попадающих в этот интервал. При этом для значения, попавшего на границу двух интервалов, частота делится пополам между ними. Таким образом, составляется сгруппированный вариационный ряд, для которого определяются относительные частоты (или эмпирические вероятности)
и эмпирические плотности . По этим данным строятся полигон эмпирического распределения (см. рис.1), гистограмма (рис.3) и эмпирическая функция распределения по накопленной эмпирической вероятности (рис.4).
Рис.3. Гистограмма
Рис.4. Эмпирическая функция
распределения
По теореме Бернулли (т.е. по следствию закона больших чисел) эмпирическая вероятность приближается к теоретической вероятности при , что справедливо и для значений эмпирической функции распределения и гистограммы на интервалах группировки.
Пример 14. Выборка задана вариационным рядом:
| 0 | 3 | 5 | 9 | 11 | 13 | 17 | 19 | 20 | 24 | 26 | 28 | 31 | 34 | 39 | 40 | 42 |
| 4 | 2 | 5 | 3 | 6 | 3 | 3 | 4 | 3 | 2 | 1 | 3 | 3 | 2 | 1 | 3 | 2 |
(k = 1,2,…,17).
Произвести группировку значений и по сгруппированному вариационному ряду построить эмпирическую функцию распределения и гистограмму плотности.
Решение. Вводим интервалы группировки:
(чтобы первое значение включалось с запасом),
, , , , (последнее значение включается с запасом).
Для сгруппированного вариационного ряда значения равны серединам интервалов: , , , , , , а частоты для этих значений (т.е. для интервалов ) получаем, складывая частоты значений , попавшие в соответствующий интервал группировки, причем для значения , попавшего на границу двух интервалов, частота делится между этими интервалами поровну:
Объем выборки
Эмпирические вероятности равны:
Отметим, что Если же значения вычисляются приближенно, то при подсчете следует взять запасные знаки за запятой и, округляя (до 0,01; затем до 0,001 и т.д.) найти те значения, при которых равенство выполнится.
Накопленные вероятности:
за : за и :
за , , :
за , , ,