Файл: По модулю Планирование эксперимента Москва, 2021.pptx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 12.12.2023

Просмотров: 30

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

по модулю Планирование эксперимента

Москва, 2021

ОСНОВНЫЕ ПОНЯТИЯ

ОСНОВНЫЕ ПОНЯТИЯ


.

Математическая статистика – раздел математики, посвящённый математическим методам систематизации, обработки и использования статистических данных для научных и практических выводов.

Метод исследования, опирающийся на рассмотрение статистических данных о тех или иных совокупностях объектов, называется статистическим.

Статистическими данными мы называем сведения о числе объектов в какой-либо более или менее обширной совокупности, обладающих теми или иными признаками

Планирование эксперимента - это постановка опытов по некоторой заранее составленной схеме; средство построения математической модели реального процесса; и способ сокращения средств и времени.

Где мы можем использовать планирование эксперимента и для чего нам это надо?

При осуществлении поиска оптимальных показателей;
    • При поиске эффективных технико‑технологических решений (управляющие воздействия);
    • При осуществлении поиска оптимальных рецептур многокомпонентных систем и параметров режима бурения

При совершенствовании технологии производства
    • При обеспечении перехода на автоматизированное управление процессом;
    • При прогнозировании технологических параметров;

При оценке качества процесса
    • При обеспечении надежности и достоверности результатов исследований
    • Для повышения эффективности труда ИТР, сокращении сроков и затрат на исследования

Первичный статистический анализ

Понятие о генеральной совокупности и выборке


Генеральной совокупностью называется полный набор всех значений, которые принимает или может принять случайная величина

Часть генеральной совокупности из n значений случайных величин, выделенных из этой совокупности, называется выборкой

Выборки объемом до 30 значений случайных величин (СВ) условно принято считать малыми, а свыше 30 – большими

При определении объема выборки следует помнить, что ошибка выводов
уменьшается в корень квадратный из n раз

В выборку можно включать только данные, относящиеся к исследуемой генеральной совокупности;

Все значения СВ, принадлежащие к исследуемой генеральной совокупности, должны иметь одинаковую возможность быть включенными в выборку;

Выборка должна быть репрезентативной (представительной), т.е. она должна включать в себя достаточное число значений случайной величины для представления об особенностях генеральной совокупности

1. Составление вариационного ряда (в порядке возрастания)

2. Определение размаха вариационного ряда

3. Выбор числа интервалов разбиения k вариационного ряда

4. Определение длины интервала разбиения (шага)

Нижняя граница первого интервала

Частость - это относительная частота попадания СВ в i‑й интервал (число значений СВ в определенном интервале, отнесенное к общему объему выборки).

Гистограмма – ступенчатая фигура, состоящая из прямоугольников с основанием в виде отрезков, соответствующих длинам интервалов, и высотами, соответствующими частостям.

7. Определяют закон распределения случайной величины

6. Строят в масштабе гистограмму

Закон распределения СВ – это соотношение, устанавливающее связь между возможными значениями СВ и соответствующими им вероятностями.

Таблица 1


Рис.1. Гистограмма

1 2 xi

k

X

Р

Рис. 2. Кривая распределения

Понятие «частость» (i) для генеральной совокупности заменяется на понятие «вероятность» (i). При n   i = i .

С ростом числа интервалов, будет уменьшаться их длина и ломаная линия гистограммы превратится в плавную кривую (рис. 2). При этом, относящееся к выборке понятие частость (ωi) для генеральной совокупности, заменяется на понятие вероятность (ρi): n → ∞ ωi = ρi.

Нормальный закон распределения Гаусса
  • Хорошо изучен, методика проста и отработана;
  • При увеличении объёма выборки, целый ряд других законов стремятся превратиться в НЗ

1). Количество вариантов (значений СВ), превышающих среднее значение, равно количеству вариантов, которые меньше его (примерная симметричность диаграммы).

2). Частота вариантов тем больше, чем ближе к среднему значению они расположены (гистограмма имеет наибольшие ординаты в центре и наименьшие – у краев).



Вывод: если результаты измерений вызывают сомнение в применимости нормального закона, увеличьте объём выборки!

Рис.3. Графическое представление нормального распределения

По своему виду кривые нормального распределения могут быть:

-    нормальновершинными;

-   туповершинными;

-    островершинными (рис. 4);

-    иметь положительную асимметрию (рис.5а);

-    иметь отрицательную асимметрию (рис.5б).

Рис. 4. Кривые нормального распределения

Рис. 5. Кривые нормального распределения с положительной и отрицательной асимметрией

АСИММЕТРИЧНЫЕ ЗАКОНЫ РАСПРЕДЕЛЕНИЯ

Логарифмически-нормальный закон ЛНЗ (умеренная асимметрия)

Экспоненциальный закон (резко асимметричная кривая распределения)

В крепких и монолитных породах, (выход керна 100%), распределение асимметричное, сдвинуто в сторону больших значений (рис.6,а). В рыхлых нецементированных породах, (выход керна  0, асимметрия распределения правосторонняя (рис.6,b).

Рис.6. Логарифмически-нормальное распределение

ЛНЗ (имеет место, когда значения случайной величины ограничены некоторыми пределами) обладает умеренно асимметричной кривой распределения; экспоненциальный закон (период надёжности и долговечности работы оборудования) имеет резко асимметричную кривую распределения

8) Находят точечные оценки параметров нормального распределения СВ.

Правила определения оценок для параметров нормального распределения по совокупности независимых измерений СВ регламентируются ГОСТ 11.004 ‑ 74.

СТАТИСТИЧЕСКИЕ ВЕЛИЧИНЫ И ПАРАМЕТРЫ

Среднее арифметическое (все варианты имеют одну и ту же частоту, равную единице)

Характерно для малых выборок

Наиболее достоверная оценка измеряемой СВ

Среднее взвешенное

( 5 )

Характерно для больших выборок

МЕДИАНА (m0,5) – это значение случайной величины, которое делит вариационный ряд или площадь, ограниченную кривой распределения, на две равные части.

При нечётном объёме выборки медиана равна:

При чётном:

МОДОЙ (m0) называют варианту, имеющую наибольшую частоту, соответствующую вершине распределения (наиболее вероятное значение СВ)

Для нормального симметричного распределения


не визуальная, а расчётная проверка на нормальность

СТЕПЕНЬ РАЗБРОСА (РАССЕИВАНИЯ) ОТДЕЛЬНЫХ ЧАСТЕЙ СВ ОТНОСИТЕЛЬНО ЕЕ СРЕДНЕГО ЗНАЧЕНИЯ

РАЗМАХОМ (R) называется разность между наибольшим (xmax) и наименьшим (xmin) вариантами

ДИСПЕРСИЕЙ (D) называется среднее арифметическое значение квадратов отклонений отдельных вариант от их средней арифметической

Среднее квадратичное отклонение (δ) это значение корня квадратного из дисперсии

Коэффициент вариации ()

это отношение среднего квадратичного отклонения к среднему значению СВ, выраженное в процентах

Более информативной оценкой среднего взвешенного значения является интервальная оценка, заключающаяся в установлении некоторого интервала, внутри которого с определенной вероятностью и находится истинное значение, т. е. генеральная средняя исследуемой СВ.

Если среднее взвешенное значение , найденное по результатам анализа выборки объемом n, является точечной оценкой математического ожидания а, то чем меньше разность (а  x), тем точнее оценка

Величина Δ, являющаяся пределом, который с определенной вероятностью не превосходит разность, называется предельной ошибкой выборки

Величина Δ в выражении являющаяся пределом, который с определенной вероятностью не превосходит разность, называется предельной ошибкой выборки

Вероятность того, что действительное значение измеряемой величины лежит в пределах

представляет собой доверительную вероятность

где:

Р - доверительная вероятность (статистическая надежность);

  уровень значимости.

В технике, в большинстве случаев надежность P принимается равной 0,9÷0,95 (90  95%). Надежности равной 0,8; 0,9; 0,95, соответствуют уровни значимости α, равные соответственно 0,2 (20%); 0,1 (10%); 0,05 (5%). Для нормального распределения СВ это означает, что вероятность выхода за границу составляет соответственно в 20, 10 и 5% случаев.

Зная предельную ошибку выборки Δ, можно определить доверительный интервал, в котором заключена генеральная средняя

Интервал,

который с заданной доверительной вероятностью или надежностью Р покрывает оцениваемый параметр, называется доверительным интервалом

Предельную ошибку выборки определяют по формуле Стьюдента


Статистический анализ малых выборок (n<30)

I. Проверка принадлежности имеющихся данных нормальному закону распределения с помощью критерия Шапиро‑Уилка (W)

1). Упорядочиваем выборку (составляем вариационный ряд)

3). Определяем вспомогательную величину

L = (n-1)/2

нечётный

L= n/2чётный объём выборки

2). Вычисляем сумму квадратов отклонений - S2 (x):

4). Находим расчетное значение критерия

5)Находим табличное значение критерия Шапиро ‑ Уилка – Wt при заданном (выбранном) уровне значимости α по следующим формулам:

6)Сравниваем расчетное значение критерия Шапиро ‑ Уилка с табличными:

при W > Wt можно считать, что распределение СВ подчиняется нормальному закону;

Если соотношение не выполняется, то необходимо увеличить объём выборки или осторожно отнестись к выводам, особенно к величине доверительного интервала

Например, при n = 10 WТ(0.05) = 0.838; n = 25 WТ(0.1) = 0.935

II. Рассчитаем среднее арифметическое значение СВ:

III. Оценим характеристики степени разброса экспериментальных данных относительно среднего арифметического значения

Дисперсию D

Среднее квадратичное отклонение

Коэффициент вариации

IV. Зададимся величиной уровня значимости α и рассчитаем предельную ошибку выборки – Δ

V. Находим доверительный интервал для математического ожидания (генеральной средней)

Отбраковка резко выделяющихся результатов (промахов)

Значения, которые весьма существенно отличаются от других и появляются, как правило, вследствие грубых ошибок субъективного происхождения, называются ошибками

ОШИБКИ ОБУСЛОВЛЕНЫ

неправильным использованием измерительной техники

ошибками в отчетах по измерительным приборам

ошибками в записях экспериментальных данных

ошибками в вычислениях при обработке результатов измерений

ПРАВИЛА И КРИТЕРИИ ОТБРАКОВКИ

Правило трёх сигм (используется при объёме выборки n > 50)

«Вероятность попадания СВ в интервал от до

равна 0,997 (99,7 %)»

Если такая надежность приемлема, то все значения случайной величины, отклоняющиеся от среднего взвешенного или среднеарифметического больше, чем на 3δ, отбрасываются, как маловероятные

Задача

Вывод: в данной выборке резко выделяющихся замеров нет.