Файл: А.В. Бирюков Индуктивная статистика.pdf

Скачать файл (0,16Мб)

Заказать решение

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 02.06.2024

Просмотров: 45

Скачиваний: 0

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Аналогичным образом решается задача для M выборок с объемами N . В этом случае решение дает статистика

C =	12 (D12 + ... DM2 )	− 3(MN +1).
	MN 2 (MN +1)

Если найденное значение статистики меньше критического (табл. 9), то все выборки принадлежат одной и той же генеральной совокупности.

						Таблица 9
M −1	2	3	4	5	6	7
C	6,0	7,8	9,5	11	13	14
M −1	8	9	10	11	12	13
C	16	17	18	20	21	22
M −1	14	15	16	17	18	19
C	24	25	26	28	29	30
M −1	20	21	22	23	24	25
C	31	33	34	35	36	37

Приведем пример сравнения двух выборок по критерию Вилкоксона. Имеются выборки: 1) 1, 1, 3, 4, 5; 2) 1, 2, 6, 7, 8. Элементы объединенной совокупности

1, 1, 1`, 2`, 3, 4, 5, 6`, 7`, 8`
имеют ранги 2, 2, 2, 4, 5, 6, 7, 8, 9, 10. При этом C1 =18 ,	C2 = 7 . Иско-
мая статистика C = 7 больше критического значения,	которое при

N = 5 равно 4. Следовательно, обе данные выборки принадлежат одной генеральной совокупности.

3. КОРРЕЛЯЦИЯ

Рассмотрим две случайные величины X и Z , которые из некоторых априорных соображений будем считать связанными друг с другом. Отвлекаясь от истинного характера этой взаимосвязи, остановимся лишь на близости этой зависимости к линейной, называемой корреляцией.

3.1. Коэффициент корреляции

Пусть имеются результаты одновременного наблюдения за двумя случайными величинами

(X k , Z k ), k =1,2,...N .

Вычислим статистику

C = (XZ − X Z )S 1 S 2 ,

называемую выборочным коэффициентом корреляции. Здесь XZ - среднее произведение, а S1 и S2 – выборочные стандарты.

Эта статистика может принимать значения в интервале от -1 до +1. Если найденное значение превосходит критическое (табл. 10), то корреляция между случайными величинами значима.

N					Таблица 10
N	6	8	10	15	20
C	0,71	0,63	0,58	0,48	0,42
N	30	40	50	70	90
C	0,35	0,30	0,27	0,23	0,20

3.2. Ранговая корреляция

Пусть, как и прежде, имеются пары наблюдений

(X k , Zk ), k =1,2,...N .

Значения Xk и Zk независимо друг от друга расположим по воз-

растанию и ранжируем, приписывая ранги 1, 2, 3 и т.д. в порядке возрастания элементов выборок. Разность рангов у соответствующих друг

другу элементов Xk и Zk обозначим через Ek . Далее вычислим статистику Спирмена

C = 1 − 6(E12 + ... + EN2 )N (N 2 −1).

Корреляция признается значимой, если найденное значение статистики превосходит критическое (табл. 11).

N						Таблица 11
N	6	8	10	12	14	16
C	0,77	0,60	0,55	0,50	0,46	0,42
N	18	20	22	24	26	28
C	0,40	0,38	0,36	0,34	0,33	0,32

3.3. Адекватность регрессии

Если при проверке гипотезы о корреляции оказалось, что корреляция значима, то правомерно искать линейную зависимость между X и Z , называемую регрессией или регрессионной моделью. Используя метод наименьших квадратов, найдем эту модель в виде

Z = Z +W (X − X ),

где угловой коэффициент регрессии равен

W = (XZ − X Z )(X 2 − X 2 ).

Здесь X , Z – выборочные средние; XZ - среднее произведение;

X 2 – средний квадрат; X 2 – квадрат среднего.

Для проверке адекватности найденной модели необходимо найти две дисперсии – остаточную дисперсию S 2 , характеризующую точ-

ность модели, и дисперсию воспроизводимости S02 , характеризующую

уровень шума, т.е. совокупное влияние случайных факторов. Для вычисления последней необходимо иметь дублирующие (параллельные) наблюдения, т.е. значения Z при фиксированном значении X . Диспер-

сия параллельных наблюдений равна S02 .

Для вычисления остаточной дисперсии найдем сумму квадратов разностей между экспериментальными и вычисленными по модели

значениями Z . Разделив эту сумму на N −2 , где N – число пар на-

блюдений (объем выработки), получим остаточную дисперсию S 2 . Если при сравнении по какому-либо критерию (Пиллаи или Фи-

шера) окажется, что различие между дисперсиями S 2 и S02 незначимо, то найденная регрессионная модель адекватна.

4. ФАКТОРНЫЙ АНАЛИЗ

Рассмотрим некоторый сложный процесс с выходным параметром X . Таким процессом является, например, работа какого-либо предприятия, эффективность которой характеризуется выходным параметром – себестоимостью выпускаемой продукции.

На вариацию значений выходного параметра влияет множество различных факторов. Из некоторых априорных соображений (напри-

F1 , F2 , F3

мер, из предыдущего опыта) выделим из множества факторов основную группу, подлежащую изучению. Ограничимся случаем, когда основная группа состоит из двух факторов F , G . Кроме них на выходной параметр оказывает влияние множество случайных факторов. Поэтому общая дисперсия значений выходного параметра является суммой факторных дисперсий и дисперсии случайности, т.е.

S 2 = S12 + S 22 + S 02 .

Задача факторного анализа состоит в представлении общей дисперсии в виде такой суммы, а также в оценке силы влияния каждого фактора. Рассмотрим последовательно факторный анализ с одним и двумя основными факторами.

4.1. Однофакторный анализ

Для конкретности допустим, что фактор F варьируется на трех уровнях и на каждом уровне имеется по три параллельных на-

блюдения. Тогда соответствующая матрица значений выходного параметра имеет вид

X11	X 21	X 31
X12	X 22	X 32
X13	X 23	X 33

Здесь первый индекс у элемента матрицы соответствует уровню фактора. Введем следующие обозначения:

U1 ,U2 ,U3 – сумма элементов в столбцах матрицы;

Q – сумма квадратов всех элементов матрицы;

Q1 = (U12 +U 22 +U 32 )3 ;

P – квадрат суммы всех элементов матрицы, деленный на 9; SF2 – вспомогательная дисперсия.

Тогда имеют место следующие формулы:

S02 =(Q −Q1 ) 6 ;

SF2 =(Q1 −P) 2.

Если различие между дисперсиями SF2 и S02 , проверяемое по како- му-либо критерию, оказывается значимым, то исследуемый фактор

Смотрите также файлы

А.В. Бирюков Дифференциальная геометрия.pdf

А.В. Бирюков Дискретная математика.pdf

А.В. Бирюков Графы. Методические указания к изучению раздела программы курса математики для студентов всех специальностей.pdf

Л.П. Грунина Русский язык и культура речи.pdf

Л.П. Грунина Русский язык и культура речи. Программа, планы семинарских занятий для студентов дневной формы обучения.pdf

Файл: А.В. Бирюков Индуктивная статистика.pdf

Смотрите также файлы

Информация

Списки файлов

Дополнительно