ВУЗ: Смоленский областной казачий институт промышленных технологий и бизнеса
Категория: Лекция
Дисциплина: Методы обработки экспериментальных данных
Добавлен: 29.10.2018
Просмотров: 477
Скачиваний: 34
Множественная корреляция
Пусть случайная величина Y зависит от величин Такую корреляцию называют множественной. Уравнение линейной множественной регрессии ищется в виде:
.
Используемая выборка состоит из n наборов соответствующих значений величины Y, где Коэффициенты находятся по выборке методом наименьших квадратов.
Как и в случае линейной парной регрессии, средние значения должны удовлетворять этом уравнению:
.
Это позволяет, исключив коэффициент , записать уравнение регрессии в виде:
Такая запись уравнения весьма удобна и позволяет понизить на единицу порядок системы нормальных уравнений.
Пример. В течение 7 месяцев фирма давала рекламу своего товара по телевидению и в печати. Ежемесячные расходы на рекламу (, а также доход фирмы от продажи товара (Y) в тыс. у.е. сведены в таблице:
Y |
||
100 |
100 |
500 |
140 |
100 |
550 |
100 |
140 |
570 |
120 |
120 |
570 |
140 |
100 |
560 |
100 |
140 |
580 |
140 |
140 |
590 |
Получить по таблице уравнение регрессии
,
на основании которого предложить эффективную рекламную политику.
Решение. Уравнение регрессии будем искать в виде
Из таблицы находим: Переопределенная система линейных уравнений, даваемая выборкой, примет вид:
После сокращения и удаления уравнения, не содержащего неизвестных, получаем:
Соответствующая нормальная система запишется в виде:
Ее решение: Полученные значения коэффициентов регрессии свидетельствуют о том, что реклама по телевидению убыточна , а реклама в печати, наоборот, приносит некоторый доход . Поэтому относительно среднего уровня вложения в рекламу по телевидению следует снизить, направив освободившиеся средства на рекламу в печати.
4.Метод наименьших квадратов
Пусть величина Y является линейной комбинацией величин
неизвестные коэффициенты которой нужно найти. Для этого величинам придается n наборов значений и измеряются соответствующие значения Y. Это дает для определения следующую систему линейных уравнений:
где обозначает значение величины в
Минимальное число необходимых для этого уравнений n равно l. Если определитель системы отличен от нуля, что обычно и имеет место на практике, то система имеет при единственное решение. Если же число уравнений n больше числа неизвестных l, то так как любые n из уравнений системы являются независимыми, а остальные – их следствиями, теоретически можно выбрать любую подсистему из l уравнений и решить ее. На практике, однако, каждое измерение величины Y неизбежно связано с погрешностью. Это приводит к тому, что система при оказывается несовместной. Если же из нее выбрать подсистему из l уравнений, то полученные значения коэффициентов будут зависеть от этого выбора.
Для разрешения данной ситуации еще в начале XIX века немецким математиком Гауссом и французским математиком Лежандром был предложен прием, получивший название метода наименьших квадратов, который стал одним из основных способов обработки экспериментальных данных. Фактически, этот прием уже использовался нами при определении коэффициентов линейной и параболической парной корреляции. Теперь этот важный метод будет рассмотрен в общем виде.
Уравнения системы пытаются удовлетворить приближенно. В качестве меры близости берется сумма квадратичных уклонений левых частей от свободных членов. Решением по методу наименьших квадратов называется набор , доставляющий минимум функционала
Отметим, что если система допускает точное решение, то минимальное значение F оказывается равным нулю, и решение по методу наименьших квадратов является точным решением. Практически же для более точного нахождения неизвестных коэффициентов систему стараются переопределить как можно сильнее, увеличивая число уравнений n. Если ошибку в измерении величины Y считать, как обычно делается в теории ошибок, нормально распределенной случайной величиной с нулевым математическим ожиданием, то такой метод может быть обоснован теоретически как доставляющий значения , наиболее близкие к их действительным значениям.
Условия минимума F является равенство нулю частных производных:
что дает для определения систему l линейных уравнений с l неизвестными, которая называется системой нормальных уравнений.
Если ввести матрицу A исходной системы уравнений, вектор-столбец свободных членов y и вектор-столбец неизвестных a:
то в матричном виде систему нормальных уравнений можно записать как
где матрица, получаемая из матрицы A транспонированием.
Матрица нормальной системы является квадратной симметрической матрицей. Ее элементы равны скалярному произведению i-го и j-го столбцов матрицы A.
Пример: Дана система точек, координаты которых указаны в таблице, число точек
x |
0 |
1 |
2 |
3 |
4 |
|
y |
0 |
2 |
3 |
3,5 |
3 |
4,5 |
Требуется построить прямую с уравнением .
Решение: Очевидно, что точки с данными координатами не могут быть расположены на одной прямой, а построить прямую как бы «сглаживающую» эти точки, можно. Для этого достаточно решить систему уравнений, приведенную в соответствующей теоретической части. Для удобства расчетов строим рабочую таблицу:
№ |
|||||||
1 |
0 |
1 |
0 |
0,81 |
0,81 |
0,6561 |
|
2 |
0 |
2 |
0 |
0 |
1,55 |
0,2025 |
|
3 |
1 |
3 |
1 |
3 |
2,29 |
0,5041 |
|
4 |
2 |
3,5 |
4 |
7 |
3,03 |
0,2209 |
|
5 |
3 |
3 |
9 |
9 |
3,77 |
0,77 |
0,5929 |
6 |
4 |
4,5 |
16 |
18 |
4,51 |
0,01 |
0,0001 |
9 |
16 |
31 |
37 |
|
|
2,1766 |
|
|
|
|
|
Первый столбец обозначает номер по порядку записи точек (координат). Из сумм столбцов при составляются коэффициенты системы
Для определения параметров прямой Система имеет вид:
Решим ее методом определений:
Искомое уравнение