Файл: Лекция_3.4.Элементы теории корреляции.doc

Вентцель, Е.С. Теория вероятностей [Текст] / Е.С. Вентцель. – М.: Высшая школа, 2006. – 575 с.
Гмурман, В.Е. Теория вероятностей и математическая статистика [Текст] / В.Е. Гмурман. - М.: Высшая школа, 2007. - 480 с.
Кремер, Н.Ш. Теория вероятностей и математическая статистика [Текст] / Н.Ш. Кремер - М: ЮНИТИ, 2002. – 543 с.

Во многих задачах требуется установить и оценить зависимость изучаемой случайной величины Y от одной или нескольких других величин. Рассмотрим сначала зависимость Y от одной случайной (или неслучайной, т.е. принимающей заданные значения) величины X (В дальнейшем неслучайную переменную будем обозначать x.). А затем от нескольких величин.

П.1. Линейная регрессия.

Предположим, что форма функциональной зависимости между переменными x и y, называемая моделью, известна с точностью до параметров и имеет вид

. (1)

Функция f при этом называется функцией регрессии величины Y на X, а соотношение (1) – уравнением регрессии Y на X. Требуется по результатам наблюдений (выборки) ,, найти оценки неизвестных параметров.

Задачами регрессионного анализа являются:

1) установление формы зависимости. Как правило, эта форма становиться известной по опытным данным, где точками на ДПСК отмечены значения выборок (измерений);

2) определение функции регрессии (1). Процесс нахождения функции регрессии называется выравниванием отдельных значений зависимой переменной;

3) оценка неизвестных значений зависимости переменной y по оценкам параметров, входящих в уравнение регрессии.

В качестве примера функции регрессии рассмотрим линейные функции , называемыерегрессионными прямыми или прямыми регрессии.

Пусть - наблюдаемые (точные) значения, а- приближённое значениеy_i, вычисленное из уравнения регрессии. Тогда величина есть отклонение приближённого значенияот точногоy_i.

По методу наименьших квадратов неизвестные параметры α и β прямой регрессии находятся из условий минимизации суммы квадратов отклонений, т.е. из условий минимизации функции:

Таким образом, получим следующие формулы для определения α и β:

;

. (2)

Если требуется по экспериментальным данным получить линейное уравнение регрессии X на Y, то в уравнении регрессии надо поменять переменныеx и y. При этом получим уравнение , гдеивычисляются по формулам:

;

. (3)

Отметим, что регрессионные прямые иразличны. Первая прямая получается в результате решения задачи о минимизации суммы квадратов отклонений по вертикали, а вторая – при решении задачи о минимизации суммы квадратов отклонений по горизонтали.

На практике для нахождения уравнений регрессии составляется следующая таблица:

В этой таблице в последней строке суммы и определяют коэффициенты α и β или ив формулах (2) или (3) соответственно.

Пример 1. По данным таблицы наблюдений

x_i	2	4	6
y_i	5	3	7

Составить уравнение регрессии Y на X и X на Y.

Решение: Составим таблицу:

По формулам (2) при n=3 получаем:

; .

Следовательно, уравнение регрессии Y на X есть:

Аналогично по формулам (3) находим:

;

Отсюда уравнение X на Y есть

Нетрудно видеть, что регрессионные прямые идействительно различны.

(Конец примера)

Если число измерений велико, то с целью упрощения расчётов экспериментальные данные нужно группировать, т.е. объединять в таблицу, называемую корреляционной: