Файл: 1 Корреляция и взаимосвязь величин 2 Показатели корреляции.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 10.01.2024

Просмотров: 42

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.


C — число пар, у которых знаки отклонений значений от их средних совпадают.

H — число пар, у которых знаки отклонений значений от их средних не совпадают.

2.2.4. Коэффициент множественной ранговой корреляции (конкордации)





m — число групп, которые ранжируются.

n — число переменных.

Rij — ранг i-фактора у j-единицы.

Значимость:





, то гипотеза об отсутствии связи отвергается.

В случае наличия связанных рангов:





2.3. Свойства коэффициента корреляции

  • Неравенство Коши — Буняковского:

если принять в качестве скалярного произведения двух случайных величин ковариацию  , то норма случайной величины будет равна  , и следствием неравенства Коши — Буняковского будет:

.

  • Коэффициент корреляции равен   тогда и только тогда, когда X и Y линейно зависимы (исключая события нулевой вероятности, когда несколько точек «выбиваются» из прямой, отражающей линейную зависимость случайных величин):

,

где  . Более того в этом случае знаки   и k совпадают:

.

Доказательство

Рассмотрим случайные величины X и Y c нулевыми средними, и дисперсиями, равными, соответственно,   и  . Подсчитаем дисперсию случайной величины ξ = aX + bY:



Если предположить, что коэффициент корреляции




то предыдущее выражение перепишется в виде



Поскольку всегда можно выбрать числа a и b так, чтобы   (например, если  , то берём произвольное a и  ), то при этих a и b дисперсия  , и значит ξ = aX + bY = 0 почти наверное. Но это и означает линейную зависимость между X и Y. Доказательство очевидным образом обобщается на случай величин X и Y с ненулевыми средними, только в вышеприведённых выкладках надо будет X заменить на  , и Y — на  .

  • Если X,Y независимые случайные величины, то  . Обратное в общем случае неверно.

3. Корреляционный анализ

Корреляционный анализ — метод обработки статистических данных, с помощью которого измеряется теснота связи между двумя или более переменными. Корреляционный анализ тесно связан с регрессионным анализом (также часто встречается термин «корреляционно-регрессионный анализ», который является более общим статистическим понятием), с его помощью определяют необходимость включения тех или иных факторов в уравнение множественной регрессии, а также оценивают полученное уравнение регрессии на соответствие выявленным связям (используя коэффициент детерминации).[1][2]

3.1. Ограничения корреляционного анализа



Множество корреляционных полей. Распределения значений (xy) с соответствующими коэффициентами корреляций для каждого из них. Коэффициент корреляции отражает «зашумлённость» линейной зависимости (верхняя строка), но не описывает наклон линейной зависимости (средняя строка), и совсем не подходит для описания сложных, нелинейных зависимостей (нижняя строка). Для распределения, показанного в центре рисунка, коэффициент корреляции не определен, так как изменчивость 

y равна нулю.

  1. Применение возможно при наличии достаточного количества наблюдений для изучения. На практике считается, что число наблюдений должно быть не менее, чем в 5-6 раз превышать число факторов (также встречается рекомендация использовать пропорцию не менее, чем в 10 раз превышающую количество факторов). В случае, если число наблюдений превышает количество факторов в десятки раз, в действие вступает закон больших чисел, который обеспечивает взаимопогашение случайных колебаний.[13]

  2. Необходимо, чтобы совокупность значений всех факторных и результативного признаков подчинялась многомерному нормальному распределению. В случае, если объём совокупности недостаточен для проведения формального тестирования на нормальность распределения, то закон распределения определяется визуально на основе корреляционного поля. Если в расположении точек на этом поле наблюдается линейная тенденция, то можно предположить, что совокупность исходных данных подчиняется нормальному закону распределения.[14].

  3. Исходная совокупность значений должна быть качественно однородной.[13]

  4. Сам по себе факт корреляционной зависимости не даёт основания утверждать, что одна из переменных предшествует или является причиной изменений, или то, что переменные вообще причинно связаны между собой, а не наблюдается действие третьего фактора.[5]

3.2. Область применения

Данный метод обработки статистических данных весьма популярен в экономике и социальных науках (в частности в психологии и социологии), хотя сфера применения коэффициентов корреляции обширна: контроль качества промышленной продукции, металловедение, агрохимия, гидробиология, биометрия и прочие. В различных прикладных отраслях приняты разные границы интервалов для оценки тесноты и значимости связи.

Популярность метода обусловлена двумя моментами: коэффициенты корреляции относительно просты в подсчете, их применение не требует специальной математической подготовки. В сочетании с простотой интерпретации, простота применения коэффициента привела к его широкому распространению в сфере анализа статистических данных.

Примечания

  1. ↑ 1 2 3 Шмойлова, 2002, с. 272

  2. ↑ 1 2 Елисеева, Юзбашев, 2002, с. 232

  3. Елисеева, Юзбашев, 2002, с. 228

  4. Елисеева, Юзбашев, 2002, с. 228-229

  5. ↑ 1 2 Елисеева, Юзбашев, 2002, с. 229

  6. Суслов, Ибрагимов, Талышева, Цыплаков, 2005, с. 141

  7. Гмурман, 2004, с. 176-177

  8. ↑ 1 2 3 Гмурман, 2004, с. 177

  9. Гмурман, 2004, с. 178-179

  10. Шмойлова, 2002, с. 300

  11. Гмурман, 2004, с. 179

  12. Шмойлова, 2002, с. 301

  13. ↑ 1 2 Елисеева, Юзбашев, 2002, с. 230

  14. Шмойлова, 2002, с. 275


Литература

  • Гмурман В.Е. Теория вероятностей и математическая статистика: Учебное пособие для вузов. — 10-е издание, стереотипное. — Москва: Высшая школа, 2004. — 479 с. — ISBN 5-06-004214-6

  • Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. И.И. Елисеевой. — 4-е издание, переработанное и дополненное. — Москва: Финансы и Статистика, 2002. — 480 с. — ISBN 5-279-01956-9

  • Общая теория статистики: Учебник / Под ред. Р.А. Шмойловой. — 3-е издание, переработанное. — Москва: Финансы и Статистика, 2002. — 560 с. — ISBN 5-279-01951-8

  • Суслов В.И., Ибрагимов Н.М., Талышева Л.П., Цыплаков А.А. Эконометрия. — Новосибирск: СО РАН, 2005. — 744 с. — ISBN 5-7692-0755-8