Файл: Лекция Методика обучения иностранным языкам как наука статистика.pdf
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 07.11.2023
Просмотров: 12
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Лекция 1. Методика обучения иностранным языкам как наука
«СТАТИСТИКА»
электронный образовательный ресурс
Каташинских Варвара Сергеевна,
доцент кафедры социологии и технологий ГМУ
Института государственного управления и предпринимательства УрФУ
Статистические связи и их показатели
Екатеринбург, 2020
Введение
Задача статистики – обнаружить (выявить) зависимости между показателями и дать им количественную характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как факторы, влияющие на изменение других (факторные), а вторые – как следствие, результат влияния первых (результативные).
2
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1. По характеру связи:
1.1. Функциональная связь (детерминированная) – связь между двумя переменными x и y, в результате которой определенному значению перемен-ной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно.
1.2. Стохастическая
(статистическая) связь – это связь, частным случаем которой является корреляционная, которая предполагает взаимодействие множества факторов, в том числе и случайных, – в этом случае выявить зависимости,
рассматривая единичный случай,
невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности .
3
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1.3. Корреляционная связь – частный случай стохастической связи (более узкое ее значение). Именно корреляционные связи являются предметом изучения статистики. Корреляционная связь – это связь, выявленная при большом числе наблюдений между одним и тем же значение х и разными значениями у в виде определенной зависимости, которая предполагает следующее соотношение –
каждому значению (х) соответствует среднее значение результативного признака/ов (у).
4
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
2. По тесноте связи:
2.1. Тесная связь – если значению факторного признака x соответствуют близкие друг к другу по значению, тесно расположенные вокруг своей сред-ней, значения результативного признака у.
2.2. Менее тесная связь – если значения результативного признака у при одном и том же значении факторного признака х сильно варьируются.
5
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
3. По направленности связи:
3.1. Прямая связь – это связь, при которой направление изменения результативного признака у совпадает с направлением изменения факторного признака x.
3.2. Обратная связь – связь, при которой значение факторного признака x увеличивается, а результативного у – уменьшается или наоборот.
6
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
4. По аналитическому выражению связи:
4.1. Прямолинейная связь – связь, в которой возрастанию величины факторного признака x соответствует непрерывный рост или непрерывный спад величины результативного признака у.
4.2. Криволинейная связь – связь, в которой возрастанию величины факторного признака x соответствует неравномерное изменение величины результативного признака у, вплоть до смены его общей направленности.
7
ЗАДАЧИ ИЗУЧЕНИЯ СТАТИСТИЧЕСКИХ СВЯЗЕЙ
В ходе анализа корреляционных связей можно решить следующие задачи:
1.
выявить наличие (отсутствие) корреляционной связи между изучаемыми признаками;
2.
измерить тесноту связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);
3.
определить уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков (эта часть исследования именуется регрессионным анализом).
8
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
9
Статистический критерий
2
– показатель наличия связи.
С помощью расчета
2
можно доказать 2 гипотезы:
1. Гипотеза о статистическом распределении полученных данных.
0
H
– гипотеза о распределении – гипотеза о том, что эмпирическое распределение, полученное при исследовании какой-либо переменной, соответствует некому теоретическому распределению, т. е. каждый вариант x имеет равное (пропорциональное) количество выборов.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
1
H
– альтернативная гипотеза о том, что эмпирическое распределение не соответствует теоретическому распределению и зависит от неких условий.
2
2
)
(
i
i
i
эмп
f
f
f
,
k
f
f
i
i
, где
i
f
– эмпирическая частота;
i
f
– теоретическая частота;
k – количество значений признака x.
10
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
1
k
df
);
k – количество значений признака x (количество вариантов ответов);
– уровень значимости.
0
H
– подтверждается, при условии, что
теор
эмп
2 2
;
0
H
– отвергается, при условии, что
теор
эмп
2 2
, подтверждается
1
H
11
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
2. Гипотеза о статистической зависимости между переменными.
0
H
– гипотеза о статистической независимости двух переменных, т. е. полученное распределение случайно и зависимости между признаками нет.
1
H
– гипотеза о статистической зависимости между двумя переменными, т. е. полученное распределение не случайно и существует зависимость между признаками.
12
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
c
i
k
j
ij
ij
ij
n
n
n
1 1
2
2
)
(
, или
c
i
k
j
j
i
ij
m
n
n
n
1 1
2 2
1
, где k – количество столбцов;
с – количество строк;
i
n
– сумма по строке i;
j
m
– сумма по столбцу j;
ij
n
– значение ячейки пересечения строк и столбцов;
n – сумма всех частот в данной таблице;
ij
n
– теоретическое значение для данной клетки,
n
m
n
n
j
i
ij
13
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
)
1
(
)
1
(
c
k
df
);
k – количество столбцов;
с – количество строк;
- уровень значимости.
1
H
– отвергается, при условии, что
теор
эмп
2 2
, принимается
0
H
;
1
H
– принимается, при условии, что
теор
эмп
2 2
14
ПОКАЗАТЕЛЬ ТЕСНОТЫ СВЯЗИ ЕТА
Показатель тесноты связи ETA – используется для расчета зависимости
между качественными признаками в аналитических группировках.
2 2
, где
2
- межгрупповая дисперсия;
2
- общая дисперсия.
Процедура оценки значения показателя:
1
;
0
ETA = 0 – связь отсутствует;
ETA = 1 – связь сильная, функциональная.
15
Коэффициент корреляции Крамера (K)
16
Коэффициент корреляции Крамера (K) –показатель тесноты связи, используется для расчета линейной зависимости между качественными
признаками в аналитических группировках.
1
,
1
min
2
k
c
n
K
, где
2
– показатель наличия связи;
n – сумма всех частот в данной таблице;
k – количество столбцов;
с – количество строк.
Коэффициент корреляции Крамера (K)
Процедура оценки значения коэффициента:
1
;
0
K
K = 0 – связь отсутствует;
K = 1 – связь сильная, функциональная.
3
,
0
;
0
K
– связь слабая;
5
,
0
;
3
,
0
K
– связь средняя;
1
;
5
,
0
K
– связь сильная.
17
Коэффициент ассоциации (Q) («коэффициент Юла»)
18
Коэффициент ассоциации (Q) («коэффициент Юла») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
c
b
d
a
c
b
d
a
Q
, где a, b, c, d – частоты клеток
Матрица
2 2
a
b
c
d
Процедура оценки значения коэффициента:
1
;
0
Q
5
,
0
;
0
Q
– связь слабая;
1
;
5
,
0
Q
– связь сильная, функциональная
Коэффициент контингенции (Ф) («коэффициент Фишера»)
Коэффициент контингенции (Ф) («коэффициент Фишера») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
d
c
d
b
c
a
b
a
c
b
d
a
Ф
, где a, b, c, d – частоты клеток (таблица 49).
Процедура оценки значения коэффициента:
1
;
0
Ф
3
,
0
;
0
Ф
- связь слабая;
1
;
3
,
0
Ф
- связь сильная, функциональная.
Существует закономерность, что
Ф
Q
19
Коэффициент Пирсона (r)
Коэффициент Пирсона (r) – показатель тесноты линейной зависимости
между количественными признаками.
2 2
2 2
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
, где
n – количество пар x, y.
i
x
– i- значение признака x;
i
y
– i- значение признака y.
Процедура оценки значения коэффициента:
1
;
1
r
r = –1 – чем больше x, тем меньше y;
r = 1 – чем больше x, тем больше y;
r = 0 – связи нет.
20
Коэффициент Пирсона (r)
Проверка коэффициента Пирсона на существенность:
1).
50
n
2 1
2 2
n
r
r
t
эмп
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
t
– определяется по таблицам критических значений для t – критерия
Стьюдента, где
df
– количество степеней свободы (
)
2
(
n
df
).
кр
эмп
t
t
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
21
Коэффициент Пирсона (r)
2).
50
n
1 1
n
r
Z
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
Z
– определяется по таблицам критических точек стандартного нормального распределения для различных уровней значимости.
кр
эмп
Z
Z
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
22
Коэффициент ранговой корреляции Спирмена (
r s
) показатель тесноты взаимосвязи между рангами количественных и качественных признаков.
Ранг – порядковый номер пар x, y в ранжированном ряду. Оба признака должны быть проранжированы в одном направлении (например, от меньшего к большему или наоборот).
1 6
1 2
2
l
l
d
r
i
s
или
1 6
1 2
2
l
l
y
x
r
i
i
s
, где
i
d
– разность между парой рангов;
l – число пар;
i
x
– i- значение признака x;
i
y
– i- значение признака y.
23
Коэффициент ранговой корреляции Спирмена (
r s
)
Процедура оценки значения коэффициента:
1
;
1
s
r
s
r
= –1 – признаки противоположны;
s
r
= 1 – признаки по группам совпадают.
Проверка коэффициента Спирмена на существенность:
кр
s
r
– определяется по таблицам критических значений коэффициента ранговой корреляции Спирмена.
кр
s
эмп
s
r
r
– с вероятность ошибки
, отвергается
0
H
, принимается
1
H
24
ИСПОЛЬЗОВАННЫЕ ИСТОЧНИКИ
Полякова В. В., Шаброва Н.В. Основы теории статистики : учебное пособие для студентов, обучающихся по программе бакалавриата по направлениям подготовки 38.03.04 "Государственное и муниципальное управление", 38.03.06
"Торговое дело", 39.03.01 "Социология", 39.03.02 "Социальная работа", 41.03.04
"Политология", 43.03.01 "Сервис" / В. В. Полякова, Н. В. Шаброва ; М-во образования и науки РФ Урал. федеральный ун-т им. первого Президента России
Б. Н. Ельцина, [Ин-т государственного управления и предпринимательства].— 2-е изд., испр. и доп. — Екатеринбург : Издательство Уральского университета,
2015.— 145, [3] с. : табл. — Рек. методическим советом УрФУ.— Библиогр. с.: 141,
библиогр. в конце глав.— ISBN 978-5-7996-1520-8.
25
Лекция 1. Методика обучения иностранным языкам как наука
«СТАТИСТИКА»
электронный образовательный ресурс
Каташинских Варвара Сергеевна,
доцент кафедры социологии и технологий ГМУ
Института государственного управления и предпринимательства УрФУ
Статистические связи и их показатели
Екатеринбург, 2020
Введение
Задача статистики – обнаружить (выявить) зависимости между показателями и дать им количественную характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как факторы, влияющие на изменение других (факторные), а вторые – как следствие, результат влияния первых (результативные).
2
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1. По характеру связи:
1.1. Функциональная связь (детерминированная) – связь между двумя переменными x и y, в результате которой определенному значению перемен-ной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно.
1.2. Стохастическая
(статистическая) связь – это связь, частным случаем которой является корреляционная, которая предполагает взаимодействие множества факторов, в том числе и случайных, – в этом случае выявить зависимости,
рассматривая единичный случай,
невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности .
3
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1.3. Корреляционная связь – частный случай стохастической связи (более узкое ее значение). Именно корреляционные связи являются предметом изучения статистики. Корреляционная связь – это связь, выявленная при большом числе наблюдений между одним и тем же значение х и разными значениями у в виде определенной зависимости, которая предполагает следующее соотношение –
каждому значению (х) соответствует среднее значение результативного признака/ов (у).
4
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
2. По тесноте связи:
2.1. Тесная связь – если значению факторного признака x соответствуют близкие друг к другу по значению, тесно расположенные вокруг своей сред-ней, значения результативного признака у.
2.2. Менее тесная связь – если значения результативного признака у при одном и том же значении факторного признака х сильно варьируются.
5
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
3. По направленности связи:
3.1. Прямая связь – это связь, при которой направление изменения результативного признака у совпадает с направлением изменения факторного признака x.
3.2. Обратная связь – связь, при которой значение факторного признака x увеличивается, а результативного у – уменьшается или наоборот.
6
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
4. По аналитическому выражению связи:
4.1. Прямолинейная связь – связь, в которой возрастанию величины факторного признака x соответствует непрерывный рост или непрерывный спад величины результативного признака у.
4.2. Криволинейная связь – связь, в которой возрастанию величины факторного признака x соответствует неравномерное изменение величины результативного признака у, вплоть до смены его общей направленности.
7
ЗАДАЧИ ИЗУЧЕНИЯ СТАТИСТИЧЕСКИХ СВЯЗЕЙ
В ходе анализа корреляционных связей можно решить следующие задачи:
1.
выявить наличие (отсутствие) корреляционной связи между изучаемыми признаками;
2.
измерить тесноту связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);
3.
определить уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков (эта часть исследования именуется регрессионным анализом).
8
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
9
Статистический критерий
2
– показатель наличия связи.
С помощью расчета
2
можно доказать 2 гипотезы:
1. Гипотеза о статистическом распределении полученных данных.
0
H
– гипотеза о распределении – гипотеза о том, что эмпирическое распределение, полученное при исследовании какой-либо переменной, соответствует некому теоретическому распределению, т. е. каждый вариант x имеет равное (пропорциональное) количество выборов.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
1
H
– альтернативная гипотеза о том, что эмпирическое распределение не соответствует теоретическому распределению и зависит от неких условий.
2
2
)
(
i
i
i
эмп
f
f
f
,
k
f
f
i
i
, где
i
f
– эмпирическая частота;
i
f
– теоретическая частота;
k – количество значений признака x.
10
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
1
k
df
);
k – количество значений признака x (количество вариантов ответов);
– уровень значимости.
0
H
– подтверждается, при условии, что
теор
эмп
2 2
;
0
H
– отвергается, при условии, что
теор
эмп
2 2
, подтверждается
1
H
11
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
2. Гипотеза о статистической зависимости между переменными.
0
H
– гипотеза о статистической независимости двух переменных, т. е. полученное распределение случайно и зависимости между признаками нет.
1
H
– гипотеза о статистической зависимости между двумя переменными, т. е. полученное распределение не случайно и существует зависимость между признаками.
12
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
c
i
k
j
ij
ij
ij
n
n
n
1 1
2
2
)
(
, или
c
i
k
j
j
i
ij
m
n
n
n
1 1
2 2
1
, где k – количество столбцов;
с – количество строк;
i
n
– сумма по строке i;
j
m
– сумма по столбцу j;
ij
n
– значение ячейки пересечения строк и столбцов;
n – сумма всех частот в данной таблице;
ij
n
– теоретическое значение для данной клетки,
n
m
n
n
j
i
ij
13
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
)
1
(
)
1
(
c
k
df
);
k – количество столбцов;
с – количество строк;
- уровень значимости.
1
H
– отвергается, при условии, что
теор
эмп
2 2
, принимается
0
H
;
1
H
– принимается, при условии, что
теор
эмп
2 2
14
ПОКАЗАТЕЛЬ ТЕСНОТЫ СВЯЗИ ЕТА
Показатель тесноты связи ETA – используется для расчета зависимости
между качественными признаками в аналитических группировках.
2 2
, где
2
- межгрупповая дисперсия;
2
- общая дисперсия.
Процедура оценки значения показателя:
1
;
0
ETA = 0 – связь отсутствует;
ETA = 1 – связь сильная, функциональная.
15
Коэффициент корреляции Крамера (K)
16
Коэффициент корреляции Крамера (K) –показатель тесноты связи, используется для расчета линейной зависимости между качественными
признаками в аналитических группировках.
1
,
1
min
2
k
c
n
K
, где
2
– показатель наличия связи;
n – сумма всех частот в данной таблице;
k – количество столбцов;
с – количество строк.
Коэффициент корреляции Крамера (K)
Процедура оценки значения коэффициента:
1
;
0
K
K = 0 – связь отсутствует;
K = 1 – связь сильная, функциональная.
3
,
0
;
0
K
– связь слабая;
5
,
0
;
3
,
0
K
– связь средняя;
1
;
5
,
0
K
– связь сильная.
17
Коэффициент ассоциации (Q) («коэффициент Юла»)
18
Коэффициент ассоциации (Q) («коэффициент Юла») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
c
b
d
a
c
b
d
a
Q
, где a, b, c, d – частоты клеток
Матрица
2 2
a
b
c
d
Процедура оценки значения коэффициента:
1
;
0
Q
5
,
0
;
0
Q
– связь слабая;
1
;
5
,
0
Q
– связь сильная, функциональная
Коэффициент контингенции (Ф) («коэффициент Фишера»)
Коэффициент контингенции (Ф) («коэффициент Фишера») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
d
c
d
b
c
a
b
a
c
b
d
a
Ф
, где a, b, c, d – частоты клеток (таблица 49).
Процедура оценки значения коэффициента:
1
;
0
Ф
3
,
0
;
0
Ф
- связь слабая;
1
;
3
,
0
Ф
- связь сильная, функциональная.
Существует закономерность, что
Ф
Q
19
Коэффициент Пирсона (r)
Коэффициент Пирсона (r) – показатель тесноты линейной зависимости
между количественными признаками.
2 2
2 2
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
, где
n – количество пар x, y.
i
x
– i- значение признака x;
i
y
– i- значение признака y.
Процедура оценки значения коэффициента:
1
;
1
r
r = –1 – чем больше x, тем меньше y;
r = 1 – чем больше x, тем больше y;
r = 0 – связи нет.
20
Коэффициент Пирсона (r)
Проверка коэффициента Пирсона на существенность:
1).
50
n
2 1
2 2
n
r
r
t
эмп
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
t
– определяется по таблицам критических значений для t – критерия
Стьюдента, где
df
– количество степеней свободы (
)
2
(
n
df
).
кр
эмп
t
t
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
21
Коэффициент Пирсона (r)
2).
50
n
1 1
n
r
Z
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
Z
– определяется по таблицам критических точек стандартного нормального распределения для различных уровней значимости.
кр
эмп
Z
Z
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
22
Коэффициент ранговой корреляции Спирмена (
r s
) показатель тесноты взаимосвязи между рангами количественных и качественных признаков.
Ранг – порядковый номер пар x, y в ранжированном ряду. Оба признака должны быть проранжированы в одном направлении (например, от меньшего к большему или наоборот).
1 6
1 2
2
l
l
d
r
i
s
или
1 6
1 2
2
l
l
y
x
r
i
i
s
, где
i
d
– разность между парой рангов;
l – число пар;
i
x
– i- значение признака x;
i
y
– i- значение признака y.
23
Коэффициент ранговой корреляции Спирмена (
r s
)
Процедура оценки значения коэффициента:
1
;
1
s
r
s
r
= –1 – признаки противоположны;
s
r
= 1 – признаки по группам совпадают.
Проверка коэффициента Спирмена на существенность:
кр
s
r
– определяется по таблицам критических значений коэффициента ранговой корреляции Спирмена.
кр
s
эмп
s
r
r
– с вероятность ошибки
, отвергается
0
H
, принимается
1
H
24
ИСПОЛЬЗОВАННЫЕ ИСТОЧНИКИ
Полякова В. В., Шаброва Н.В. Основы теории статистики : учебное пособие для студентов, обучающихся по программе бакалавриата по направлениям подготовки 38.03.04 "Государственное и муниципальное управление", 38.03.06
"Торговое дело", 39.03.01 "Социология", 39.03.02 "Социальная работа", 41.03.04
"Политология", 43.03.01 "Сервис" / В. В. Полякова, Н. В. Шаброва ; М-во образования и науки РФ Урал. федеральный ун-т им. первого Президента России
Б. Н. Ельцина, [Ин-т государственного управления и предпринимательства].— 2-е изд., испр. и доп. — Екатеринбург : Издательство Уральского университета,
2015.— 145, [3] с. : табл. — Рек. методическим советом УрФУ.— Библиогр. с.: 141,
библиогр. в конце глав.— ISBN 978-5-7996-1520-8.
25
Лекция 1. Методика обучения иностранным языкам как наука
«СТАТИСТИКА»
электронный образовательный ресурс
Каташинских Варвара Сергеевна,
доцент кафедры социологии и технологий ГМУ
Института государственного управления и предпринимательства УрФУ
Статистические связи и их показатели
Екатеринбург, 2020
Введение
Задача статистики – обнаружить (выявить) зависимости между показателями и дать им количественную характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как факторы, влияющие на изменение других (факторные), а вторые – как следствие, результат влияния первых (результативные).
2
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1. По характеру связи:
1.1. Функциональная связь (детерминированная) – связь между двумя переменными x и y, в результате которой определенному значению перемен-ной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно.
1.2. Стохастическая
(статистическая) связь – это связь, частным случаем которой является корреляционная, которая предполагает взаимодействие множества факторов, в том числе и случайных, – в этом случае выявить зависимости,
рассматривая единичный случай,
невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности .
3
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1.3. Корреляционная связь – частный случай стохастической связи (более узкое ее значение). Именно корреляционные связи являются предметом изучения статистики. Корреляционная связь – это связь, выявленная при большом числе наблюдений между одним и тем же значение х и разными значениями у в виде определенной зависимости, которая предполагает следующее соотношение –
каждому значению (х) соответствует среднее значение результативного признака/ов (у).
4
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
2. По тесноте связи:
2.1. Тесная связь – если значению факторного признака x соответствуют близкие друг к другу по значению, тесно расположенные вокруг своей сред-ней, значения результативного признака у.
2.2. Менее тесная связь – если значения результативного признака у при одном и том же значении факторного признака х сильно варьируются.
5
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
3. По направленности связи:
3.1. Прямая связь – это связь, при которой направление изменения результативного признака у совпадает с направлением изменения факторного признака x.
3.2. Обратная связь – связь, при которой значение факторного признака x увеличивается, а результативного у – уменьшается или наоборот.
6
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
4. По аналитическому выражению связи:
4.1. Прямолинейная связь – связь, в которой возрастанию величины факторного признака x соответствует непрерывный рост или непрерывный спад величины результативного признака у.
4.2. Криволинейная связь – связь, в которой возрастанию величины факторного признака x соответствует неравномерное изменение величины результативного признака у, вплоть до смены его общей направленности.
7
ЗАДАЧИ ИЗУЧЕНИЯ СТАТИСТИЧЕСКИХ СВЯЗЕЙ
В ходе анализа корреляционных связей можно решить следующие задачи:
1.
выявить наличие (отсутствие) корреляционной связи между изучаемыми признаками;
2.
измерить тесноту связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);
3.
определить уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков (эта часть исследования именуется регрессионным анализом).
8
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
9
Статистический критерий
2
– показатель наличия связи.
С помощью расчета
2
можно доказать 2 гипотезы:
1. Гипотеза о статистическом распределении полученных данных.
0
H
– гипотеза о распределении – гипотеза о том, что эмпирическое распределение, полученное при исследовании какой-либо переменной, соответствует некому теоретическому распределению, т. е. каждый вариант x имеет равное (пропорциональное) количество выборов.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
1
H
– альтернативная гипотеза о том, что эмпирическое распределение не соответствует теоретическому распределению и зависит от неких условий.
2
2
)
(
i
i
i
эмп
f
f
f
,
k
f
f
i
i
, где
i
f
– эмпирическая частота;
i
f
– теоретическая частота;
k – количество значений признака x.
10
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
1
k
df
);
k – количество значений признака x (количество вариантов ответов);
– уровень значимости.
0
H
– подтверждается, при условии, что
теор
эмп
2 2
;
0
H
– отвергается, при условии, что
теор
эмп
2 2
, подтверждается
1
H
11
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
2. Гипотеза о статистической зависимости между переменными.
0
H
– гипотеза о статистической независимости двух переменных, т. е. полученное распределение случайно и зависимости между признаками нет.
1
H
– гипотеза о статистической зависимости между двумя переменными, т. е. полученное распределение не случайно и существует зависимость между признаками.
12
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
c
i
k
j
ij
ij
ij
n
n
n
1 1
2
2
)
(
, или
c
i
k
j
j
i
ij
m
n
n
n
1 1
2 2
1
, где k – количество столбцов;
с – количество строк;
i
n
– сумма по строке i;
j
m
– сумма по столбцу j;
ij
n
– значение ячейки пересечения строк и столбцов;
n – сумма всех частот в данной таблице;
ij
n
– теоретическое значение для данной клетки,
n
m
n
n
j
i
ij
13
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
)
1
(
)
1
(
c
k
df
);
k – количество столбцов;
с – количество строк;
- уровень значимости.
1
H
– отвергается, при условии, что
теор
эмп
2 2
, принимается
0
H
;
1
H
– принимается, при условии, что
теор
эмп
2 2
14
ПОКАЗАТЕЛЬ ТЕСНОТЫ СВЯЗИ ЕТА
Показатель тесноты связи ETA – используется для расчета зависимости
между качественными признаками в аналитических группировках.
2 2
, где
2
- межгрупповая дисперсия;
2
- общая дисперсия.
Процедура оценки значения показателя:
1
;
0
ETA = 0 – связь отсутствует;
ETA = 1 – связь сильная, функциональная.
15
Коэффициент корреляции Крамера (K)
16
Коэффициент корреляции Крамера (K) –показатель тесноты связи, используется для расчета линейной зависимости между качественными
признаками в аналитических группировках.
1
,
1
min
2
k
c
n
K
, где
2
– показатель наличия связи;
n – сумма всех частот в данной таблице;
k – количество столбцов;
с – количество строк.
Коэффициент корреляции Крамера (K)
Процедура оценки значения коэффициента:
1
;
0
K
K = 0 – связь отсутствует;
K = 1 – связь сильная, функциональная.
3
,
0
;
0
K
– связь слабая;
5
,
0
;
3
,
0
K
– связь средняя;
1
;
5
,
0
K
– связь сильная.
17
Коэффициент ассоциации (Q) («коэффициент Юла»)
18
Коэффициент ассоциации (Q) («коэффициент Юла») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
c
b
d
a
c
b
d
a
Q
, где a, b, c, d – частоты клеток
Матрица
2 2
a
b
c
d
Процедура оценки значения коэффициента:
1
;
0
Q
5
,
0
;
0
Q
– связь слабая;
1
;
5
,
0
Q
– связь сильная, функциональная
Коэффициент контингенции (Ф) («коэффициент Фишера»)
Коэффициент контингенции (Ф) («коэффициент Фишера») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
d
c
d
b
c
a
b
a
c
b
d
a
Ф
, где a, b, c, d – частоты клеток (таблица 49).
Процедура оценки значения коэффициента:
1
;
0
Ф
3
,
0
;
0
Ф
- связь слабая;
1
;
3
,
0
Ф
- связь сильная, функциональная.
Существует закономерность, что
Ф
Q
19
Коэффициент Пирсона (r)
Коэффициент Пирсона (r) – показатель тесноты линейной зависимости
между количественными признаками.
2 2
2 2
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
, где
n – количество пар x, y.
i
x
– i- значение признака x;
i
y
– i- значение признака y.
Процедура оценки значения коэффициента:
1
;
1
r
r = –1 – чем больше x, тем меньше y;
r = 1 – чем больше x, тем больше y;
r = 0 – связи нет.
20
Коэффициент Пирсона (r)
Проверка коэффициента Пирсона на существенность:
1).
50
n
2 1
2 2
n
r
r
t
эмп
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
t
– определяется по таблицам критических значений для t – критерия
Стьюдента, где
df
– количество степеней свободы (
)
2
(
n
df
).
кр
эмп
t
t
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
21
Коэффициент Пирсона (r)
2).
50
n
1 1
n
r
Z
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
Z
– определяется по таблицам критических точек стандартного нормального распределения для различных уровней значимости.
кр
эмп
Z
Z
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
22
Коэффициент ранговой корреляции Спирмена (
r s
) показатель тесноты взаимосвязи между рангами количественных и качественных признаков.
Ранг – порядковый номер пар x, y в ранжированном ряду. Оба признака должны быть проранжированы в одном направлении (например, от меньшего к большему или наоборот).
1 6
1 2
2
l
l
d
r
i
s
или
1 6
1 2
2
l
l
y
x
r
i
i
s
, где
i
d
– разность между парой рангов;
l – число пар;
i
x
– i- значение признака x;
i
y
– i- значение признака y.
23
Коэффициент ранговой корреляции Спирмена (
r s
)
Процедура оценки значения коэффициента:
1
;
1
s
r
s
r
= –1 – признаки противоположны;
s
r
= 1 – признаки по группам совпадают.
Проверка коэффициента Спирмена на существенность:
кр
s
r
– определяется по таблицам критических значений коэффициента ранговой корреляции Спирмена.
кр
s
эмп
s
r
r
– с вероятность ошибки
, отвергается
0
H
, принимается
1
H
24
ИСПОЛЬЗОВАННЫЕ ИСТОЧНИКИ
Полякова В. В., Шаброва Н.В. Основы теории статистики : учебное пособие для студентов, обучающихся по программе бакалавриата по направлениям подготовки 38.03.04 "Государственное и муниципальное управление", 38.03.06
"Торговое дело", 39.03.01 "Социология", 39.03.02 "Социальная работа", 41.03.04
"Политология", 43.03.01 "Сервис" / В. В. Полякова, Н. В. Шаброва ; М-во образования и науки РФ Урал. федеральный ун-т им. первого Президента России
Б. Н. Ельцина, [Ин-т государственного управления и предпринимательства].— 2-е изд., испр. и доп. — Екатеринбург : Издательство Уральского университета,
2015.— 145, [3] с. : табл. — Рек. методическим советом УрФУ.— Библиогр. с.: 141,
библиогр. в конце глав.— ISBN 978-5-7996-1520-8.
25
Лекция 1. Методика обучения иностранным языкам как наука
«СТАТИСТИКА»
электронный образовательный ресурс
Каташинских Варвара Сергеевна,
доцент кафедры социологии и технологий ГМУ
Института государственного управления и предпринимательства УрФУ
Статистические связи и их показатели
Екатеринбург, 2020
Введение
Задача статистики – обнаружить (выявить) зависимости между показателями и дать им количественную характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как факторы, влияющие на изменение других (факторные), а вторые – как следствие, результат влияния первых (результативные).
2
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1. По характеру связи:
1.1. Функциональная связь (детерминированная) – связь между двумя переменными x и y, в результате которой определенному значению перемен-ной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно.
1.2. Стохастическая
(статистическая) связь – это связь, частным случаем которой является корреляционная, которая предполагает взаимодействие множества факторов, в том числе и случайных, – в этом случае выявить зависимости,
рассматривая единичный случай,
невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности .
3
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1.3. Корреляционная связь – частный случай стохастической связи (более узкое ее значение). Именно корреляционные связи являются предметом изучения статистики. Корреляционная связь – это связь, выявленная при большом числе наблюдений между одним и тем же значение х и разными значениями у в виде определенной зависимости, которая предполагает следующее соотношение –
каждому значению (х) соответствует среднее значение результативного признака/ов (у).
4
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
2. По тесноте связи:
2.1. Тесная связь – если значению факторного признака x соответствуют близкие друг к другу по значению, тесно расположенные вокруг своей сред-ней, значения результативного признака у.
2.2. Менее тесная связь – если значения результативного признака у при одном и том же значении факторного признака х сильно варьируются.
5
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
3. По направленности связи:
3.1. Прямая связь – это связь, при которой направление изменения результативного признака у совпадает с направлением изменения факторного признака x.
3.2. Обратная связь – связь, при которой значение факторного признака x увеличивается, а результативного у – уменьшается или наоборот.
6
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
4. По аналитическому выражению связи:
4.1. Прямолинейная связь – связь, в которой возрастанию величины факторного признака x соответствует непрерывный рост или непрерывный спад величины результативного признака у.
4.2. Криволинейная связь – связь, в которой возрастанию величины факторного признака x соответствует неравномерное изменение величины результативного признака у, вплоть до смены его общей направленности.
7
ЗАДАЧИ ИЗУЧЕНИЯ СТАТИСТИЧЕСКИХ СВЯЗЕЙ
В ходе анализа корреляционных связей можно решить следующие задачи:
1.
выявить наличие (отсутствие) корреляционной связи между изучаемыми признаками;
2.
измерить тесноту связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);
3.
определить уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков (эта часть исследования именуется регрессионным анализом).
8
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
9
Статистический критерий
2
– показатель наличия связи.
С помощью расчета
2
можно доказать 2 гипотезы:
1. Гипотеза о статистическом распределении полученных данных.
0
H
– гипотеза о распределении – гипотеза о том, что эмпирическое распределение, полученное при исследовании какой-либо переменной, соответствует некому теоретическому распределению, т. е. каждый вариант x имеет равное (пропорциональное) количество выборов.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
1
H
– альтернативная гипотеза о том, что эмпирическое распределение не соответствует теоретическому распределению и зависит от неких условий.
2
2
)
(
i
i
i
эмп
f
f
f
,
k
f
f
i
i
, где
i
f
– эмпирическая частота;
i
f
– теоретическая частота;
k – количество значений признака x.
10
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
1
k
df
);
k – количество значений признака x (количество вариантов ответов);
– уровень значимости.
0
H
– подтверждается, при условии, что
теор
эмп
2 2
;
0
H
– отвергается, при условии, что
теор
эмп
2 2
, подтверждается
1
H
11
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
2. Гипотеза о статистической зависимости между переменными.
0
H
– гипотеза о статистической независимости двух переменных, т. е. полученное распределение случайно и зависимости между признаками нет.
1
H
– гипотеза о статистической зависимости между двумя переменными, т. е. полученное распределение не случайно и существует зависимость между признаками.
12
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
c
i
k
j
ij
ij
ij
n
n
n
1 1
2
2
)
(
, или
c
i
k
j
j
i
ij
m
n
n
n
1 1
2 2
1
, где k – количество столбцов;
с – количество строк;
i
n
– сумма по строке i;
j
m
– сумма по столбцу j;
ij
n
– значение ячейки пересечения строк и столбцов;
n – сумма всех частот в данной таблице;
ij
n
– теоретическое значение для данной клетки,
n
m
n
n
j
i
ij
13
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
)
1
(
)
1
(
c
k
df
);
k – количество столбцов;
с – количество строк;
- уровень значимости.
1
H
– отвергается, при условии, что
теор
эмп
2 2
, принимается
0
H
;
1
H
– принимается, при условии, что
теор
эмп
2 2
14
ПОКАЗАТЕЛЬ ТЕСНОТЫ СВЯЗИ ЕТА
Показатель тесноты связи ETA – используется для расчета зависимости
между качественными признаками в аналитических группировках.
2 2
, где
2
- межгрупповая дисперсия;
2
- общая дисперсия.
Процедура оценки значения показателя:
1
;
0
ETA = 0 – связь отсутствует;
ETA = 1 – связь сильная, функциональная.
15
Коэффициент корреляции Крамера (K)
16
Коэффициент корреляции Крамера (K) –показатель тесноты связи, используется для расчета линейной зависимости между качественными
признаками в аналитических группировках.
1
,
1
min
2
k
c
n
K
, где
2
– показатель наличия связи;
n – сумма всех частот в данной таблице;
k – количество столбцов;
с – количество строк.
Коэффициент корреляции Крамера (K)
Процедура оценки значения коэффициента:
1
;
0
K
K = 0 – связь отсутствует;
K = 1 – связь сильная, функциональная.
3
,
0
;
0
K
– связь слабая;
5
,
0
;
3
,
0
K
– связь средняя;
1
;
5
,
0
K
– связь сильная.
17
Коэффициент ассоциации (Q) («коэффициент Юла»)
18
Коэффициент ассоциации (Q) («коэффициент Юла») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
c
b
d
a
c
b
d
a
Q
, где a, b, c, d – частоты клеток
Матрица
2 2
a
b
c
d
Процедура оценки значения коэффициента:
1
;
0
Q
5
,
0
;
0
Q
– связь слабая;
1
;
5
,
0
Q
– связь сильная, функциональная
Коэффициент контингенции (Ф) («коэффициент Фишера»)
Коэффициент контингенции (Ф) («коэффициент Фишера») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
d
c
d
b
c
a
b
a
c
b
d
a
Ф
, где a, b, c, d – частоты клеток (таблица 49).
Процедура оценки значения коэффициента:
1
;
0
Ф
3
,
0
;
0
Ф
- связь слабая;
1
;
3
,
0
Ф
- связь сильная, функциональная.
Существует закономерность, что
Ф
Q
19
Коэффициент Пирсона (r)
Коэффициент Пирсона (r) – показатель тесноты линейной зависимости
между количественными признаками.
2 2
2 2
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
, где
n – количество пар x, y.
i
x
– i- значение признака x;
i
y
– i- значение признака y.
Процедура оценки значения коэффициента:
1
;
1
r
r = –1 – чем больше x, тем меньше y;
r = 1 – чем больше x, тем больше y;
r = 0 – связи нет.
20
Коэффициент Пирсона (r)
Проверка коэффициента Пирсона на существенность:
1).
50
n
2 1
2 2
n
r
r
t
эмп
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
t
– определяется по таблицам критических значений для t – критерия
Стьюдента, где
df
– количество степеней свободы (
)
2
(
n
df
).
кр
эмп
t
t
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
21
Коэффициент Пирсона (r)
2).
50
n
1 1
n
r
Z
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
Z
– определяется по таблицам критических точек стандартного нормального распределения для различных уровней значимости.
кр
эмп
Z
Z
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
22
Коэффициент ранговой корреляции Спирмена (
r s
) показатель тесноты взаимосвязи между рангами количественных и качественных признаков.
Ранг – порядковый номер пар x, y в ранжированном ряду. Оба признака должны быть проранжированы в одном направлении (например, от меньшего к большему или наоборот).
1 6
1 2
2
l
l
d
r
i
s
или
1 6
1 2
2
l
l
y
x
r
i
i
s
, где
i
d
– разность между парой рангов;
l – число пар;
i
x
– i- значение признака x;
i
y
– i- значение признака y.
23
Коэффициент ранговой корреляции Спирмена (
r s
)
Процедура оценки значения коэффициента:
1
;
1
s
r
s
r
= –1 – признаки противоположны;
s
r
= 1 – признаки по группам совпадают.
Проверка коэффициента Спирмена на существенность:
кр
s
r
– определяется по таблицам критических значений коэффициента ранговой корреляции Спирмена.
кр
s
эмп
s
r
r
– с вероятность ошибки
, отвергается
0
H
, принимается
1
H
24
ИСПОЛЬЗОВАННЫЕ ИСТОЧНИКИ
Полякова В. В., Шаброва Н.В. Основы теории статистики : учебное пособие для студентов, обучающихся по программе бакалавриата по направлениям подготовки 38.03.04 "Государственное и муниципальное управление", 38.03.06
"Торговое дело", 39.03.01 "Социология", 39.03.02 "Социальная работа", 41.03.04
"Политология", 43.03.01 "Сервис" / В. В. Полякова, Н. В. Шаброва ; М-во образования и науки РФ Урал. федеральный ун-т им. первого Президента России
Б. Н. Ельцина, [Ин-т государственного управления и предпринимательства].— 2-е изд., испр. и доп. — Екатеринбург : Издательство Уральского университета,
2015.— 145, [3] с. : табл. — Рек. методическим советом УрФУ.— Библиогр. с.: 141,
библиогр. в конце глав.— ISBN 978-5-7996-1520-8.
25
Лекция 1. Методика обучения иностранным языкам как наука
«СТАТИСТИКА»
электронный образовательный ресурс
Каташинских Варвара Сергеевна,
доцент кафедры социологии и технологий ГМУ
Института государственного управления и предпринимательства УрФУ
Статистические связи и их показатели
Екатеринбург, 2020
Введение
Задача статистики – обнаружить (выявить) зависимости между показателями и дать им количественную характеристику.
Среди взаимосвязанных признаков (показателей) одни могут рассматриваться как факторы, влияющие на изменение других (факторные), а вторые – как следствие, результат влияния первых (результативные).
2
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1. По характеру связи:
1.1. Функциональная связь (детерминированная) – связь между двумя переменными x и y, в результате которой определенному значению перемен-ной x строго соответствует одно или несколько значений другой переменной y, и с изменением значения x значение y меняется строго определенно.
1.2. Стохастическая
(статистическая) связь – это связь, частным случаем которой является корреляционная, которая предполагает взаимодействие множества факторов, в том числе и случайных, – в этом случае выявить зависимости,
рассматривая единичный случай,
невозможно. Такие связи можно обнаружить только при массовом наблюдении как статистические закономерности .
3
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
1.3. Корреляционная связь – частный случай стохастической связи (более узкое ее значение). Именно корреляционные связи являются предметом изучения статистики. Корреляционная связь – это связь, выявленная при большом числе наблюдений между одним и тем же значение х и разными значениями у в виде определенной зависимости, которая предполагает следующее соотношение –
каждому значению (х) соответствует среднее значение результативного признака/ов (у).
4
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
2. По тесноте связи:
2.1. Тесная связь – если значению факторного признака x соответствуют близкие друг к другу по значению, тесно расположенные вокруг своей сред-ней, значения результативного признака у.
2.2. Менее тесная связь – если значения результативного признака у при одном и том же значении факторного признака х сильно варьируются.
5
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
3. По направленности связи:
3.1. Прямая связь – это связь, при которой направление изменения результативного признака у совпадает с направлением изменения факторного признака x.
3.2. Обратная связь – связь, при которой значение факторного признака x увеличивается, а результативного у – уменьшается или наоборот.
6
ВИДЫ СТАТИСТИЧЕСКОЙ СВЯЗИ
4. По аналитическому выражению связи:
4.1. Прямолинейная связь – связь, в которой возрастанию величины факторного признака x соответствует непрерывный рост или непрерывный спад величины результативного признака у.
4.2. Криволинейная связь – связь, в которой возрастанию величины факторного признака x соответствует неравномерное изменение величины результативного признака у, вплоть до смены его общей направленности.
7
ЗАДАЧИ ИЗУЧЕНИЯ СТАТИСТИЧЕСКИХ СВЯЗЕЙ
В ходе анализа корреляционных связей можно решить следующие задачи:
1.
выявить наличие (отсутствие) корреляционной связи между изучаемыми признаками;
2.
измерить тесноту связи между двумя (и более) признаками с помощью специальных коэффициентов (эта часть исследования именуется корреляционным анализом);
3.
определить уравнения регрессии – математической модели, в которой среднее значение результативного признака у рассматривается как функция одной или нескольких переменных – факторных признаков (эта часть исследования именуется регрессионным анализом).
8
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
9
Статистический критерий
2
– показатель наличия связи.
С помощью расчета
2
можно доказать 2 гипотезы:
1. Гипотеза о статистическом распределении полученных данных.
0
H
– гипотеза о распределении – гипотеза о том, что эмпирическое распределение, полученное при исследовании какой-либо переменной, соответствует некому теоретическому распределению, т. е. каждый вариант x имеет равное (пропорциональное) количество выборов.
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
1
H
– альтернативная гипотеза о том, что эмпирическое распределение не соответствует теоретическому распределению и зависит от неких условий.
2
2
)
(
i
i
i
эмп
f
f
f
,
k
f
f
i
i
, где
i
f
– эмпирическая частота;
i
f
– теоретическая частота;
k – количество значений признака x.
10
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
1
k
df
);
k – количество значений признака x (количество вариантов ответов);
– уровень значимости.
0
H
– подтверждается, при условии, что
теор
эмп
2 2
;
0
H
– отвергается, при условии, что
теор
эмп
2 2
, подтверждается
1
H
11
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
2. Гипотеза о статистической зависимости между переменными.
0
H
– гипотеза о статистической независимости двух переменных, т. е. полученное распределение случайно и зависимости между признаками нет.
1
H
– гипотеза о статистической зависимости между двумя переменными, т. е. полученное распределение не случайно и существует зависимость между признаками.
12
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
c
i
k
j
ij
ij
ij
n
n
n
1 1
2
2
)
(
, или
c
i
k
j
j
i
ij
m
n
n
n
1 1
2 2
1
, где k – количество столбцов;
с – количество строк;
i
n
– сумма по строке i;
j
m
– сумма по столбцу j;
ij
n
– значение ячейки пересечения строк и столбцов;
n – сумма всех частот в данной таблице;
ij
n
– теоретическое значение для данной клетки,
n
m
n
n
j
i
ij
13
СТАТИСТИЧЕСКИЙ КРИТЕРИЙ ХИ-КВАДРАТ
Процедура оценки
2
– сравнение
эмп
2
и
теор
2
:
теор
2
– определяется по таблицам
2
– критерия Пирсона, где
df
– количество степеней свободы (
)
1
(
)
1
(
c
k
df
);
k – количество столбцов;
с – количество строк;
- уровень значимости.
1
H
– отвергается, при условии, что
теор
эмп
2 2
, принимается
0
H
;
1
H
– принимается, при условии, что
теор
эмп
2 2
14
ПОКАЗАТЕЛЬ ТЕСНОТЫ СВЯЗИ ЕТА
Показатель тесноты связи ETA – используется для расчета зависимости
между качественными признаками в аналитических группировках.
2 2
, где
2
- межгрупповая дисперсия;
2
- общая дисперсия.
Процедура оценки значения показателя:
1
;
0
ETA = 0 – связь отсутствует;
ETA = 1 – связь сильная, функциональная.
15
Коэффициент корреляции Крамера (K)
16
Коэффициент корреляции Крамера (K) –показатель тесноты связи, используется для расчета линейной зависимости между качественными
признаками в аналитических группировках.
1
,
1
min
2
k
c
n
K
, где
2
– показатель наличия связи;
n – сумма всех частот в данной таблице;
k – количество столбцов;
с – количество строк.
Коэффициент корреляции Крамера (K)
Процедура оценки значения коэффициента:
1
;
0
K
K = 0 – связь отсутствует;
K = 1 – связь сильная, функциональная.
3
,
0
;
0
K
– связь слабая;
5
,
0
;
3
,
0
K
– связь средняя;
1
;
5
,
0
K
– связь сильная.
17
Коэффициент ассоциации (Q) («коэффициент Юла»)
18
Коэффициент ассоциации (Q) («коэффициент Юла») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
c
b
d
a
c
b
d
a
Q
, где a, b, c, d – частоты клеток
Матрица
2 2
a
b
c
d
Процедура оценки значения коэффициента:
1
;
0
Q
5
,
0
;
0
Q
– связь слабая;
1
;
5
,
0
Q
– связь сильная, функциональная
Коэффициент контингенции (Ф) («коэффициент Фишера»)
Коэффициент контингенции (Ф) («коэффициент Фишера») – коэффициент линейной корреляции качественных признаков для матрицы
2 2
d
c
d
b
c
a
b
a
c
b
d
a
Ф
, где a, b, c, d – частоты клеток (таблица 49).
Процедура оценки значения коэффициента:
1
;
0
Ф
3
,
0
;
0
Ф
- связь слабая;
1
;
3
,
0
Ф
- связь сильная, функциональная.
Существует закономерность, что
Ф
Q
19
Коэффициент Пирсона (r)
Коэффициент Пирсона (r) – показатель тесноты линейной зависимости
между количественными признаками.
2 2
2 2
i
i
i
i
i
i
i
i
y
y
n
x
x
n
y
x
y
x
n
r
, где
n – количество пар x, y.
i
x
– i- значение признака x;
i
y
– i- значение признака y.
Процедура оценки значения коэффициента:
1
;
1
r
r = –1 – чем больше x, тем меньше y;
r = 1 – чем больше x, тем больше y;
r = 0 – связи нет.
20
Коэффициент Пирсона (r)
Проверка коэффициента Пирсона на существенность:
1).
50
n
2 1
2 2
n
r
r
t
эмп
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
t
– определяется по таблицам критических значений для t – критерия
Стьюдента, где
df
– количество степеней свободы (
)
2
(
n
df
).
кр
эмп
t
t
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
21
Коэффициент Пирсона (r)
2).
50
n
1 1
n
r
Z
, где r – коэффициент Пирсона;
n – количество пар x, y.
кр
Z
– определяется по таблицам критических точек стандартного нормального распределения для различных уровней значимости.
кр
эмп
Z
Z
– с вероятность ошибки
, отвергается
0
H
и принимается
1
H
22
Коэффициент ранговой корреляции Спирмена (
r s
) показатель тесноты взаимосвязи между рангами количественных и качественных признаков.
Ранг – порядковый номер пар x, y в ранжированном ряду. Оба признака должны быть проранжированы в одном направлении (например, от меньшего к большему или наоборот).
1 6
1 2
2
l
l
d
r
i
s
или
1 6
1 2
2
l
l
y
x
r
i
i
s
, где
i
d
– разность между парой рангов;
l – число пар;
i
x
– i- значение признака x;
i
y
– i- значение признака y.
23
Коэффициент ранговой корреляции Спирмена (
r s
)
Процедура оценки значения коэффициента:
1
;
1
s
r
s
r
= –1 – признаки противоположны;
s
r
= 1 – признаки по группам совпадают.
Проверка коэффициента Спирмена на существенность:
кр
s
r
– определяется по таблицам критических значений коэффициента ранговой корреляции Спирмена.
кр
s
эмп
s
r
r
– с вероятность ошибки
, отвергается
0
H
, принимается
1
H
24
ИСПОЛЬЗОВАННЫЕ ИСТОЧНИКИ
Полякова В. В., Шаброва Н.В. Основы теории статистики : учебное пособие для студентов, обучающихся по программе бакалавриата по направлениям подготовки 38.03.04 "Государственное и муниципальное управление", 38.03.06
"Торговое дело", 39.03.01 "Социология", 39.03.02 "Социальная работа", 41.03.04
"Политология", 43.03.01 "Сервис" / В. В. Полякова, Н. В. Шаброва ; М-во образования и науки РФ Урал. федеральный ун-т им. первого Президента России
Б. Н. Ельцина, [Ин-т государственного управления и предпринимательства].— 2-е изд., испр. и доп. — Екатеринбург : Издательство Уральского университета,
2015.— 145, [3] с. : табл. — Рек. методическим советом УрФУ.— Библиогр. с.: 141,
библиогр. в конце глав.— ISBN 978-5-7996-1520-8.
25