ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3677
Скачиваний: 4
37
Подытожить
Дисперсия.
Мера разброса относительно среднего значения
.
Равна сумме квадратов
отклонений от среднего
,
деленной на число
,
на единицу меньшее числа наблюдений
.
Дисперсия измеряется в единицах
,
которые равны квадратам единиц измерения самой
переменной
.
Глава
7
Средние
Процедура Средние вычисляет средние значения для подгрупп и связанные с ними
одномерные статистики для зависимых переменных внутри категорий одной или
нескольких независимых переменных
.
Дополнительно вы можете провести однофакторный
дисперсионный анализ
,
найти значения статистики эта
(eta),
а также выполнить тесты
на линейность
.
Пример.
Измерим среднее поглощаемое количество жира для каждого из трех типов
кулинарного жира
,
и проведем однофакторный дисперсионный анализ для проверки
,
различаются ли эти средние значения
.
Статистики.
Сумма
,
число наблюдений
,
среднее значение
,
медиана
,
групповая медиана
,
стандартная ошибка среднего значения
,
минимальное и максимальное значения
,
размах
,
значение группирующей переменной для первой категории
,
значение группирующей
переменной для последней категории
,
стандартное отклонение
,
дисперсия
,
эксцесс
,
стандартная ошибка эксцесса
,
асимметрия
,
стандартная ошибка асимметрии
,
процент от
общей суммы
,
процент от общего
N
,
процент от суммы в
,
процент от
N
в
,
геометрическое
среднее
,
гармоническое среднее
.
Дополнительные статистики включают дисперсионный
анализ
,
значения эта
(eta)
и эта квадрат
,
а также критерий линейности
,
R
и
R
2
.
Данные.
Зависимые переменные
-
количественные
,
независимые переменные
-
категориальные
.
Значения группирующих переменных могут быть числовыми и
текстовыми
.
Предположения.
Некоторые статистики для подгрупп
,
например
,
среднее и стандартное
отклонение
,
основаны на теории нормального распределения и подходят для
количественных переменных с симметричными распределениями
.
Робастные статистики
,
такие как медиана
,
годятся и для количественных переменных
,
которые могут не
удовлетворять условию нормальной распределенности
.
Дисперсионный анализ является
робастным в отношении отклонений от нормальности
,
однако данные в каждой ячейке
должны быть симметричными
.
При проведении дисперсионного анализа предполагается
,
что группы принадлежат совокупностям с одинаковыми дисперсиями
.
Для проверки
этого предположения используйте критерий однородности дисперсии Ливиня
,
который
выполняется в процедуре Однофакторный дисперсионный анализ
.
Как выполнить процедуру Средние
E
Выберите в меню
:
Анализ > Сравнение средних > Средние...
© Copyright IBM Corporation 1989, 2011.
38
39
Средние
Рисунок 7-1
Диалоговое окно Средние
E
Выберите одну или несколько зависимых переменных
.
E
Используйте один из следующих методов для выбора категориальных независимых
переменных
:
Выберите одну или несколько независимых переменных
.
Для каждой независимой
переменной результаты будут выведены отдельно
.
Выберите один или несколько слоев независимых переменных
.
Каждый слой в
дальнейшем делит выборку на подгруппы
.
Если одна из независимых переменных
находится в слое
1,
а вторая
-
в слое
2,
то результаты будут выведены в одной таблице
сопряженности
,
а не в отдельных таблицах для каждой независимой переменной
.
E
Кроме того
,
можно щелкнуть
Параметры
для получения дополнительных статистических
данных
,
таблицы дисперсионного анализа
,
значения эта
(eta),
эта квадрат
,
R
и
R
2
.
40
Глава 7
Параметры процедуры Средние
Рисунок 7-2
Диалоговое окно Средние: Параметры
Вы можете выбрать одну или несколько из следующих статистик для подгрупп
,
рассчитываемых для переменных внутри каждой отдельной категории каждой
группирующей переменной
:
сумма
,
число наблюдений
,
среднее значение
,
медиана
,
медиана группы
,
стандартная ошибка среднего значения
,
минимальное и максимальное
значения
,
размах
,
значение группирующей переменной для первой категории
,
значение
группирующей переменной для последней категории
,
стандартное отклонение
,
дисперсия
,
эксцесс
,
стандартная ошибка эксцесса
,
асимметрия
,
стандартная ошибка асимметрии
,
процент от общей суммы
,
процент от общего
N
,
процент от суммы в
,
процент от
N
в
,
геометрическое среднее
,
гармоническое среднее
.
Вы можете изменить порядок
,
в котором
выводятся статистики подгрупп
.
Порядок
,
в котором статистики приведены в списке
Статистики в ячейках
,
определяет их порядок при выводе
.
Итожащие статистики также
выводятся для каждой переменной по всем категориям
.
Первое.
Выводит первое значение данных
,
встреченное в файле данных
.
Геометрическое среднее.
Корень
n-
й степени из произведения
n
значений наблюдений
.
Групповая медиана.
Медианы
,
вычисленные для данных
,
закодированных по
принадлежности к группам
.
Например
,
для данных о возрасте каждое значение для
30-
летних кодируется как
35,
каждое значение для
40-
летних кодируется как
45
и т
.
д
.;
групповая медиана
-
это медиана
,
вычисленная по закодированным данным
.
Гармоническое среднее.
Используется для оценки среднего объема группы
,
когда объемы
выборок в группах различаются
.
Гармоническое среднее
-
это общее число выборок
,
деленное на сумму величин
,
обратных объемам отдельных групп
.
41
Средние
Эксцесс.
Мера сгруппированности наблюдений вокруг центральной точки
.
Для
нормального распределения значение эксцесса равно
0.
Положительный эксцесс
указывает на то
,
что по отношению к нормальному распределению наблюдения для таких
распределений сгруппированы более плотно около центра и имеют более тонкие хвосты до
экстремумов распределения
,
и более толстые хвосты в области экстремальных значений
.
Отрицательный эксцесс указывает на то
,
что по отношению к нормальному распределению
наблюдения для таких распределений сгруппированы менее плотно около центра и имеют
более толстые хвосты до экстремумов распределения
,
и более тонкие хвосты в области
экстремальных значений
.
Последнее.
Выводит последнее значение в файле данных
.
Максимум.
Наибольшее значение числовой переменной
.
Среднее.
Мера центральной тенденции
.
Арифметическое среднее
;
сумма
,
деленная на
число наблюдений
.
Медиана.
Значение
,
выше и ниже которого попадает по половине наблюдений
,
иначе
50-
й процентиль
.
Если число наблюдений четно
,
медиана есть арифметическое среднее
двух находящихся в середине значений
,
если выборку упорядочить по убыванию или
по возрастанию
.
Медиана представляет собой меру центральной тенденции
,
которая
нечувствительна к выбросам
,
в отличие от среднего значения
,
которое могут исказить
несколько экстремально больших или малых значений
.
Минимум.
Наименьшее значение числовой переменной
.
Количество.
Число случаев
(
наблюдений или записей
).
Процент от общего количества N.
Процент от общего количества наблюдений в каждой
категории
.
Процент от общей суммы.
Процент от общей суммы в каждой категории
.
Диапазон.
Разность между наибольшим и наименьшим значениями числовой переменной
;
максимум минус минимум
.
Асимметрия.
Мера асимметрии распределения
.
Нормальное распределение симметрично
,
и для него асимметрия равна
0.
Распределение со значимой положительной асимметрией
имеет длинный хвост справа
.
Распределение со значимой отрицательной асимметрией
имеет длинный хвост слева
.
В качестве грубого правила можно сказать
,
что значение
асимметрии
,
более чем вдвое превышающее ее стандартную ошибку
,
указывает на наличие
асимметрии распределения
.
Стандартная ошибка эксцесса.
Отношение эксцесса к его стандартной ошибке можно
использовать как критерий нормальности
(
то есть
,
можно отвергнуть нормальность
,
если
это отношение меньше
–2
или больше
+2).
Большое положительное значение эксцесса
указывает
,
что хвосты распределения длиннее
,
чем у нормального
;
отрицательное значение
эксцесса указывает на более короткие хвосты
(
как у равномерного распределения
).
Стандартная ошибка асимметрии.
Отношение асимметрии к ее стандартной ошибке
можно использовать как критерий нормальности
(
то есть
,
можно отвергнуть нормальность
,
если это отношение меньше
,
чем
–2,
или больше
,
чем
+2).
Большое положительное
значение асимметрии указывает на длинный правый хвост
(
распределения
);
большое
отрицательное значение
-
на длинный левый хвост
.