ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3677

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

37

Подытожить

Дисперсия.

Мера разброса относительно среднего значения

.

Равна сумме квадратов

отклонений от среднего

,

деленной на число

,

на единицу меньшее числа наблюдений

.

Дисперсия измеряется в единицах

,

которые равны квадратам единиц измерения самой

переменной

.


background image

Глава

7

Средние

Процедура Средние вычисляет средние значения для подгрупп и связанные с ними
одномерные статистики для зависимых переменных внутри категорий одной или
нескольких независимых переменных

.

Дополнительно вы можете провести однофакторный

дисперсионный анализ

,

найти значения статистики эта

(eta),

а также выполнить тесты

на линейность

.

Пример.

Измерим среднее поглощаемое количество жира для каждого из трех типов

кулинарного жира

,

и проведем однофакторный дисперсионный анализ для проверки

,

различаются ли эти средние значения

.

Статистики.

Сумма

,

число наблюдений

,

среднее значение

,

медиана

,

групповая медиана

,

стандартная ошибка среднего значения

,

минимальное и максимальное значения

,

размах

,

значение группирующей переменной для первой категории

,

значение группирующей

переменной для последней категории

,

стандартное отклонение

,

дисперсия

,

эксцесс

,

стандартная ошибка эксцесса

,

асимметрия

,

стандартная ошибка асимметрии

,

процент от

общей суммы

,

процент от общего

N

,

процент от суммы в

,

процент от

N

в

,

геометрическое

среднее

,

гармоническое среднее

.

Дополнительные статистики включают дисперсионный

анализ

,

значения эта

(eta)

и эта квадрат

,

а также критерий линейности

,

R

и

R

2

.

Данные.

Зависимые переменные

-

количественные

,

независимые переменные

-

категориальные

.

Значения группирующих переменных могут быть числовыми и

текстовыми

.

Предположения.

Некоторые статистики для подгрупп

,

например

,

среднее и стандартное

отклонение

,

основаны на теории нормального распределения и подходят для

количественных переменных с симметричными распределениями

.

Робастные статистики

,

такие как медиана

,

годятся и для количественных переменных

,

которые могут не

удовлетворять условию нормальной распределенности

.

Дисперсионный анализ является

робастным в отношении отклонений от нормальности

,

однако данные в каждой ячейке

должны быть симметричными

.

При проведении дисперсионного анализа предполагается

,

что группы принадлежат совокупностям с одинаковыми дисперсиями

.

Для проверки

этого предположения используйте критерий однородности дисперсии Ливиня

,

который

выполняется в процедуре Однофакторный дисперсионный анализ

.

Как выполнить процедуру Средние

E

Выберите в меню

:

Анализ > Сравнение средних > Средние...

© Copyright IBM Corporation 1989, 2011.

38


background image

39

Средние

Рисунок 7-1

Диалоговое окно Средние

E

Выберите одну или несколько зависимых переменных

.

E

Используйте один из следующих методов для выбора категориальных независимых

переменных

:

Выберите одну или несколько независимых переменных

.

Для каждой независимой

переменной результаты будут выведены отдельно

.

Выберите один или несколько слоев независимых переменных

.

Каждый слой в

дальнейшем делит выборку на подгруппы

.

Если одна из независимых переменных

находится в слое

1,

а вторая

-

в слое

2,

то результаты будут выведены в одной таблице

сопряженности

,

а не в отдельных таблицах для каждой независимой переменной

.

E

Кроме того

,

можно щелкнуть

Параметры

для получения дополнительных статистических

данных

,

таблицы дисперсионного анализа

,

значения эта

(eta),

эта квадрат

,

R

и

R

2

.


background image

40

Глава 7

Параметры процедуры Средние

Рисунок 7-2

Диалоговое окно Средние: Параметры

Вы можете выбрать одну или несколько из следующих статистик для подгрупп

,

рассчитываемых для переменных внутри каждой отдельной категории каждой
группирующей переменной

:

сумма

,

число наблюдений

,

среднее значение

,

медиана

,

медиана группы

,

стандартная ошибка среднего значения

,

минимальное и максимальное

значения

,

размах

,

значение группирующей переменной для первой категории

,

значение

группирующей переменной для последней категории

,

стандартное отклонение

,

дисперсия

,

эксцесс

,

стандартная ошибка эксцесса

,

асимметрия

,

стандартная ошибка асимметрии

,

процент от общей суммы

,

процент от общего

N

,

процент от суммы в

,

процент от

N

в

,

геометрическое среднее

,

гармоническое среднее

.

Вы можете изменить порядок

,

в котором

выводятся статистики подгрупп

.

Порядок

,

в котором статистики приведены в списке

Статистики в ячейках

,

определяет их порядок при выводе

.

Итожащие статистики также

выводятся для каждой переменной по всем категориям

.

Первое.

Выводит первое значение данных

,

встреченное в файле данных

.

Геометрическое среднее.

Корень

n-

й степени из произведения

n

значений наблюдений

.

Групповая медиана.

Медианы

,

вычисленные для данных

,

закодированных по

принадлежности к группам

.

Например

,

для данных о возрасте каждое значение для

30-

летних кодируется как

35,

каждое значение для

40-

летних кодируется как

45

и т

.

д

.;

групповая медиана

-

это медиана

,

вычисленная по закодированным данным

.

Гармоническое среднее.

Используется для оценки среднего объема группы

,

когда объемы

выборок в группах различаются

.

Гармоническое среднее

-

это общее число выборок

,

деленное на сумму величин

,

обратных объемам отдельных групп

.


background image

41

Средние

Эксцесс.

Мера сгруппированности наблюдений вокруг центральной точки

.

Для

нормального распределения значение эксцесса равно

0.

Положительный эксцесс

указывает на то

,

что по отношению к нормальному распределению наблюдения для таких

распределений сгруппированы более плотно около центра и имеют более тонкие хвосты до
экстремумов распределения

,

и более толстые хвосты в области экстремальных значений

.

Отрицательный эксцесс указывает на то

,

что по отношению к нормальному распределению

наблюдения для таких распределений сгруппированы менее плотно около центра и имеют
более толстые хвосты до экстремумов распределения

,

и более тонкие хвосты в области

экстремальных значений

.

Последнее.

Выводит последнее значение в файле данных

.

Максимум.

Наибольшее значение числовой переменной

.

Среднее.

Мера центральной тенденции

.

Арифметическое среднее

;

сумма

,

деленная на

число наблюдений

.

Медиана.

Значение

,

выше и ниже которого попадает по половине наблюдений

,

иначе

50-

й процентиль

.

Если число наблюдений четно

,

медиана есть арифметическое среднее

двух находящихся в середине значений

,

если выборку упорядочить по убыванию или

по возрастанию

.

Медиана представляет собой меру центральной тенденции

,

которая

нечувствительна к выбросам

,

в отличие от среднего значения

,

которое могут исказить

несколько экстремально больших или малых значений

.

Минимум.

Наименьшее значение числовой переменной

.

Количество.

Число случаев

(

наблюдений или записей

).

Процент от общего количества N.

Процент от общего количества наблюдений в каждой

категории

.

Процент от общей суммы.

Процент от общей суммы в каждой категории

.

Диапазон.

Разность между наибольшим и наименьшим значениями числовой переменной

;

максимум минус минимум

.

Асимметрия.

Мера асимметрии распределения

.

Нормальное распределение симметрично

,

и для него асимметрия равна

0.

Распределение со значимой положительной асимметрией

имеет длинный хвост справа

.

Распределение со значимой отрицательной асимметрией

имеет длинный хвост слева

.

В качестве грубого правила можно сказать

,

что значение

асимметрии

,

более чем вдвое превышающее ее стандартную ошибку

,

указывает на наличие

асимметрии распределения

.

Стандартная ошибка эксцесса.

Отношение эксцесса к его стандартной ошибке можно

использовать как критерий нормальности

(

то есть

,

можно отвергнуть нормальность

,

если

это отношение меньше

–2

или больше

+2).

Большое положительное значение эксцесса

указывает

,

что хвосты распределения длиннее

,

чем у нормального

;

отрицательное значение

эксцесса указывает на более короткие хвосты

(

как у равномерного распределения

).

Стандартная ошибка асимметрии.

Отношение асимметрии к ее стандартной ошибке

можно использовать как критерий нормальности

(

то есть

,

можно отвергнуть нормальность

,

если это отношение меньше

,

чем

–2,

или больше

,

чем

+2).

Большое положительное

значение асимметрии указывает на длинный правый хвост

(

распределения

);

большое

отрицательное значение

-

на длинный левый хвост

.