ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3683

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

42

Глава 7

Сумма.

Сумма или итог для всех значений по всем наблюдениям

,

имеющим

непропущенные значения

.

Дисперсия.

Мера разброса относительно среднего значения

.

Равна сумме квадратов

отклонений от среднего

,

деленной на число

,

на единицу меньшее числа наблюдений

.

Дисперсия измеряется в единицах

,

которые равны квадратам единиц измерения самой

переменной

.

Статистики для первого слоя

Таблица дисперсионного анализа и эта.

Выводит таблицу однофакторного

дисперсионного анализа и вычисляет значение эта и эта в квадрате

(

меры близости

)

для

каждой независимой переменной в первом слое

.

Критерий линейности.

Вычисляет сумму квадратов

,

степени свободы и средний квадрат

для линейных и нелинейных компонентов

,

а также

F-

отношение

,

значения

R

и

R-

квадрат

.

Линейность не вычисляется

,

если независимой объявлена короткая текстовая переменная

.


background image

Глава

8

OLAP Кубы

Процедура

OLAP (Online Analytical Processing)

Кубы вычисляет итоги

,

средние значения и

другие одномерные статистики для количественных подытоживаемых переменных внутри
категорий одной или нескольких категориальных группирующих переменных

.

Для каждой

категории каждой группирующей переменной в таблице создается отдельный слой

.

Пример.

Суммарные продажи и средние объемы одной продажи для разных регионов и

видов товаров внутри регионов

.

Статистики.

Сумма

,

число наблюдений

,

среднее значение

,

медиана

,

групповая медиана

,

стандартная ошибка среднего

,

минимум

,

максимум

,

размах

,

значение переменной для

первой категории группирующей переменной

,

значение переменной для последней

категории группирующей переменной

,

стандартное отклонение

,

дисперсия

,

эксцесс

,

стандартная ошибка эксцесса

,

асимметрия

,

стандартная ошибка асимметрии

,

процент

от общего количества наблюдений

,

процент общей суммы

,

процент общего количества

наблюдений в категориях группирующих переменных

,

процент общей суммы в категориях

группирующих переменных

,

геометрическое среднее

,

гармоническое среднее

.

Данные.

Подытоживаемые переменные являются количественными

(

непрерывными

переменными

,

измеренными в интервальной шкале или шкале отношений

),

а

группирующие переменные являются категориальными

.

Значения группирующих

переменных могут быть числовыми и текстовыми

.

Предположения.

Некоторые статистики для подгрупп

,

например

,

среднее и стандартное

отклонение

,

основаны на теории нормального распределения и подходят для

количественных переменных с симметричными распределениями

.

Робастные статистики

,

такие как медиана и размах

,

годятся и для количественных переменных

,

которые могут не

удовлетворять условию нормальной распределенности

.

Как получить OLAP Кубы

E

Выберите в меню

:

Анализ > Отчеты > OLAP кубы...

© Copyright IBM Corporation 1989, 2011.

43


background image

44

Глава 8

Рисунок 8-1

Диалоговое окно OLAP Кубы

E

Выберите одну или несколько количественных подытоживаемых переменных

.

E

Выберите одну или несколько категориальных группирующих переменных

.

Дополнительно можно

:

Выбрать различные итожащие статистики

(

щелкните мышью по кнопке

Статистики

).

Перед выбором статистик необходимо задать одну или более группирующих
переменных

.

Вычислить разности между парами переменных и парами групп

,

заданных

группирующей переменной

(

щелкните по

Разности

).

Создать и отредактировать заголовки

(

щелкните мышью по кнопке

Заголовок

).

Скрыть частоты

,

меньшие заданного целого

.

Скрытые значения будут выводиться как

<N

,

где

N

-

заданное целое

.

Заданное целое должно быть больше или равно

2.


background image

45

OLAP Кубы

Статистики в процедуре OLAP Кубы

Рисунок 8-2

Диалоговое окно OLAP Кубы: Статистики

Вы можете выбрать одну или несколько статистик подгрупп для подытоживаемых
переменных в каждой категории группирующей переменной

:

сумма

,

число наблюдений

,

среднее значение

,

медиана

,

групповая медиана

,

стандартная ошибка среднего значения

,

минимум

,

максимум

,

размах

,

значение переменной для первой категории группирующей

переменной

,

значение переменной для последней категории группирующий переменной

,

стандартное отклонение

,

дисперсия

,

эксцесс

,

стандартная ошибка эксцесса

,

асимметрия

,

стандартная ошибка асимметрии

,

процент от общего числа наблюдений

,

процент от общей

суммы

,

процент от общего числа наблюдений в категориях группирующих переменных

,

процент от общий суммы в категориях группирующих переменных

,

геометрическое

среднее

,

гармоническое среднее

.

Вы можете изменить порядок

,

в котором выводятся статистики подгрупп

.

Порядок

,

в

котором статистики приведены в списке Статистики в ячейках

,

определяет их порядок

при выводе

.

Итожащие статистики также выводятся для каждой переменной по всем

категориям

.

Первое.

Выводит первое значение данных

,

встреченное в файле данных

.

Геометрическое среднее.

Корень

n-

й степени из произведения

n

значений наблюдений

.

Групповая медиана.

Медианы

,

вычисленные для данных

,

закодированных по

принадлежности к группам

.

Например

,

для данных о возрасте каждое значение для

30-

летних кодируется как

35,

каждое значение для

40-

летних кодируется как

45

и т

.

д

.;

групповая медиана

-

это медиана

,

вычисленная по закодированным данным

.

Гармоническое среднее.

Используется для оценки среднего объема группы

,

когда объемы

выборок в группах различаются

.

Гармоническое среднее

-

это общее число выборок

,

деленное на сумму величин

,

обратных объемам отдельных групп

.


background image

46

Глава 8

Эксцесс.

Мера сгруппированности наблюдений вокруг центральной точки

.

Для

нормального распределения значение эксцесса равно

0.

Положительный эксцесс

указывает на то

,

что по отношению к нормальному распределению наблюдения для таких

распределений сгруппированы более плотно около центра и имеют более тонкие хвосты до
экстремумов распределения

,

и более толстые хвосты в области экстремальных значений

.

Отрицательный эксцесс указывает на то

,

что по отношению к нормальному распределению

наблюдения для таких распределений сгруппированы менее плотно около центра и имеют
более толстые хвосты до экстремумов распределения

,

и более тонкие хвосты в области

экстремальных значений

.

Последнее.

Выводит последнее значение в файле данных

.

Максимум.

Наибольшее значение числовой переменной

.

Среднее.

Мера центральной тенденции

.

Арифметическое среднее

;

сумма

,

деленная на

число наблюдений

.

Медиана.

Значение

,

выше и ниже которого попадает по половине наблюдений

,

иначе

50-

й процентиль

.

Если число наблюдений четно

,

медиана есть арифметическое среднее

двух находящихся в середине значений

,

если выборку упорядочить по убыванию или

по возрастанию

.

Медиана представляет собой меру центральной тенденции

,

которая

нечувствительна к выбросам

,

в отличие от среднего значения

,

которое могут исказить

несколько экстремально больших или малых значений

.

Минимум.

Наименьшее значение числовой переменной

.

Количество.

Число случаев

(

наблюдений или записей

).

Процент от N в.

Процент от количества наблюдений для указанной группирующей

переменной внутри категорий другой группирующей переменной

.

Если имеется только

одна группирующая переменная

,

это значение совпадает с процентом от общего числа

наблюдений

.

Процент от суммы в.

Процент от суммы для указанной группирующей переменной внутри

категорий другой группирующей переменной

.

Если имеется только одна группирующая

переменная

,

это значение совпадает с процентом от общей суммы

.

Процент от общего N.

Процент от общего количества наблюдений в каждой категории

.

Процент от общей суммы.

Процент от общей суммы в каждой категории

.

Диапазон.

Разность между наибольшим и наименьшим значениями числовой переменной

;

максимум минус минимум

.

Асимметрия.

Мера асимметрии распределения

.

Нормальное распределение симметрично

,

и для него асимметрия равна

0.

Распределение со значимой положительной асимметрией

имеет длинный хвост справа

.

Распределение со значимой отрицательной асимметрией

имеет длинный хвост слева

.

В качестве грубого правила можно сказать

,

что значение

асимметрии

,

более чем вдвое превышающее ее стандартную ошибку

,

указывает на наличие

асимметрии распределения

.

Стандартная ошибка эксцесса.

Отношение эксцесса к его стандартной ошибке можно

использовать как критерий нормальности

(

то есть

,

можно отвергнуть нормальность

,

если

это отношение меньше

–2

или больше

+2).

Большое положительное значение эксцесса