ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3683
Скачиваний: 4
42
Глава 7
Сумма.
Сумма или итог для всех значений по всем наблюдениям
,
имеющим
непропущенные значения
.
Дисперсия.
Мера разброса относительно среднего значения
.
Равна сумме квадратов
отклонений от среднего
,
деленной на число
,
на единицу меньшее числа наблюдений
.
Дисперсия измеряется в единицах
,
которые равны квадратам единиц измерения самой
переменной
.
Статистики для первого слоя
Таблица дисперсионного анализа и эта.
Выводит таблицу однофакторного
дисперсионного анализа и вычисляет значение эта и эта в квадрате
(
меры близости
)
для
каждой независимой переменной в первом слое
.
Критерий линейности.
Вычисляет сумму квадратов
,
степени свободы и средний квадрат
для линейных и нелинейных компонентов
,
а также
F-
отношение
,
значения
R
и
R-
квадрат
.
Линейность не вычисляется
,
если независимой объявлена короткая текстовая переменная
.
Глава
8
OLAP Кубы
Процедура
OLAP (Online Analytical Processing)
Кубы вычисляет итоги
,
средние значения и
другие одномерные статистики для количественных подытоживаемых переменных внутри
категорий одной или нескольких категориальных группирующих переменных
.
Для каждой
категории каждой группирующей переменной в таблице создается отдельный слой
.
Пример.
Суммарные продажи и средние объемы одной продажи для разных регионов и
видов товаров внутри регионов
.
Статистики.
Сумма
,
число наблюдений
,
среднее значение
,
медиана
,
групповая медиана
,
стандартная ошибка среднего
,
минимум
,
максимум
,
размах
,
значение переменной для
первой категории группирующей переменной
,
значение переменной для последней
категории группирующей переменной
,
стандартное отклонение
,
дисперсия
,
эксцесс
,
стандартная ошибка эксцесса
,
асимметрия
,
стандартная ошибка асимметрии
,
процент
от общего количества наблюдений
,
процент общей суммы
,
процент общего количества
наблюдений в категориях группирующих переменных
,
процент общей суммы в категориях
группирующих переменных
,
геометрическое среднее
,
гармоническое среднее
.
Данные.
Подытоживаемые переменные являются количественными
(
непрерывными
переменными
,
измеренными в интервальной шкале или шкале отношений
),
а
группирующие переменные являются категориальными
.
Значения группирующих
переменных могут быть числовыми и текстовыми
.
Предположения.
Некоторые статистики для подгрупп
,
например
,
среднее и стандартное
отклонение
,
основаны на теории нормального распределения и подходят для
количественных переменных с симметричными распределениями
.
Робастные статистики
,
такие как медиана и размах
,
годятся и для количественных переменных
,
которые могут не
удовлетворять условию нормальной распределенности
.
Как получить OLAP Кубы
E
Выберите в меню
:
Анализ > Отчеты > OLAP кубы...
© Copyright IBM Corporation 1989, 2011.
43
44
Глава 8
Рисунок 8-1
Диалоговое окно OLAP Кубы
E
Выберите одну или несколько количественных подытоживаемых переменных
.
E
Выберите одну или несколько категориальных группирующих переменных
.
Дополнительно можно
:
Выбрать различные итожащие статистики
(
щелкните мышью по кнопке
Статистики
).
Перед выбором статистик необходимо задать одну или более группирующих
переменных
.
Вычислить разности между парами переменных и парами групп
,
заданных
группирующей переменной
(
щелкните по
Разности
).
Создать и отредактировать заголовки
(
щелкните мышью по кнопке
Заголовок
).
Скрыть частоты
,
меньшие заданного целого
.
Скрытые значения будут выводиться как
<N
,
где
N
-
заданное целое
.
Заданное целое должно быть больше или равно
2.
45
OLAP Кубы
Статистики в процедуре OLAP Кубы
Рисунок 8-2
Диалоговое окно OLAP Кубы: Статистики
Вы можете выбрать одну или несколько статистик подгрупп для подытоживаемых
переменных в каждой категории группирующей переменной
:
сумма
,
число наблюдений
,
среднее значение
,
медиана
,
групповая медиана
,
стандартная ошибка среднего значения
,
минимум
,
максимум
,
размах
,
значение переменной для первой категории группирующей
переменной
,
значение переменной для последней категории группирующий переменной
,
стандартное отклонение
,
дисперсия
,
эксцесс
,
стандартная ошибка эксцесса
,
асимметрия
,
стандартная ошибка асимметрии
,
процент от общего числа наблюдений
,
процент от общей
суммы
,
процент от общего числа наблюдений в категориях группирующих переменных
,
процент от общий суммы в категориях группирующих переменных
,
геометрическое
среднее
,
гармоническое среднее
.
Вы можете изменить порядок
,
в котором выводятся статистики подгрупп
.
Порядок
,
в
котором статистики приведены в списке Статистики в ячейках
,
определяет их порядок
при выводе
.
Итожащие статистики также выводятся для каждой переменной по всем
категориям
.
Первое.
Выводит первое значение данных
,
встреченное в файле данных
.
Геометрическое среднее.
Корень
n-
й степени из произведения
n
значений наблюдений
.
Групповая медиана.
Медианы
,
вычисленные для данных
,
закодированных по
принадлежности к группам
.
Например
,
для данных о возрасте каждое значение для
30-
летних кодируется как
35,
каждое значение для
40-
летних кодируется как
45
и т
.
д
.;
групповая медиана
-
это медиана
,
вычисленная по закодированным данным
.
Гармоническое среднее.
Используется для оценки среднего объема группы
,
когда объемы
выборок в группах различаются
.
Гармоническое среднее
-
это общее число выборок
,
деленное на сумму величин
,
обратных объемам отдельных групп
.
46
Глава 8
Эксцесс.
Мера сгруппированности наблюдений вокруг центральной точки
.
Для
нормального распределения значение эксцесса равно
0.
Положительный эксцесс
указывает на то
,
что по отношению к нормальному распределению наблюдения для таких
распределений сгруппированы более плотно около центра и имеют более тонкие хвосты до
экстремумов распределения
,
и более толстые хвосты в области экстремальных значений
.
Отрицательный эксцесс указывает на то
,
что по отношению к нормальному распределению
наблюдения для таких распределений сгруппированы менее плотно около центра и имеют
более толстые хвосты до экстремумов распределения
,
и более тонкие хвосты в области
экстремальных значений
.
Последнее.
Выводит последнее значение в файле данных
.
Максимум.
Наибольшее значение числовой переменной
.
Среднее.
Мера центральной тенденции
.
Арифметическое среднее
;
сумма
,
деленная на
число наблюдений
.
Медиана.
Значение
,
выше и ниже которого попадает по половине наблюдений
,
иначе
50-
й процентиль
.
Если число наблюдений четно
,
медиана есть арифметическое среднее
двух находящихся в середине значений
,
если выборку упорядочить по убыванию или
по возрастанию
.
Медиана представляет собой меру центральной тенденции
,
которая
нечувствительна к выбросам
,
в отличие от среднего значения
,
которое могут исказить
несколько экстремально больших или малых значений
.
Минимум.
Наименьшее значение числовой переменной
.
Количество.
Число случаев
(
наблюдений или записей
).
Процент от N в.
Процент от количества наблюдений для указанной группирующей
переменной внутри категорий другой группирующей переменной
.
Если имеется только
одна группирующая переменная
,
это значение совпадает с процентом от общего числа
наблюдений
.
Процент от суммы в.
Процент от суммы для указанной группирующей переменной внутри
категорий другой группирующей переменной
.
Если имеется только одна группирующая
переменная
,
это значение совпадает с процентом от общей суммы
.
Процент от общего N.
Процент от общего количества наблюдений в каждой категории
.
Процент от общей суммы.
Процент от общей суммы в каждой категории
.
Диапазон.
Разность между наибольшим и наименьшим значениями числовой переменной
;
максимум минус минимум
.
Асимметрия.
Мера асимметрии распределения
.
Нормальное распределение симметрично
,
и для него асимметрия равна
0.
Распределение со значимой положительной асимметрией
имеет длинный хвост справа
.
Распределение со значимой отрицательной асимметрией
имеет длинный хвост слева
.
В качестве грубого правила можно сказать
,
что значение
асимметрии
,
более чем вдвое превышающее ее стандартную ошибку
,
указывает на наличие
асимметрии распределения
.
Стандартная ошибка эксцесса.
Отношение эксцесса к его стандартной ошибке можно
использовать как критерий нормальности
(
то есть
,
можно отвергнуть нормальность
,
если
это отношение меньше
–2
или больше
+2).
Большое положительное значение эксцесса