ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 17.11.2021
Просмотров: 3653
Скачиваний: 4
12
Глава 2
отражает количество значений числовой переменной
,
попавших внутрь интервала
,
соответствующего этому столбику
.
Гистограмма показывает форму
,
центр и разброс
распределения
.
На гистограмму можно наложить кривую нормального распределения
,
которая поможет оценить
,
насколько распределение данных близко к нормальному
.
Значения на диаграмме.
Для столбиковых диаграмм можно помечать ось
Y
частотами
или процентами
.
Частоты: Формат
Рисунок 2-4
Диалоговое окно Частоты: Формат
Упорядочить по...
Данные в таблице частот могут быть расположены в порядке возрастания
или убывания значений данных
,
либо в порядке возрастания или убывания частот этих
значений
.
Однако
,
если задано построение гистограмм или вычисление процентилей
,
то
процедура Частоты предполагает
,
что анализируемая переменная является количественной
,
и выводит ее значения в порядке возрастания
.
Несколько переменных.
Если Вы строите таблицы статистик для нескольких переменных
,
можно либо вывести все переменные в одной таблице
(
Сравнить переменные
),
либо вывести
отдельную таблицу для каждой переменной
(
Выводить по переменным
).
Запрещать таблицы, если категорий больше, чем:
Этот параметр предотвращает вывод
таблиц с числом категорий
,
большим заданного значения
.
Глава
3
Описательные
Процедура Описательные статистики осуществляет вывод одномерных итожащих статистик
для нескольких переменных в одной таблице
,
а также вычисляет стандартизованные
значения
(
z
-
значения
)
переменных
.
Переменные могут быть упорядочены по величине их
средних значений
(
в порядке возрастания или убывания
),
по алфавиту или в порядке
,
в
котором Вы выбираете переменные
(
по умолчанию
).
При сохранении
z
-
значений они добавляются к данным в Редакторе данных и могут быть
впоследствии использованы для построения графиков
,
вывода их значений и в других
процедурах
IBM SPSS Statistics.
Если переменные измерены в разных единицах
(
например
,
валовой внутренний продукт на душу населения и процент грамотных
),
преобразование
к
z
-
значениям приводит переменные к единому масштабу
,
что облегчает их визуальное
сравнение
.
Пример.
Если каждое наблюдение в анализируемых данных содержит итоги дневных
объемов продаж для одного из членов коллектива продавцов
(
например
,
одно значение
-
для
Алексея
,
одно
-
для Марии
,
одно
-
для Бориса
)
в течение нескольких месяцев
,
то процедура
Описательные статистики может рассчитать средний дневной объем продаж для каждого
продавца и расположить результаты в порядке от наиболее высоких средних ежедневных
продаж к наиболее низким
.
Статистики.
Объем выборки
,
среднее значение
,
минимальное и максимальное значения
,
стандартное отклонение
,
дисперсия
,
размах
,
сумма
,
стандартная ошибка среднего
,
асимметрия
,
эксцесс
,
стандартные ошибки асимметрии и эксцесса
.
Данные.
Используйте числовые переменные после того
,
как Вы исследовали их
диаграммы на наличие ошибок записи
,
выбросов и аномалий в распределениях
.
Процедура
Описательные статистики очень эффективно работает с файлами большого размера
(
содержащими тысячи наблюдений
).
Предположения.
Большинство статистик
,
которые могут быть вычислены при работе
с данной процедурой
(
в том числе и
z
-
значения
),
основаны на теории нормального
распределения и подходят для количественных переменных
(
измеренных в интервальной
шкале или шкале отношений
),
распределенных симметрично
.
Избегайте переменных с
неупорядоченными категориями или несимметричными распределениями
.
Распределение
z
-
значений имеет ту же форму
,
что и распределение исходных данных
;
поэтому переход к
z
-
значениям не является средством исправления
“
недостатков
”
данных
.
Как получить описательные статистики
E
Выберите в меню
:
Анализ > Описательные статистики > Описательные...
© Copyright IBM Corporation 1989, 2011.
13
14
Глава 3
Рисунок 3-1
Диалоговое окно Описательные статистики
E
Выберите одну или несколько переменных
.
Дополнительно Вы можете
:
Выбрать параметр
Сохранить стандартизованные значения в переменных
,
чтобы
сохранить
z
-
значения как новые переменные
.
Щелкнуть мышью по кнопке
Параметры
,
чтобы выбрать дополнительные статистики и
изменить порядок вывода результатов
.
Параметры процедуры Описательные статистики
Рисунок 3-2
Диалоговое окно Описательные статистики: Параметры
15
Описательные
Среднее и сумма.
Среднее значение или арифметическое среднее значение выводятся
по умолчанию
.
Разброс.
Статистики
,
которые измеряют разброс данных
,
включают в себя стандартное
отклонение
,
дисперсию
,
размах
,
минимальное и максимальное значения
,
а также
стандартную ошибку среднего значения
.
Стандартное отклонение.
Мера разброса вокруг среднего
.
При нормальном
распределении
68%
наблюдений укладываются в одно стандартное отклонение от
среднего
,
и
95% -
в два стандартных отклонения
.
Если
,
например
,
средний возраст
равен
45
годам со стандартным отклонением
10,
то
95%
наблюдений должны оказаться
между
25
и
65
годами при нормальном распределении
.
Дисперсия.
Мера разброса относительно среднего значения
.
Равна сумме квадратов
отклонений от среднего
,
деленной на число
,
на единицу меньшее числа наблюдений
.
Дисперсия измеряется в единицах
,
которые равны квадратам единиц измерения самой
переменной
.
Диапазон.
Разность между наибольшим и наименьшим значениями числовой
переменной
;
максимум минус минимум
.
Минимум.
Наименьшее значение числовой переменной
.
Максимум.
Наибольшее значение числовой переменной
.
Стандартная ошибка среднего.
Мера того
,
как сильно может отличаться значение
среднего от выборки к выборке
,
извлекаемое из одного и того же распределения
.
Можно применять для грубого сравнения наблюденного среднего с гипотетическим
значением
(
то есть можно заключить
,
что два значения различаются
,
если отношение
их разности к стандартному отклонению меньше
-2
или больше
+2).
Распределение.
Эксцесс и асимметрия представляют собой статистики
,
описывающие
форму и степень симметричности распределения
.
Эти статистики выводятся вместе с их
стандартными ошибками
.
Эксцесс.
Мера сгруппированности наблюдений вокруг центральной точки
.
Для
нормального распределения значение эксцесса равно
0.
Положительный эксцесс
указывает на то
,
что по отношению к нормальному распределению наблюдения для
таких распределений сгруппированы более плотно около центра и имеют более
тонкие хвосты до экстремумов распределения
,
и более толстые хвосты в области
экстремальных значений
.
Отрицательный эксцесс указывает на то
,
что по отношению
к нормальному распределению наблюдения для таких распределений сгруппированы
менее плотно около центра и имеют более толстые хвосты до экстремумов
распределения
,
и более тонкие хвосты в области экстремальных значений
.
Асимметрия.
Мера асимметрии распределения
.
Нормальное распределение
симметрично
,
и для него асимметрия равна
0.
Распределение со значимой
положительной асимметрией имеет длинный хвост справа
.
Распределение со
значимой отрицательной асимметрией имеет длинный хвост слева
.
В качестве грубого
правила можно сказать
,
что значение асимметрии
,
более чем вдвое превышающее ее
стандартную ошибку
,
указывает на наличие асимметрии распределения
.
Порядок вывода.
По умолчанию переменные выводятся в том порядке
,
в котором они
выбирались пользователем
.
Вы также можете выводить переменные в алфавитном порядке
,
в порядке возрастания средних значений или в порядке убывания средних значений
.
16
Глава 3
Команда DESCRIPTIVES: дополнительные возможности
Язык синтаксиса команд также позволяет
:
Сохранять стандартизованные значения
(
z
-
значения
)
для некоторых
,
но не всех
переменных
(
с помощью подкоманды
VARIABLES
).
Задавать имена новых переменных
,
содержащих стандартизованные значения
(
с
помощью подкоманды
VARIABLES
).
Исключать из анализа наблюдения с пропущенными значениями в какой
-
либо
переменной
(
с помощью подкоманды
MISSING
).
Сортировать переменные в выводе по значению любой статистики
,
а не только среднего
(
с помощью подкоманды
SORT
).
Полную информацию о синтаксисе языка команд можно найти в
Руководстве по
синтаксису
.