ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 17.11.2021

Просмотров: 3653

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

12

Глава 2

отражает количество значений числовой переменной

,

попавших внутрь интервала

,

соответствующего этому столбику

.

Гистограмма показывает форму

,

центр и разброс

распределения

.

На гистограмму можно наложить кривую нормального распределения

,

которая поможет оценить

,

насколько распределение данных близко к нормальному

.

Значения на диаграмме.

Для столбиковых диаграмм можно помечать ось

Y

частотами

или процентами

.

Частоты: Формат

Рисунок 2-4

Диалоговое окно Частоты: Формат

Упорядочить по...

Данные в таблице частот могут быть расположены в порядке возрастания

или убывания значений данных

,

либо в порядке возрастания или убывания частот этих

значений

.

Однако

,

если задано построение гистограмм или вычисление процентилей

,

то

процедура Частоты предполагает

,

что анализируемая переменная является количественной

,

и выводит ее значения в порядке возрастания

.

Несколько переменных.

Если Вы строите таблицы статистик для нескольких переменных

,

можно либо вывести все переменные в одной таблице

(

Сравнить переменные

),

либо вывести

отдельную таблицу для каждой переменной

(

Выводить по переменным

).

Запрещать таблицы, если категорий больше, чем:

Этот параметр предотвращает вывод

таблиц с числом категорий

,

большим заданного значения

.


background image

Глава

3

Описательные

Процедура Описательные статистики осуществляет вывод одномерных итожащих статистик
для нескольких переменных в одной таблице

,

а также вычисляет стандартизованные

значения

(

z

-

значения

)

переменных

.

Переменные могут быть упорядочены по величине их

средних значений

(

в порядке возрастания или убывания

),

по алфавиту или в порядке

,

в

котором Вы выбираете переменные

(

по умолчанию

).

При сохранении

z

-

значений они добавляются к данным в Редакторе данных и могут быть

впоследствии использованы для построения графиков

,

вывода их значений и в других

процедурах

IBM SPSS Statistics.

Если переменные измерены в разных единицах

(

например

,

валовой внутренний продукт на душу населения и процент грамотных

),

преобразование

к

z

-

значениям приводит переменные к единому масштабу

,

что облегчает их визуальное

сравнение

.

Пример.

Если каждое наблюдение в анализируемых данных содержит итоги дневных

объемов продаж для одного из членов коллектива продавцов

(

например

,

одно значение

-

для

Алексея

,

одно

-

для Марии

,

одно

-

для Бориса

)

в течение нескольких месяцев

,

то процедура

Описательные статистики может рассчитать средний дневной объем продаж для каждого
продавца и расположить результаты в порядке от наиболее высоких средних ежедневных
продаж к наиболее низким

.

Статистики.

Объем выборки

,

среднее значение

,

минимальное и максимальное значения

,

стандартное отклонение

,

дисперсия

,

размах

,

сумма

,

стандартная ошибка среднего

,

асимметрия

,

эксцесс

,

стандартные ошибки асимметрии и эксцесса

.

Данные.

Используйте числовые переменные после того

,

как Вы исследовали их

диаграммы на наличие ошибок записи

,

выбросов и аномалий в распределениях

.

Процедура

Описательные статистики очень эффективно работает с файлами большого размера

(

содержащими тысячи наблюдений

).

Предположения.

Большинство статистик

,

которые могут быть вычислены при работе

с данной процедурой

(

в том числе и

z

-

значения

),

основаны на теории нормального

распределения и подходят для количественных переменных

(

измеренных в интервальной

шкале или шкале отношений

),

распределенных симметрично

.

Избегайте переменных с

неупорядоченными категориями или несимметричными распределениями

.

Распределение

z

-

значений имеет ту же форму

,

что и распределение исходных данных

;

поэтому переход к

z

-

значениям не является средством исправления

недостатков

данных

.

Как получить описательные статистики

E

Выберите в меню

:

Анализ > Описательные статистики > Описательные...

© Copyright IBM Corporation 1989, 2011.

13


background image

14

Глава 3

Рисунок 3-1

Диалоговое окно Описательные статистики

E

Выберите одну или несколько переменных

.

Дополнительно Вы можете

:

Выбрать параметр

Сохранить стандартизованные значения в переменных

,

чтобы

сохранить

z

-

значения как новые переменные

.

Щелкнуть мышью по кнопке

Параметры

,

чтобы выбрать дополнительные статистики и

изменить порядок вывода результатов

.

Параметры процедуры Описательные статистики

Рисунок 3-2

Диалоговое окно Описательные статистики: Параметры


background image

15

Описательные

Среднее и сумма.

Среднее значение или арифметическое среднее значение выводятся

по умолчанию

.

Разброс.

Статистики

,

которые измеряют разброс данных

,

включают в себя стандартное

отклонение

,

дисперсию

,

размах

,

минимальное и максимальное значения

,

а также

стандартную ошибку среднего значения

.

Стандартное отклонение.

Мера разброса вокруг среднего

.

При нормальном

распределении

68%

наблюдений укладываются в одно стандартное отклонение от

среднего

,

и

95% -

в два стандартных отклонения

.

Если

,

например

,

средний возраст

равен

45

годам со стандартным отклонением

10,

то

95%

наблюдений должны оказаться

между

25

и

65

годами при нормальном распределении

.

Дисперсия.

Мера разброса относительно среднего значения

.

Равна сумме квадратов

отклонений от среднего

,

деленной на число

,

на единицу меньшее числа наблюдений

.

Дисперсия измеряется в единицах

,

которые равны квадратам единиц измерения самой

переменной

.

Диапазон.

Разность между наибольшим и наименьшим значениями числовой

переменной

;

максимум минус минимум

.

Минимум.

Наименьшее значение числовой переменной

.

Максимум.

Наибольшее значение числовой переменной

.

Стандартная ошибка среднего.

Мера того

,

как сильно может отличаться значение

среднего от выборки к выборке

,

извлекаемое из одного и того же распределения

.

Можно применять для грубого сравнения наблюденного среднего с гипотетическим
значением

(

то есть можно заключить

,

что два значения различаются

,

если отношение

их разности к стандартному отклонению меньше

-2

или больше

+2).

Распределение.

Эксцесс и асимметрия представляют собой статистики

,

описывающие

форму и степень симметричности распределения

.

Эти статистики выводятся вместе с их

стандартными ошибками

.

Эксцесс.

Мера сгруппированности наблюдений вокруг центральной точки

.

Для

нормального распределения значение эксцесса равно

0.

Положительный эксцесс

указывает на то

,

что по отношению к нормальному распределению наблюдения для

таких распределений сгруппированы более плотно около центра и имеют более
тонкие хвосты до экстремумов распределения

,

и более толстые хвосты в области

экстремальных значений

.

Отрицательный эксцесс указывает на то

,

что по отношению

к нормальному распределению наблюдения для таких распределений сгруппированы
менее плотно около центра и имеют более толстые хвосты до экстремумов
распределения

,

и более тонкие хвосты в области экстремальных значений

.

Асимметрия.

Мера асимметрии распределения

.

Нормальное распределение

симметрично

,

и для него асимметрия равна

0.

Распределение со значимой

положительной асимметрией имеет длинный хвост справа

.

Распределение со

значимой отрицательной асимметрией имеет длинный хвост слева

.

В качестве грубого

правила можно сказать

,

что значение асимметрии

,

более чем вдвое превышающее ее

стандартную ошибку

,

указывает на наличие асимметрии распределения

.

Порядок вывода.

По умолчанию переменные выводятся в том порядке

,

в котором они

выбирались пользователем

.

Вы также можете выводить переменные в алфавитном порядке

,

в порядке возрастания средних значений или в порядке убывания средних значений

.


background image

16

Глава 3

Команда DESCRIPTIVES: дополнительные возможности

Язык синтаксиса команд также позволяет

:

Сохранять стандартизованные значения

(

z

-

значения

)

для некоторых

,

но не всех

переменных

(

с помощью подкоманды

VARIABLES

).

Задавать имена новых переменных

,

содержащих стандартизованные значения

(

с

помощью подкоманды

VARIABLES

).

Исключать из анализа наблюдения с пропущенными значениями в какой

-

либо

переменной

(

с помощью подкоманды

MISSING

).

Сортировать переменные в выводе по значению любой статистики

,

а не только среднего

(

с помощью подкоманды

SORT

).

Полную информацию о синтаксисе языка команд можно найти в

Руководстве по

синтаксису

.