Файл: Учебнометодическое пособие знакомит студентов с основными понятиями о.doc
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.12.2023
Просмотров: 469
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
, которые обсуждались ранее, я бы рекомендовал Вам, чтобы Вы всегда анализировали только двухстороннюю р-оценку.
Парный или непарный тест?
Когда Вы сравниваете две группы, Вам необходимо решить использовать или не использовать парный тест. Когда Вы сравниваете три или более группы, термин парные уже не используется, используется термин повторные измерения.
Вы должны использовать парный тест, когда Вы сравниваете группы, в которых индивидуальные значения не связаны друг с другом и не соотнесены один с другим. Выбирайте парный тест или тесты с повторными измерениями, когда значения представляют собой повторные измерения у одного и того же субъекта (до и после вмешательства) или измерения, сделанные на специально подобранных парах наблюдений. Парные или тесты с повторными измерениями также подходят для повторных экспериментов в лаборатории, которые выполняются в разное время каждый раз со своим собственным контролем.
Вы должны подбирать парный тест, когда значение в одной группе больше коррелирует с определенными значениями в другой группе, чем со случайными значениями в другой группе. Адекватным является выбирать парный тест только в том случае, если субъекты были собраны в пары до начала сбора данных. Вы не можете создавать парный тест на данных, которые Вы собрали ранее, а сейчас анализируете.
Тест Фишера или хи-квадрат?
Когда Вы анализируете таблицы сопряженности с двумя строками и двумя столбцами, Вы можете использовать либо точный тест Фишера, либо тест хи-квадрат. Тест Фишера является более хорошим выбором, поскольку он всегда дает точное значение р-оценки. Хи-квадрат легче подсчитывать, но он дает только примерное значение р-оценки. Если компьютер делает все расчеты, Вы должны выбирать тест Фишера за исключением ситуации, когда Вы предпочитаете хи-квадрат на основе того, что он более хорошо известен. Вы должны совершенно четко избегать хи-квадрат в том случае, если количество наблюдений (любое число ниже 6). Когда значение больше р-оценки, которые получаются в результате использования теста хи-квадрат и теста Фишера будут очень похожи друг на друга.
Тест хи-квадрат рассчитывает примерные p-значения и поправка Йетса на непрерывность предназначена для того, чтобы сделать это приближение лучше. Без поправки Йетса p-значения слишком небольшие, однако если коррекция заходит слишком далеко, результирующая p-оценка оказывается слишком большой. Статистики дают различные рекомендации по отношению к поправке Йетса. Когда имеется большая выборка, то поправка Йетса не приводит к серьезным различиям. Если Вы выбираете тест Фишера, p-значение является точным и в этой ситуации поправка Йетса на непрерывность не является необходимой.
Регрессия или корреляция?
Линейная регрессия и корреляция являются очень похожими друг на друга и их легко спутать. В некоторых ситуациях имеет смысл выполнять оба типа расчета. Рассчитывайте линейную корреляцию, если Вы измеряете как Х, так и Y у каждого обследованного и хотите оценить насколько хорошо они связаны друг с другом. Выбирайте Пирсоновский (параметрический коэффициент) коэффициент корреляции если Вы предполагаете, что Х и Y были выбраны из Гауссовой популяции. В другом случае выбирайте непараметрический коэффициент корреляции Спирмена. Не рассчитывайте коэффициент корреляции или доверительный интервал если Вы сами воздействовали на значение переменной Х. Рассчитывайте линейную регрессию только в том случае, если одна из переменных Х по всей вероятности является предшественником или причиной изменения другой переменной Y. Совершенно четко выбирайте линейную регрессию, если Вы сами воздействовали на переменную Х. В линейной регрессии очень серьезные различия получаются в зависимости от того, какая переменная обозначается Х, а какая переменная обозначается Y, поскольку подсчеты при помощи линейной регрессии не симметричны по отношению к Х и Y. Если Вы поменяете местами эти две переменные, Вы можете получить другую регрессионную линию. В противоположность этому линейный коэффициент корреляции симметричный по отношению к Х и Y, и если Вы поменяете местами маркеры для Х и Y, Вы получите тот же самый корреляционный коэффициент.
Вопросы для самопроверки:
РАЗДЕЛ IV. РАБОТА С ПРОГРАММОЙ EASYSTATISTICS
Общие сведения о программе EasyStatistics
В программе 3 основных страницы: "Новый файл", "Выборка" и "Результаты".
В окне "Новый файл" проводятся основные операции с базой:
1. Создание нового файла
2. Редактирование
3. Изменение названий переменных и случаев.
4. Сохранение файла
5. Установка фильтра
Внимание: все расчеты осуществляются по окну "Выборка"
В случае если открывается уже ранее созданный файл окна "Файл данных" и "Выборка" совпадают. Это значит, что для вычисления любой статистики будут использованы все переменные и случаи. Если необходимы только часть из них, необходимо воспользоваться кнопкой "Фильтр".
Окно "Выборка" предназначено для
1. Просмотра текущих переменных и случаев, используемых в анализе
2. Сохранения части основной базы в виде отдельного файла
Окно "Результаты" предназначено для
1. Просмотра результатов
2. Печати результатов
3. Сохранения результатов в виде текстового файла или файла MS Excel
4. Копирования результатов в буфер обмена
Внимание: кнопка печать работает только в окне "Результаты"
Статистические методы:
Создание новой базы данных
Для создания новой базы данных необходимо выбрать пункт меню Файл→Новый или нажать кнопку в панели инструментов.
В появившемся окне потребуется ввести количество переменных и случаев
После нажатия кнопки "Создать" в окне "Новый файл" формируется таблица нужных размеров. По умолчанию все переменные называются VAR1, VAR2 и т.д.
Для того, чтобы изменить названия переменных и случаев надо выбрать пункт меню "Правка→Редактировать названия переменных и случаев" или кнопку
После окончания редактирования рекомендуется снова нажать кнопку или пункт меню "Правка→Завершить редактирование".
Внимание: Называть переменные можно по-русски, но если потом потребуется перевод файла в другие статистические программы, то рекомендуется ввод английскими буквами и до 8 символов (например, вместо "Возраст" можно написать "Age" или "Vozrast").
Теперь заполняются данные:
Внимание: В том случае если на какой-то объект исследования нет данных, то просто оставляется пустое место
После окончания ввода базу данных желательно сохранить "Файл → сохранить как". Поддерживаются форматы:
Внимание: Программа никак не отслеживает сохранены данные или нет. Если закрыть программу, не сохранив файл, то потеряются все набранные данные.
Работа с файлами
Парный или непарный тест?
Когда Вы сравниваете две группы, Вам необходимо решить использовать или не использовать парный тест. Когда Вы сравниваете три или более группы, термин парные уже не используется, используется термин повторные измерения.
Вы должны использовать парный тест, когда Вы сравниваете группы, в которых индивидуальные значения не связаны друг с другом и не соотнесены один с другим. Выбирайте парный тест или тесты с повторными измерениями, когда значения представляют собой повторные измерения у одного и того же субъекта (до и после вмешательства) или измерения, сделанные на специально подобранных парах наблюдений. Парные или тесты с повторными измерениями также подходят для повторных экспериментов в лаборатории, которые выполняются в разное время каждый раз со своим собственным контролем.
Вы должны подбирать парный тест, когда значение в одной группе больше коррелирует с определенными значениями в другой группе, чем со случайными значениями в другой группе. Адекватным является выбирать парный тест только в том случае, если субъекты были собраны в пары до начала сбора данных. Вы не можете создавать парный тест на данных, которые Вы собрали ранее, а сейчас анализируете.
Тест Фишера или хи-квадрат?
Когда Вы анализируете таблицы сопряженности с двумя строками и двумя столбцами, Вы можете использовать либо точный тест Фишера, либо тест хи-квадрат. Тест Фишера является более хорошим выбором, поскольку он всегда дает точное значение р-оценки. Хи-квадрат легче подсчитывать, но он дает только примерное значение р-оценки. Если компьютер делает все расчеты, Вы должны выбирать тест Фишера за исключением ситуации, когда Вы предпочитаете хи-квадрат на основе того, что он более хорошо известен. Вы должны совершенно четко избегать хи-квадрат в том случае, если количество наблюдений (любое число ниже 6). Когда значение больше р-оценки, которые получаются в результате использования теста хи-квадрат и теста Фишера будут очень похожи друг на друга.
Тест хи-квадрат рассчитывает примерные p-значения и поправка Йетса на непрерывность предназначена для того, чтобы сделать это приближение лучше. Без поправки Йетса p-значения слишком небольшие, однако если коррекция заходит слишком далеко, результирующая p-оценка оказывается слишком большой. Статистики дают различные рекомендации по отношению к поправке Йетса. Когда имеется большая выборка, то поправка Йетса не приводит к серьезным различиям. Если Вы выбираете тест Фишера, p-значение является точным и в этой ситуации поправка Йетса на непрерывность не является необходимой.
Регрессия или корреляция?
Линейная регрессия и корреляция являются очень похожими друг на друга и их легко спутать. В некоторых ситуациях имеет смысл выполнять оба типа расчета. Рассчитывайте линейную корреляцию, если Вы измеряете как Х, так и Y у каждого обследованного и хотите оценить насколько хорошо они связаны друг с другом. Выбирайте Пирсоновский (параметрический коэффициент) коэффициент корреляции если Вы предполагаете, что Х и Y были выбраны из Гауссовой популяции. В другом случае выбирайте непараметрический коэффициент корреляции Спирмена. Не рассчитывайте коэффициент корреляции или доверительный интервал если Вы сами воздействовали на значение переменной Х. Рассчитывайте линейную регрессию только в том случае, если одна из переменных Х по всей вероятности является предшественником или причиной изменения другой переменной Y. Совершенно четко выбирайте линейную регрессию, если Вы сами воздействовали на переменную Х. В линейной регрессии очень серьезные различия получаются в зависимости от того, какая переменная обозначается Х, а какая переменная обозначается Y, поскольку подсчеты при помощи линейной регрессии не симметричны по отношению к Х и Y. Если Вы поменяете местами эти две переменные, Вы можете получить другую регрессионную линию. В противоположность этому линейный коэффициент корреляции симметричный по отношению к Х и Y, и если Вы поменяете местами маркеры для Х и Y, Вы получите тот же самый корреляционный коэффициент.
Вопросы для самопроверки:
-
Перечислите требования, которые необходимы для вычисления критерия Стьюдента, критерия 2 Пирсона. -
Что такое метод наименьших квадратов? -
Сформулируйте в примерах задачу из области Вашей будущей специализации, при решении которой необходимо вычислить: а) регрессионное уравнение б) частные коэффициенты корреляции -
Сформулируйте в содержательных понятиях задачи из области специализации, связанные с анализом динамических рядов. -
Сформулируйте в содержательных понятиях задачи из области специализации, связанные с анализом циклических явлений. -
На какие компоненты могут быть разложены динамические ряды и, какую информацию об исследуемом процессе несут эти компоненты? -
Как можно определить какое из регрессионных уравнений наилучшим способом описывает тренд динамического ряда. -
По каким показателям осуществляется объединение объектов в кластеры.
РАЗДЕЛ IV. РАБОТА С ПРОГРАММОЙ EASYSTATISTICS
Общие сведения о программе EasyStatistics
В программе 3 основных страницы: "Новый файл", "Выборка" и "Результаты".
В окне "Новый файл" проводятся основные операции с базой:
1. Создание нового файла
2. Редактирование
3. Изменение названий переменных и случаев.
4. Сохранение файла
5. Установка фильтра
Внимание: все расчеты осуществляются по окну "Выборка"
В случае если открывается уже ранее созданный файл окна "Файл данных" и "Выборка" совпадают. Это значит, что для вычисления любой статистики будут использованы все переменные и случаи. Если необходимы только часть из них, необходимо воспользоваться кнопкой "Фильтр".
Окно "Выборка" предназначено для
1. Просмотра текущих переменных и случаев, используемых в анализе
2. Сохранения части основной базы в виде отдельного файла
Окно "Результаты" предназначено для
1. Просмотра результатов
2. Печати результатов
3. Сохранения результатов в виде текстового файла или файла MS Excel
4. Копирования результатов в буфер обмена
Внимание: кнопка печать работает только в окне "Результаты"
Статистические методы:
% P-? | Описательная статистика Частотный анализ Таблицы 2х2 Сравнение независимых выборок Сравнение связанных выборок Дисперсионный анализ Корреляционный анализ Множественная регрессия Проверка типа распределения эмпирических данных Вероятностный калькулятор |
Создание новой базы данных
Для создания новой базы данных необходимо выбрать пункт меню Файл→Новый или нажать кнопку в панели инструментов.
В появившемся окне потребуется ввести количество переменных и случаев
После нажатия кнопки "Создать" в окне "Новый файл" формируется таблица нужных размеров. По умолчанию все переменные называются VAR1, VAR2 и т.д.
Для того, чтобы изменить названия переменных и случаев надо выбрать пункт меню "Правка→Редактировать названия переменных и случаев" или кнопку
После окончания редактирования рекомендуется снова нажать кнопку или пункт меню "Правка→Завершить редактирование".
Внимание: Называть переменные можно по-русски, но если потом потребуется перевод файла в другие статистические программы, то рекомендуется ввод английскими буквами и до 8 символов (например, вместо "Возраст" можно написать "Age" или "Vozrast").
Теперь заполняются данные:
Внимание: В том случае если на какой-то объект исследования нет данных, то просто оставляется пустое место
После окончания ввода базу данных желательно сохранить "Файл → сохранить как". Поддерживаются форматы:
-
est – основной формат EasyStatistics -
sta – формат Statistica 5.0-5.5 -
xls – формат MS Excel -
txt – текстовый формат с разделителями табуляции
Внимание: Программа никак не отслеживает сохранены данные или нет. Если закрыть программу, не сохранив файл, то потеряются все набранные данные.
Работа с файлами