Файл: Учебнометодическое пособие знакомит студентов с основными понятиями о.doc
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 12.12.2023
Просмотров: 479
Скачиваний: 2
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
СОДЕРЖАНИЕ
Выбор между параметрическими и непараметрическими
тестами: легкая ситуация.
Выбор между параметрическими и непараметрическими тестами иногда достаточно прост: Вы должны четко выбрать параметрический тест, если Вы уверены, что Ваши данные были получены как выборка из популяции, которая соответствует нормальному распределению. Вы должны определенно выбирать непараметрический тест в следующих ситуациях:
-
Результат является ранговым значением или оценочным значением и популяция явно не имеет нормального распределения. Примеры могут включать ранжирование студентов, шкалу Апгара, которая измеряет здоровье новорожденных (измеряется на шкале от 0 до 10 и все значения являются целыми), визуальную аналоговую шкалу боли (которая измеряется на непрерывной шкале где 0 - это отсутствие боли и 10 - это непереносимая боль), и так называемая звездочная шкала, которая используется критиками при оценке фильмов и ресторанов (*неплохо, ***** прекрасно). -
Некоторые значения очень резко отличаются от остальных, то есть слишком высокие или слишком низкие для измерений. Даже если популяция является Гауссовой невозможно анализировать такие данные параметрическим тестом, поскольку Вы не знаете всех значений. Использование с этими данными непараметрического теста достаточно простое: Вы присваиваете тем значениям, которые являются слишком низкими для того, чтобы их можно было измерить произвольное, но очень небольшое значение, и для очень больших значений Вы присваиваете произвольное, но очень большое значение, а затем выполняете непараметрический тест. Поскольку непараметрические тесты базируются только на информации о ранговом положении значений, тот факт, что Вы не знаете точных значений этих показателей уже не будет Вам сильно мешать. -
Данные, которые достаточно точно измерены, но Вы уверены, что популяция не распределяется в соответствии с нормальным законом. Если данные не получены из Гауссовского распределения, тогда Вы должны вначале подумать нельзя ли трансформировать значение так, чтобы оно превратилось в Гауссовское. Например, Вы можете взять логарифм или величину обратную всем значениям. Часто имеются биологические или химические причины (также как и статистические) для того, чтобы выполнить ту или иную трансформацию.
Выбор между параметрическими и непараметрическими
тестами: сложные случаи.
Не всегда легко определить является ли выборка из Гауссовой популяции. Обратите внимание на следующие положения:
-
Если Вы имеете большое количество наблюдений (100 или более) Вы можете посмотреть на распределение данных и совершенно четко будет видно насколько оно соответствует знаменитой колоколообразной кривой нормального распределения. Формальный статистический тест (тест Колмогорова-Смирнова) может использоваться для того, чтобы проанализировать вопрос насколько распределение данных отличается от Гауссова распределения. Когда у Вас имеется только небольшое количество наблюдений, очень сложно принять решение о том, следуют ли данные Гауссовому распределению и формальные тесты также имеют очень маленькую статистическую мощность для того, чтобы найти различие между Гауссовым и не Гауссовым распределением. -
Вы должны посмотреть на предыдущие данные. Помните, что то что Вас интересует - это распределение популяции в целом, а не распределение Вашей выборки. Принимая решение о том, является ли Ваше распределение нормальным, посмотрите на все имеющиеся данные, а не только на данные нынешнего эксперимента. -
Обратите внимание на источники разброса, когда разброс идет как результат суммы различных источников и ни один из источников не является основным источником разброса, у Вас скорее всего будет распределение Гаусса. Когда люди сомневаются, то некоторые выбирают параметрические тесты (поскольку они не уверены, что нарушается допущение о следовании нормальному закону распределения), а другие выбирают непараметрические тесты (поскольку они не уверены, что выполняются допущения о соответствии распределения Гаусса.
Выбор между параметрическим и непараметрическим тестом: насколько это на самом деле влияет на результат?
На самом деле надо ли задумываться о выборе параметрического или непараметрического теста? Ответ зависит от размере выборки. Есть четыре вещи о которых следует подумать:
-
Большая выборка. Что произойдет, если Вы используете параметрический тест с данными, которые были получены на Гауссовой популяции? Центральная предельная теорема гарантирует, что параметрический тест будет хорошо работать с большими выборками если даже популяция, из которой была получены выборка, не является Гауссовой. Иными словами параметрические тесты являются устойчивыми к отклонению от Гауссового распределения в том случае, если выборка достаточно большая. Проблема, однако, заключается в том, что невозможно сказать насколько большая является достаточно большой и это все зависит от природы определенного не Гауссового распределения. Однако в том случае, если популяция не является действительно очень странной, Вы по всей вероятности, можете достаточно спокойно выбирать параметрический тест, если у Вас имеется по крайней мере, две дюжины наблюдений в каждой группе. -
Большая выборка. Что произойдет, если Вы будете использовать непараметрический тест с данными из Гауссовой популяции? Непараметрические тесты работают достаточно хорошо в большими выборками Гауссовой популяции. Р-значение имеет тенденцию быть немножко великоватым, но различия очень небольшие. Иными словами непараметрические тесты лишь ненамного менее мощны, чем параметрические тесты на больших выборках. -
Небольшие выборки. Что произойдет, если Вы будете использовать параметрический тест с данными от не Гауссовой популяции? Вы не можете полагаться на центральную предельную теорему и поэтому р-значение будет неправильным. -
Небольшие выборки. Что произойдет, если Вы будете использовать непараметрические тесты с данными из Гауссовой популяции? В этом случае р-оценка имеет тенденцию быть крайне высокой. Непараметрический тест не обладает достаточно высокой статистической мощностью на небольших выборках.
Поэтому большие наборы данных не представляют большой проблемы. Обычно достаточно легко сказать пришли ли данные из Гауссовой популяции, хотя на самом деле это уже не столь важно, поскольку непараметрические тесты достаточно мощны, а параметрические тесты устойчивы. Небольшие наборы данных как раз и являются основной проблемой. Достаточно сложно сказать пришли ли данные из Гауссовой популяции, однако это очень важно. Непараметрические тесты при небольшом объеме данных недостаточно мощны, а параметрические тесты не являются устойчивыми.
Одно или двухсторонняя p-оценка?
Для большинства статистических тестов Вы должны выбирать хотите ли Вы рассчитать одно- или двух- стороннюю р-оценку. Различия между одно и двухсторонней р-оценкой обсуждалось ранее, а теперь давайте вспомним про эти различия в контексте t-теста. Р-оценка подсчитывается для нулевой гипотезы что две популяции имеют одинаковые значения средних и любые различия между двумя выборочными средними являются следствием случайных факторов. Если эта нулевая гипотеза справедлива односторонняя р-оценка - это вероятность того, что две выборочных средних будут различаться настолько много, насколько было обнаружено или (даже больше) в направлении, которое было указано гипотезой за счет случайных факторов, даже если среднее в популяции в целом на самом деле равное. Двухсторонняя р-оценка также включает вероятность того, что выборочные средние могут различаться таким же образом и в противоположном направлении, то есть другая группа имеет большее среднее. Двухсторонняя р-оценка таким образом выше, чем односторонняя.
Односторонняя р-оценка является адекватной когда Вы можете точно установить (и перед сбором любых данных), что здесь нет никаких различий между средними либо различия будут идти в направлении, которое Вы можете указать с самого начала (то есть Вы можете указать в какой группе будут более высокие средние значения). Если Вы не можете указать направления или любые различия, прежде чем начинать сбор данных, тогда более адекватным будет использовать двухстороннюю р-оценку. Если Вы сомневаетесь, выбирайте двухстороннюю р-оценку.
Если Вы выбираете односторонний тест, Вы должны сделать это до сбора каких бы то ни было данных и Вам необходимо установить направление Вашей экспериментальной гипотезы. Если данные пойдут в другую сторону, Вы должны будете согласиться на то, что эти различия ассоциация или корреляция является следствием действия случайных факторов вне зависимости от того, насколько серьезными получаются эти различия. Если Вы будете заинтересованы (даже немного) тем, насколько данные могут пойти в "неправильном" направлении, то тогда Вы должны использовать двухстороннюю р-оценку. По этим и другим причинам