ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 03.12.2019

Просмотров: 885

Скачиваний: 3

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Иногда проводят сплошное обследование, т.е. обследуют каждый из объектов всей совокупности относительно признака, которым интересуются. На практике, однако, сплошное обследование применяется сравнительно редко. Например, если совокупность содержит очень большое число объектов, то провести сплошное обследование физически невозможно. Если обследование объекта связано с его уничтожением или требует больших материальных затрат, то проводить сплошное обследование практически не имеет смысла. В таких случаях случайно отбирают из всей совокупности ограниченное число объектов и подвергают их изучению.

Генеральная совокупность – это случайная величина,заданная на пространстве элементарных событий с выделенным в нём классом подмножеств событий, для которых указаны их вероятности, из которых производится выборка.

Объемом совокупности (выборочной или генеральной) называют число объектов этой совокупности.

Выборочной совокупностью, или просто выборкой, называют совокупность объектов, отобранных случайным образом из генеральной совокупности.

Более точно: выборка – это последовательность независимых одинаково распределенных с.в., распределение каждой из которых совпадает с распределением самой генеральной случайной величины.

Количество наблюдаемых объектов в совокупности, генеральной или выборочной называется её объёмом; обозначается соответственно буквами и . Например, если из деталей отобрано для обследования деталей, то объемом генеральной совокупности , а объемом выборки .

Конкретные значения выборки, полученные в результате наблюдений (испытаний), называют реализацией выборки и обозначают строчными буквами .

Метод статистического исследования, состоящий в том, что на основе изучения выборочной совокупности делается заключение обо всей генеральной совокупности, называется выборочной.

Обычно, в целях получения достаточно «хороших» оценок характеристик генеральной совокупности необходимо, чтобы выборка была репрезентативной (представительной), то есть, чтобы она достаточно полно представляла изучаемые признаки генеральной совокупности. Условием обеспечения такой выборки является, согласно закону больших чисел, соблюдение случайности производимого отбора, то есть все объекты генеральной совокупности, попадающие в данную выборку, должны иметь равные вероятности (равные возможности).

Различают выборки с возвращением (повторные) и без возвращения (бесповторные). В первом случае отобранный объект возвращается в генеральную совокупность перед началом следующего испытания; во втором – не возвращается. На практике чаще используется бесповторная выборка.

Если объём выборки значительно меньше, чем объём генеральной совокупности, то можно не учитывать различие между повторной и бесповторной выборками . В зависимости от конкретных условий для обеспечения представительности выборки применяют различные способы отбора. Их можно подразделить на два вида:


1. Отбор, не требующий расчленения генеральной совокупности. Сюда относятся:

а) простой случайный бесповторный отбор;

б) простой случайный повторный отбор;

Простым случайным отбором называют такой отбор, при котором объекты извлекают по одному (случайным образом) из всей генеральной совокупности.

Если карточку возвращают в пачку каждый раз перед очередным выбором, то выборка является простой случайной бесповторной.

Если карточку не возвращать в пачку каждый раз перед очередным выбором, то выборка является простой случайной повторной.

Например, для извлечения n объектов из генеральной совокупности объема N поступают так: выписывают номера от 1 до N на карточках, которые тщательно перемешивают и наугад вынимают одну карточку; объект, имеющий одинаковый номер с извлеченной карточкой, подвергают обследованию; затем карточка возвращается в пачку (или не возвращается) и процесс повторяется, т.е. карточки перемешиваются, наугад вынимают одну из них и т.д. Так поступают n раз; в итоге получают простую случайную повторную (бесповторную) выборку объема n.

Следует отметить, что при большом объёме генеральной совокупности указанный процесс трудоёмкий. В таких случаях пользуются готовыми таблицами так называемых «случайных чисел», в которых числа расположены в случайном порядке. Среди них, например, чтобы отобрать объектов из перенумерованных всего объектов генеральной совокупности, открывают любую страницу таблицы случайных чисел и выписывают подряд чисел. В выборку попадают те объекты, номера которых совпадают с выписанными случайными числами. Если какое-то случайное число окажется больше чем , то оно пропускается. При осуществлении бесповторной выборки случайные числа таблицы, уже встречавшиеся ранее, следует также пропустить.

2. Отбор, при котором генеральная совокупность разбивается на части. Сюда относятся:

а) типический отбор;

б) механистический отбор;

в) серийный отбор.

- типическим отбором называют отбор, при котором объекты отбираются не из всей генеральной совокупности, а из каждой её «типической» части.

Например, перед выборной компанией при анализе рейтинга определённых государственных деятелей опрашивают мнение случайно отобранных людей различных по признаку пола, возраста, социального статуса и т.д.. Другой пример, детали изготавливают на нескольких станках, то отбор производят не из всей совокупности деталей, изготовленных всеми станками, а из продукции каждого станка в отдельности, и т.д.

Типическим отбором пользуются тогда, когда обследуемый признак заметно колеблется в различных «типических частях» генеральной совокупности. Если продукция изготавливается на нескольких технологических машинах, среди которых есть более и менее изношенные, то здесь типический отбор целесообразен.


-механистический отбором, называют такой отбор при котором генеральная совокупность «механически» делят на группы, сколько объектов должно войти в выборку, а из каждой группы отбирают один объект. (например, опрос мнения по некоторому вопросу у каждого человека с простым порядковым номером); или, если нужно отобрать 20% изготовленных станком деталей, то отбирают каждую пятую деталь; если требуется отобрать 5% деталей, то отбирают каждую двадцатую деталь и т. д.

Следует указать, что иногда механический отбор ни всегда может обеспечить представительности выборки. Например, если отбирается каждый двадцатый обтачиваемый валик, причем сразу же после отбора производят замену резца, то отобранными окажутся все валики, обточенные затупленными резцами. В таком случае надо устранить совпадение ритма отбора с ритмом замены резца, для чего надо отбирать, скажем, каждый десятый валик из двадцати обточенных.

-серийным отбором называют такой отбор, при котором объекты из генеральной совокупности отбираются «сериями», которые должны исследоваться при помощи сплошного обследования.

Например, если изделия изготавливают большой группой станков – автоматов, то подвергают сплошному обследованию продукцию только нескольких станков. Серийным отбором пользуются тогда, когда обследуемый признак колеблется в различных сериях незначительно.

Подчеркнем, что на практике часто применяется комбинированный отбор, при котором сочетаются указанные выше способы. Например, иногда разбивают генеральную совокупность на серии одинакового объема, затем простым случайным отбором выбирают несколько серий и, наконец, из каждой серии простым случайным отбором извлекают отдельные объекты.

Пример 1. Пятьдесят абитуриентов проходят тестирование по математике. Каждый из них может набрать от 0 до 5 балов включительно. Пусть количество балов набранных м , абитуриентом.

Тогда значения будут возможные количества баллов, набранных одним абитуриентом, из которых образуют генеральную совокупность.

Выборка результат тестирования абитуриентов.

Реализациями выборки могут быть, например, следующие наборы чисел: ,…,

, и т.д., где в каждом из этих наборов (подмножеств) по цифр, общее число наборов

Замечание. Часто генеральная совокупность содержит конечное число объектов. Однако, если это число достаточно велико, то иногда в целях упрощения вычислений, или для облегчения теоретических выводов, допускают, что генеральная совокупность состоит из бесчисленного множества объектов. Такое допущение оправдывается тем, что увеличение объема генеральной совокупности (достаточно большого объема) практически не сказывается на результатах обработки данных «выборки».


4. Статистическое распределение выборки,

эмпирическая функция распределения



Пусть исследуется произвольная случайная величина и относительно этой случайной величины производится ряд независимых опытов (испытаний) при наличии определённого комплекса условий. Далее, пусть из генеральной совокупности извлечена выборка, причем значение наблюдалось раз, наблюдалось раз, и так далее наблюдалось раз, при этом натуральное число и

,

выражает объём выборки, значения называют вариантами с.в. . Вся совокупность значений с.в. представляет собой первичный статистический материал, который подлежит дальнейшей обработке, сначала подлежать упорядочению. Операцию по упорядочению значений случайной величины (признака) по не убыванию называют «ранжированием» статистических данных. Полученная таким способом последовательность значений случайной величины , где ; , называется вариационным рядом.

Числа , показывающие, сколько раз встречаются варианты (числа) в ряде наблюдений, называются частотами. А числа равное отношение к объёму выборки , называются относительными частотами, т.е.

(1)

Пе­речень вариантов и соответствующие им частость или относи­тельных частот называют статическим распределением выборки или статическим рядом.

Статистическое распределение записывается в виде таблицы, где в первой строке пишут численные значения вариантов, а вторая заполняется их соответствующими частотами . Из

этой таблицы затем составляют новую таблицу с указанием частотностей (относительных

частот) , где должен выполняться «контроль»

Пример 2. Задано распределение частот выборки объема ,

.

Эта таблица означает, что принимается три раза, принимается 10 раз и принимается 7 раз. В итоге: .

Написать таблицу распределение относительных частот.

Решение. Найдем относительные частоты, для че­го разделим частоты на объем выборки:


.


Теперь, составим таблицу распределения относительных частот:

.

Контроль:

Пример 3. В результате тестирования группы из 10 человек для приёма на работу претенденты набрали баллы: Составить

а) вариационный ряд;

б) статический ряд;

в) таблицу частот и относительных частот.

Решение. а) Упорядочив статические данные, получим вариационный ряд:

;

б) Подсчитав частоту и относительную частотность вариантов: получим статическое распределение выборки (так называемый дискретный ряд).

0

1

2

3

4

5

1

2

1

1

2

3

где . Контроль.

Построим таблицу относительную частоту


0

1

2

3

4

5


где . Контроль.



Статистическое распределение выборки является оценкой неизвестного распределения.

По теореме Бернулли, относительные частоты сходятся при к соответствующим вероятностям, т.е. . Поэтому, при больших значениях статическое распределение мало отличается от истинного распределения.

В случаях, когда количество значений признака (с.в. ) достаточно велико или когда случайная величина является непрерывной (т.е. её значение заполняет некоторый отрезок числовой прямой), составляют интервальный статистический ряд.

В первую очередь образуют частичные промежутки, которые берут обычно с одинаковыми длинами, равными .





Интервалы

Частота

Частость


Эта таблица означает, что весь диапазон изменения величины разбит на интервалы

(границами го интервала являются, и ); число есть частота попадания в й интервал, , где количество чисел в исходном ряде (выборке), приходящихся в - й интервал. На практике число интервалов выбирается обычно в пределах одного-двух десятков. Также следует отметить, что в общем случае длины интервалов не обязаны быть одинаковыми.

Для определения величины интервала существуют разные подходы, в качестве одного из таких способов разбиения, может быть использована формула Стерджесса:

где выражает разность между наибольшим и наименьшим значениями признака,

числа интервалов ; . За начало первого интервала рекомендуется брать величину , и если конец последнего промежутка входит во множестве с.в. , то оно также включается в число элементов, входящих в последний промежуток. После завершения «разбиения» первую строку таблицы статического распределения заполняют полученными частичными промежутками. Во второй строчке статистического ряда вписывают числа - количество наблюдений, попавших в каждый интервал, а затем составляют вторую таблицу относительных частот по выше указанному принципу, где мы для удобства объединили обе таблицы.

Заметим, что в теории вероятностей под распределением понимают соответствие между возможными значениями случайной величины и их вероятностями, а в математичес­кой статистике — соответствие между наблюдаемыми ва­риантами и их частотами, или частость (относительные частоты).

Пример 4. Измерили рост (с некоторой точностью скажем до 1 см.) 30 наудачу отобранных студентов. Результаты измерения показали:

Построить интервальный статистический ряд.

Решение. Сначала упорядочим полученные данные.

Следует, что рост студентов является непрерывной с.в. При более точном измерении роста значения с.в. обычно не повторяется и может отличиться друг от друга на несколько миллиметров. Вероятность наличия на Земле двух человека с одинаковым ростом, например,