ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 03.12.2019
Просмотров: 1012
Скачиваний: 3
Математическая статистика,
эта наука о принятии решения
в условиях неопределённости
ГЛАВА 5
ОСНОВЫ МАТЕМАТИЧЕСКОЙ
CТАТИСТИКИ
Тема 18. Статистическая выборка
и её характеристики
1. Краткая историческая справка
Математическая статистика возникла (XVII в.) в работах Я. Бернулли, П. Лапласа, К. Пирсона и как научное направление математики формировалось параллельно с теорией вероятностей. Дальнейшее развитие математической статистики (вторая половина XIX и начало XX вв.) обязано, в первую очередь, П. Л. Чебышеву, А. А. Маркову, А. М. Ляпунову, а также К. Гауссу, А. Кетле, Ф. Гальтону, Г. Крамера, Р. Фишера, Ю. Неймана и др.
В XX в. наиболее существенный вклад в развитии математической статистики внесли математики советского периода Романовский, Слуцкий, Колмогоров, Смирнов, Хинчин, Гнеденко, а также английские учёные Стьюдент, Р. Фишер, Э. Пирсон и американские учёные Ю. Нейман, А. Вельд и многими другими.
В современной жизни человека во всех сферах его деятельности требуется создавать такие статистические методы обработки данных и направление деятельности любого производства, так чтобы оно не просто констатировало не пригодность (брак) изготовленной продукции, но и своевременно вмешиваться в производственный процесс, не допускающий изготовления некачественной продукции. Именно к этому должно стремиться любое производство.
Таким образом, для управления качеством производства, главная задача состоит в разработке методов статистического исследования, которые позволяли бы уловить тот момент, когда бракованная продукция ещё не произведена, а уже возникает «повышенная вероятность-сигнал» начала её производства.
Идея статистического метода управления качеством в процессе производства состоит в том, чтобы время от времени проверять небольшие партии только что изготовленной продукции.
По результатам таких проверок можно судить своевременно о качестве работы того или иного станка. Однако, нужно помнить, что такую проверку следует производить не слишком часто, чтобы не лихорадить переналадками оборудования производственный процесс, и не слишком редко, чтобы не пропускать момент его разладки. Далее результаты наблюдения наносятся на, так называемые, контрольные карты, которые позволяют судить, что нужно предпринимать после каждой серии таких наблюдений – прекратить работу для переналадки оборудования или продолжить производственный процесс.
Если на некоторых производствах первичное произведение замеров параметров, определяющих качество продукции, допустимо и далее оценивается вручную, то на других производствах оно уже требует заметного усовершенствования и перехода к автоматизации замеров и обработки результатов измерения.
Дело в том, что во многих случаях приходится иметь дело с огромной скоростью технологических операций. Скорость настолько велика, что пока оператор производит измерение параметров отобранных изделий, автомат успевает изготовить сотни других изделий. В результате, при ручном измерении оказывается, что запаздывает информация о наладке процесса, а вместе с ней управляющее воздействие.
Вот почему предлагаются современные автоматы и автоматические линии на производстве, которые замеряют необходимые параметры своевременно и сами выполняют математические операции, необходимые для управления качеством.
Методы приёмочного контроля и статистические методы управления качеством оказались весьма эффективным средством упорядочения производства и экономии станочного времени, ресурсов, рабочей силы.
Экономический эффект от использования этих методов исчисляются миллиардами учётных денежных (валютных) единиц различных государств.
По-настоящему история статистических методов контроля и управления качеством можно сказать, что ещё недостаточно изучена и нуждается в совершенстве.
2. Задача математической статистики
В курсе теории вероятностей были введены правила, которые позволяли по вероятностям одних случайных событий вычислять вероятность других событий, связанных с ними: по числовым характеристикам и функциям распределения одних случайных величин можно было найти функции распределения и числовые характеристики других. Возникает естественный вопрос: как найти эти исходные вероятности, числовые характеристики и функции распределения? Как оценить хотя бы приближённые их значения? Это является предметом исследования науки о массовых случайных явлениях, которая получила название «математическая статистика» (МС). Как наука со своей установившейся тематикой и методами исследования МС сформировалась, в сущности, только в ХХ веке. Однако отдельные её задачи возникали и рассматривались задолго до ХХ века – и в XVII – XIX вв.
Термин «статистика» происходит от латинского слова «статус» (status) – состояние. Первоначально в XVIII веке, когда статистика начала оформляться в научную дисциплину, термин статистика связывался с системой описания фактов, характеризующих основные информации (данные) о состояние общества (государства). При этом даже не предполагалось, что введению статистики подлежат только явления массового порядка. В настоящее время статистика как наука включает в себя определённое содержание, а именно установление закономерностей, которым подчинены массовые случайные явления, основанные на изучении статистических данных – результатах наблюдений.
Приведём основные задачи МС:
- первая задача это разработка приёмов и методов статистического наблюдения в процессе сбора статистических данных.
- вторая задача математической статистики – указать способы группировки (если данных очень много) статистических сведений, т.е. сведений, характеризующих отдельные единицы каких-либо массовых совокупностей;
- третья задача математической статистики является разработка методов анализа собранных статистических информаций, в зависимости от поставленных целей и задач исследования, и выявить тех закономерностей, которые могут быть установлены на основе собранных данных массового наблюдения;
Этот раздел фактически и составляет содержание науки математической статистики. На практике человеческой деятельности сбор статистических сведений, касающихся главным образом населения, производился уже давно: имеются сведения, что в 2238 году до н.э. в Китае при императоре Яо была произведена перепись населения. Переписи населения производились и в Древнем Иране, в Древнем Египте, Римской империи; известны переписи населения в России в 1245, 1259, 1273, 1287гг. и более поздние сроки. Следует отметить, что эти переписи были чрезвычайно примитивны. В Китае, например, в течение, 200 лет население учитывалось путём копировки списков предыдущих переписей. Однако, даже такие неполные и несовершенные переписи давали возможность намечать важные государственные мероприятия. На данном этапе этот вопрос является весьма актуальным во всех государствах. Практическое значение статистики в наше время, бесспорно, возросло многократно.
Роль математической статистики не ограничивается вопросами обработки экспериментальных данных, а распространяется и на управленческие процессы в целом, а, в частности, на разнообразные технологические процессы, а также на проблему «проверки соответствия теории того или иного явления экспериментальным данным».
Исходным материалом для статистического исследования реального явления служит набор полученных результатов наблюдений или же набор результатов специально поставленных опытов (испытаний) над исследуемыми объектами. Вопросы, которые возникают при исследование, очень много и разнообразные по своему содержанию. Укажем на некоторые из них:
1. Оценка значения неизвестной вероятности случайного события;
2. Определение неизвестной функции распределения и их основных числовых характеристик (математическое ожидание, дисперсии и среднеквадратичное отклонение);
3. Определение неизвестных параметров распределения.
Общая задача ставится так: в результате - независимых испытаний над случайной величиной получены следующие её значения . Требуется определить хотя бы приближённо неизвестную функцию распределения величины .
Часто общетеоретические соображения позволяют сделать достаточно определённые заключения о типе функции распределения интересующей нас случайной величины. Так, например, теорема Ляпунова даёт возможность считать, что в определённых случаях функция распределения должна быть нормальной. При этом определение неизвестной функции распределения сводится к определению по результатам наблюдения только неизвестных параметров .
Общая задача ставится так: случайная величина имеет функцию распределения данного вида, зависящую от параметров, значения которых неизвестны. На основании практических наблюдений величины нужно найти последовательно значение этих параметров.
Очевидно, что определение неизвестной вероятности события является частным случаем только что сформулированной задачи. Так как мы можем рассматривать случайную величину , принимающую значение 1, если событие появляется - «успех» и значение 0, если событие не появляется - «не удача» в данном испытании. Следовательно, функция распределения зависит от единственного параметра .
4. Проверка статистических гипотез.
Эта задача ставится следующим образом: на основании некоторых предположений можно считать, что функция распределения случайной величины есть .
Возникает естественный вопрос, согласуются ли полученные значения с гипотезой в результате проведённого наблюдения (опыта), что с.в. действительно имеет данное распределение .
В частности, если вид функции распределения не вызывает сомнений и в проверке нуждается только значения некоторых параметров, характеризующих данное распределение, то в задаче ставиться вопрос: не опровергают ли результаты наблюдений ту гипотезу, что параметры распределения имеют предположенные значения? Эта задача есть «проверки простой гипотезы».
Если проверяемая гипотеза состоит в том, что параметры принимают не полностью множество значения, а часть из этих множеств значения (например, в случае биномиального распределения, гипотеза выполняется с ограничением ), то гипотеза называется сложной.
В качестве примера статической гипотезы приведём проверку однородности статистического материала. Наиболее часто встречается в русле такой задачи следующее: имеются две последовательности независимых наблюдений над случайной величиной с функцией распределения , и над случайной величиной с последовательностью со значениями и с функцией распределения . Функции распределения и неизвестны. Требуется оценить правдоподобность гипотезы .
5. Оценка зависимости. Производится последовательность наблюдений сразу двух случайных величин и . Результаты наблюдений даны следующими парами значений: Выяснить наличие функциональной или корреляционной связи между двумя случайными величинами и .
6. Управление процессами. Пусть имеется случайный процесс от дискретного или непрерывного времени . Процесс под влиянием тех или иных причин может нарушить своё нормальное протекание стать другим, т.е. будет протекать по другому процессу . Это нарушение нормального течения может привести к нежелательным последствиям и следует
исследователю своевременно заметить момент «разладки» и оказать соответствующее воздействие с целью восстановления нормального хода процесса.
В качестве примера можно указать на работу технологического процесса (линии), которая вырабатывает определённую продукцию. Время от времени в силу различных причин процесс выходит из нормального состояния. Этими причинами могут служить сбой некоторых частей инструментов (затупление инструмента, нарушение энергетического снабжения и т.д.). Они приводят к ухудшению качества выпускаемого продукта от предусмотренного стандарта.
В этих случаях требуется по наблюдениям уловить момента разладки и восстановить ход процесса.
Следует заметить, что перечисленными задачами далеко не исчерпываются основные проблемы математической статистики. Совершенно новые и разнообразные задачи возникают перед наукой математической статистики в связи быстрыми темпами развитием научной и практической промышленности, а также происходящие глобальные изменения, в мировом масштабе.
Изучение тех или иных явлений методами математической статистики служит средством решения многих вопросов, выдвигаемых наукой и практикой (правильная организация технологического процесса, оптимальное планирование в экономических и финансовых сферах, своевременная регулировка экологических и социальных проблем в глобальном масштабе и др.). В частности, само планирование «испытаний» является одной из важнейшей задачей математической статистики.
Итак, если кратко резюмировать вышесказанное, то при решении многих прикладных задач для случайных величин определяются их вероятностные и числовые характеристики
на основе статистического анализа экспериментальных данных.
Статистическое описание результатов наблюдений, построение и проверка различных математических моделей, использующих понятие вероятности, составляют основное содержание математической статистики, а «задача математической статистики состоит в создании методов сбора и обработки статистических данных для получения научных и практических выводов».
Перейдём к изложению, одного из важнейших разделов математической статистики без которого в целом невозможно успешно изучать предмет математической статистики.
3. Генеральная и выборочная совокупности
Пусть требуется изучить совокупность однородных объектов относительно некоторого качественного или количественного признака, характеризующего эти объекты. Например, если имеется партия деталей, то качественным признаком может служить стандартность детали, а количественным – контролируемый размер детали, или, рассматривая работу диспетчера парикмахера, продавца, оператора технологической линии, и др., следует исследовать:
его загруженность, тип клиентов, скорость обслуживания, моменты поступления заявок и т.д.
Каждый из таких признаков или различные сочетания их образуют случайную величину, наблюдения над которыми мы и производим. Совокупность всех подлежащих изучению объектов или возможных результатов всех мыслимых наблюдений, производимых при постоянных условиях над каждым объектом, обычно называют генеральной совокупностью.