Файл: 1. Выборочный метод.doc

Добавлен: 04.02.2019

Просмотров: 1655

Скачиваний: 6

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Тақырыбы: Таңдама тәсіл

Бас жиынтық және таңдама

Біртекті обьектілердің жиынтығын оларды сипаттайтын сапалық және сандық белгісі бойынша зерттеу керек болсын. Мысалы, бір партия құралдар бар болса, олардың сапалық белгісі ретінде стандарттылығы сандық белгісі ретінде-құралдың өлшемі қарастырылады.

Кей кезде жиынның әр обьектісін қажет белгісіне қатысты зерттеп, жаппай зерттеу жүргізеді. Алайда, практикада мұндай жаппай зерттеу салыстырмалы түрде сирек қолданылады.

Таңдама жиынтық немесе жай таңдама деп кездейсоқ таңдап алынған обьектілер жиынын айтады.

Бас жиынтық деп ішінен таңдама жүргізілетін обьектілер жиынын айтады. Жиынтық көлемі деп осы жиынтықтың обьектілер санын айтады.

Практикада таңдаманың түрлі әдістері қолданылады. Бұл әдістерді 2 түрге топтауға болады.

І. Бас жиынтықты бөлшектеп бөлуді қажет етпейтін таңдама, оған:

а) жай кездейсоқ қайталанымсыз таңдама;

б) жай кездейсоқ қайталанбалы таңдама;

ІІ. Бас жиынтық бөлшектеп бөлінетін таңдама, оған:

а) типтік таңдама;

ә) механикалық таңдама;

б) сериялық таңдама

жатады.

Жай кездейсоқ таңдама деп барлық бас жиынтықтан обьектілерді бір-бірден алатын таңдаманы атайды. Егер алынған карточкаларды бумаға қайтармаса, онда таңдама жай кездейсоқ қайталанымсыз болады.

Типтік таңдама деп, обьектілер бас жиынтықтың барлығынан емес, оның әрбір «типтікң бөлігінен алынатын таңдаманы атайды.

Механикалық таңдама деп бас жиынтық таңдамаға қанша обьект қажет болса, сонша топқа бөлінетін таңдаманы атайды, әрбір топтан бір обьект алынады.

Сериялық таңдама деп бас жиынтықтан обьектілерді бір-бірден емес, жаппай зерттеуге ұшырайтын обьектілер «серияларменң таңдап алатын таңдаманы атайды.


Таңдаманың статистикалық таралуы.

Алынған таңдамалық зерттеулерді жүйелендіруде таралудың статистикалық дискретті және интервалды қатарлар қолданылады.

Вариациялық қатар — сәйкес жиіліктерімен бірге ранжирленген ретпен орналасқан белгінің сандық мәндері.

Вариациялық қатардың негізгі белгіленулері:

- варианта, зерттеліп отырған белгінің сандық өрнектелуі;

- вариантаның жиілігі (“салмақ”), оның вариациялық қатарда қайталану саны;

n — бақылаудың жалпы саны, таңдама көлемі (яғни, барлық жиіліктердің қосындысы, n=Σ);

- вариациялық қатарды шектейтін шеткі варианталар,(қатардың лимиттері);

- қатардың амплитудасы (яғни, ең жоғарғы және ең төменгі варианталардың айырымы ).


Вариациялық қатардың қолданылуы:

Вариациялық қатар орта шаманы () және әртүрлілік критерийлерін ()анықтау үшін қолданылады.


Орта шама – зерттеліп отырған белгі өлшемінің жалпылама сипаттамасы. Ол бір санмен сапалы біртекті жиынтықты сандық сипаттауға мүмкіндік береді.


Бас жиынтықтан таңдама алынсын, және х1-n1 рет, х2-n2 рет, ..., хk-nk рет қайталанады, ал -таңдама көлемі. х1 мәндерін варианталар деп, ал өсу ретімен жазылған варианталар тізбегін вариациялық қатар деп атайды. Қарастырылатын мәндер санын жиіліктер, ал олардың таңдама көлеміне қатынасын салыстырмалы жиіліктер - деп айтады.


Таңдаманың статистикалық таралуы деп варианталар мен оларға сәйкес жиіліктер немесе салыстырмалы жиіліктердің тізімі аталады.

  1. Статистикалық таралуды интервалдар тізбегі және оларға сәйкес жиіліктер (интервалға сәйкес жиілік ретінде осы интервалға түскен жиіліктер қосындысын қабылдайды) тізбегі түрінде беруге болады. Мода (Мо) – кездейсоқ шаманың ең жиі кездесетін мәні

  2. Медиана (Ме) – таңдаманы қақ ортасынан бөлетін кездейсоқ шаманың мәні. Барлық мәндерді ранжрленген қатарға орналастыру керек.

Таңдаманың 50% жоғары не төмен орналасқан мәнді көрсетеді.

  1. Минимал мәні

  2. Максимал мәні

  3. Қадам

  4. Орташа қатесі (стандартты) – таңдама көрсеткіштің (статистика) оның генеральды параметрінен ауытқу шамасы:


Полигон және гистограмма.

Көрнекілік үшін статистикалық таралудың түрлі графиктер салынады, соның ішінде полигон мен гистограмма тұрғызылады.

1. Х дискретті белгісінің таралуы.

Жиіліктер полигоны деп (х1, n1), (х2, n2), ..., (хк, nк) нүктелерін қосатын сынық сызықты айтады жиіліктер полигонын тұрғызу үшін абциссалар осінде хі варианталарын, ал ординаталр осінде-оларға сәйкес nі жиіліктерді орналастырады. (хі, nі) нүктелерін түзудің кесінділерімен қосып, жиіліктер полигонын салады.

Салыстырмалы жиіліктер полигоны деп кесінділері (x1,W1), (x2,W2),..., (xк,Wк), нүктелерін қосатын сынық сызықты айтады. Салыстырмалы жиіліктер полигонын тұрғызу үшін абциссалар осінде xі варианталарын, ал ординаталар осінде оларға сәйкес Wі салыстырмалы жиіліктер полигонын тұрғызады.

1-суретте келесі салыстырмалы жиіліктер таралуының полигоны бейнеленген.










1-сурет

2. Х үзіліссіз белгісінің таралуы.

Статистикалық үзіліссіз қатарды (немесе таралудың эмпирикалық функциясын) әдетте таңдамада бір-бірінен өзгеше варианталар көп болмаған жағдайда немесе осы себеппе зерттеуші үшін үзіліссіздік бар болған жағдайда қолданады. Егер бізді қызықтыратын бас жиынтықтың Х белгісі үзіліссіз болса, онда варианталар интервалдарға топтастырылады.

Көлемі n таңдамадағы берілгендерді топтастырғанда барлық варианталарды қамтитын [a,b] кесіндісін k интервалдарға бөледі. (әдетте ).

Осыдан соң, әрбір интервалдың жиілігін, яғни і- ші интервалға түсетін бақылаулар санын анықтау керек. Айқындылық үшін - жарты интервалында жататын варианталар санына тең деп ұйғарамыз. Барлық жағдайда аралық - ге тең болады.k – интервалдар саны.

Ескерту. Көбіне барлық і үшін , яғни топтастыру тең h қадаммен алынады. Бұл жағдайда табу үшін келесі ұсынысты жетекшілікке алуға болады.

1. R =Xmax –Xmіn табамыз, мұндағы R – ең үлкен және ең кіші варианталардың айырымы.

2. k-топтар саны, h-қадам.

3. (Стерджес формуласы)

4. a=xmіn, b=xmax

5.

Алынған топтастыруды жиілік кестесі түрінде ұсыну қолайлы. Бұл кестені таралудың статистикалық интервалдық қатары деп атайды.



Топтастырудың интервалы

...

Жиіліктер

...

.

Осы кестені nі жиіліктерді салыстырмалы жиіліктермен алмастырып мынадай түрде жазуға болады:

Топтастыру интервалы

...

Салыстырмалы жиіліктер

...

Жиіліктердің графиктік түрі - жиіліктер гистограммасы деп аталатын арнайы график болып табылады.

Жиіліктер гистограммасы деп табандары h-қа, биіктіктері (жиілік тығыздығы) қатынасына тең тіктөртбұрыштардан тұратын баспалдақты фигураны айтады.

Үзіліссіздік белгісі жағдайында гистограмма салған жөн, ол үшін белгінің барлық бақыланатын мәндер жататын интервалды ұзындығы Һ-қа тең бірнеше дербес (жеке) интервалдарға бөліп, әрбір дербес nі интервал үшін і-ші интервалға түскен варианталар жиіліктерінің қосындысын табады. і-ші дербес төртбұрыштың ауданы - і-ші интервалға түскен варианталар жиіліктерінің қосындысына тең, сондықтан жиіліктер гистограммасының ауданы барлық жиіліктердің қосындысына тең, яғни таңдаманың көлеміне тең.

Салыстырмалы жиіліктер гистограммасы деп табандары h-қа, биіктіктері (салыстырмалы жиілік тығыздығы) қатынасына тең тіктөртбұрыштардан тұратын баспалдақты фигураны айтады.

Салыстырмалы жиіліктер гистограммасын тұрғызу үшін абциссалар осінде дербес интервалдар салып, олардың үстінен абцисса осіне параллель қашықтықта кесінділер жүргіземіз. і-ші дербес төртбұрыштың ауданы - ші интервалға түскен варианталардың салыстырмалы жиіліктеріне тең. Сонымен, салыстырмалы жиіліктер гистограммасының ауданы барлық салыстырмалы жиіліктер қосындысына, яғни 1-ге тең.

1-ден 10 дейінгі сандардың ондық логарифмдері

п

1

2

3

4

5

6

7

8

9

10

lgп

0

0,30

0,48

0,60

0,70

0,78

0,85

0,90

0,95

1



Бас орта

бас орта деп бас жиынтық белгісінің орта арифметикалық мәнін айтады.

Егер N көлемді бас жиынтық белгісінің барлық х1,......хN мәндері әртүрлі болса, онда

Егер x1, x2,….xк белгісінің мәндері сәйкесінше N1, N2, …….Nk жиіліктерге ие болса,

мұнда N1+ N2+....+.Nk=N

;


Таңдама орта

Х сандық белгісіне қатысты бас жиынтықты зерттеу үшін n көлемді таңдама алынсын.

таңдама орта деп таңдама жиынтық белгісінің орта арифметикалық мәнін айтады.

Егер n көлемді таңдаманың барлық x1, x2,….xn мәндері әр түрлі болса, онда

Егер таңдаманың x1, x2,….xк мәндерінің сәйкесінше жиіліктері n1, n2,……..nk болса, және

n1+ n2+…..+nk = n онда

немесе

Көлемі n – ге тең Х сандық белгінің мәндер жиынтығын қарастырамыз.

Белгінің мәні

х1

х2

хк

Жиілік

п1

n2

пк


мұнда .

Жазуға қолайлы болу үшін қосынды таңбасы таңбасымен ауысады.



Бас дисперсия

Бас жиынтықтың Х сандық белгісі мәндерінің өз орта мәнінің маңайында шашырауын сипаттау үшін бас дисперсия сипаттамасы енгізіледі.

бас дисперсиясы деп бас жиынтық белгісі мәндерінің орта мәнінен ауытқуының квадратының орта арифметикалық мәнін айтады.

Егер N көлемді бас жиынтық белгісінің барлық х1, х2 ,.., хN мәндері әртүрлі болса, онда

Егер белгінің барлық х1, х2 ,.., хк мәндерінің сәйкес жиіліктері N1, N2, …, Nk бар болса, және N1+N2+ +…+Nk=N, онда

;

Бас жиынтықтың сандық белгісі мәндерінің өз орта мәнінің маңайында шашырауын сипаттау үшін дисперсиядан басқа орта квадраттық ауытқуды пайдаланады.

Бас орташа квадраттық ауытқу деп бас дисперсиядан алынған квадрат түбірді айтады: .

Таңдама дисперсия Dт деп белгінің бақыланатын мәндерінің орта мәнінен ауытқу квадраттарының орта арифметикалық мәнін айтады.

Егер n көлемді таңдаманың барлық x1, x2,….xn белгілерінің мәндері әр түрлі болса, онда

Егер x1, x2,….xn мәндерінің жиіліктері бар және сәйкесінше n1, n2, …, nk болса, мұндағы

n1+ n2+ …+ nk=n, онда .


Теорема: Дисперсия таңдама мәндерінің квадраттарының орта мәні мен орта мәнінің квадратының айырымына тең: .

Орта квадраттық ауытқу деп дисперсиядан алынған квадрат түбірді айтады: .

Орта квадраттық ауытқудың қолданылуы:

а)вариациялық қатардың өзгергіштігі жөнінде пайымдау және орта шамалардың типтілігін салыстырмалы түрде бағалау. Бұл белгілердің тұрақтылығын анықтау барысында дифференциальды диагностикада аса қажет;

б)вариациялық қатарды қайта құру,яғни оның жиілік сипаттамасын «үш сигма» ережесі негізінде қалпына келтіру үшін. М±3σ аралығында барлық варианталардың 99,7% , М±2σ аралығында— 95,5% және М±1σ аралығында — 68,3%;

в)«ырғып шығушы» варианталарды айқындау үшін (нақты және қайта құрылған вариациялық қатарларды салыстырғанда);

г) сигмальдық бағалар көмегімен қалыпты жағдай мен патологиялық жағдайдағы параметрлерді анықтау үшін;

д) вариация коэффициентін есептеу үшін;

е) орта арифметикалық шаманың қатесін есептеу үшін;


Вариация коэффициенті (C) - орта квадраттық ауытқудың орта арифметикалық шамаға проценттік қатынасы:

Вариация коэффициентібұл вариациялық қатардың өзгергіштігінің салыстырмалы өлшемі.


Вариация коэффициентінің қолданылуы.

а) әрбір нақты вариациялық қатардың әртүрлілігін бағалау және, сәйкес, әр орта мәннің типтілігін пайымдау үшін. С<10% болғанда қатардың әртүрлілігі әлсіз, 10% < С< 20% - орта, ал С>20% - күшті болып саналады. Қатардың әртүрлілігінің күшті болуы сәйкес орта шаманың типтілігінің аз екендігін көрсетеді, сондықтан оны практикалық мақсатта қолдану маңызды емес.

ҮЛГІ-ЕСЕП

Есептің шарты.N қаласында 2000 ж. 7жасар ұл балалардың дене салмақтарын өлшеу жүргізілді. N қаласында 1990 ж.жүргізілген осыған ұқсас зерттеудің деректері бойынша 7-жасар ұл балалардың орташа дене салмақтары 23,8 кг, σ =± 3,6 кг.болған.


Тапсырма. 1. Орта арифметикалық шаманы () және вариациялық қатардың әртүрлілік критерийлерін (σ, С) есептеңдер.

2. Алынған нәтижелерді бағалаңдар, оларды алдыңғы зерттеудің деректерімен салыстырыңдар, сәйкес қорытынды жасаңдар.


ЕСЕПТІҢ ШЕШУІ

N қаласында 2000 ж. 7 жасар ұл балалардың дене салмақтарын өлшеу нәтижелері.

Дене салмағы ( кг)

Интервалдың ортасы (ортадағы варианта)

Ұл балалар саны

15-18,9

17

16

272

-7

49

784

19-22,9

21

27

567

-3

9

243

23-26,9

25

32

800

+1

1

32

27-30,9

29

16

464

+5

25

400

31-34,9

33

9

297

+9

81

729







Топталған вариациялық қатарда ортадағы варианта көрші интервалдардың бастапқы варианттарының жарты қосындысы ретінде есептеледі.



Қорытынды:

1 N қаласында 2000 ж. 7жасар ұл балалардың дене салмақтарының орташа мәні 24,0 кг.

2. σ= ±4,68 кг.

3. 19,5% -ке тең вариация коэффициентінің мәні белгінің әртүрлілігінің күштіге жақын орта екендігін көрсетеді.

Сонымен, дене салмағының алынған орташа мәні зерттеліп отырған жиынтық үшін жеткілікті типті деп санауға болады. Салыстыру нәтижесінде 1990 ж. қарағанда 2000 ж. 7 жасар ұл балалардың дене салмақтарында әлдеқайда үлкен вариабельділік бар екендігі белгілі болды. (4,68 кг қарсы 3,6 кг). Осыған ұқсас қорытынды вариация коэффициенттерін салыстырғаннан да келіп шығады (1990 ж. C тең (3,6*100)/23,8 =15,1%).

СЕНІМДІЛІК ИНТЕРВАЛЫ

Белгілі нүктелік таңдама сипаттамалар бойынша интервалды баға немесе сенімділік интервалын құруға болады, онда қандай да бір ықтималдықпен генеральды паратер орналасады. Белгілі таңдама көрсеткіштер негізіндегі генеральды параметрлер туралы сенімді түрде айтуға келетін болып есептелген ықтималдықтар сенімді деп аталады. Әдетте медициналық-биологиялық зерттеулерде Р=0,95 (95%) сенімділік ықтималдығының мәні қолданылады. Және де параметрдің нақты мәнінің осы шектерден шығу ықтималдығы 1–0,95=0,05 (5%)-тен аспайды. Сенімділік ықтималдықты толықтыратын шаманы әдетте α деп белгілейді.

Орталық шекті теоремадан білетініміздей, таңдамалар алынған бастапқы жиынтықтың тарамдалуына тәуелсіз таңдама орташалар жуықтап алғанда қалыпты тарамдалуға ие. Осылайша, таңдама орташа мән үшін сенімділік интервалы және мәндерінің арасында орналасқан, мұндағы Sx орташаның стандартты қатесі, tα – Стьюдент коэффициенті, п таңдама көлеміне тәуелді (немесе сәйкес df=n-1 бостандық дәрежелірінің саны) шама және сенімділік ықтималдығының таңдалған деңгейіне тәуелді шама Стьюдент тарамдалу кестелері бойынша анықталады. tα коэффициент шамасы сенімділік ықтималдығын 1-ге дейін толықтыратын α деңгейінде кесте бойынша анықталады, яғни сенімділік ықтималдығы 95% жағдайда интервал симметриясы ескерілгенде (1-0,95)=0,05 деңгейінде.