Վիճակագրական տվյալների բնութագրերը. Վիճակագրական շարքի թվային բնութագրերը. II. Տնային առաջադրանքների ստուգում

Լաբորատոր հաշվետվություն

«Վիճակագրական տվյալների մշակման եղանակներ և միջոցներ» թեմայով.

Ավարտեց՝ Գալիմովա Ա.Ռ., գր. 4195 թ

Ստուգված՝ Մոկշին Վ.Վ.

Կազան, 2013 թ

1. Անհատական ​​առաջադրանք. 3

2. Փորձերի պլանավորում. չորս

2.1. Ռազմավարական պլանավորում. չորս

2.1.1. Դ - օպտիմալ պլաններ.. 5

3. Հիմնական վիճակագրական բնութագրեր ISD. ութ

4. ՄԶԾ-ի նորմալության գնահատում. 9

5. Ժամանակավոր կանխատեսում. 13

6. Հարաբերակցության վերլուծություն. 15

7. Կլաստերային վերլուծություն. 16

8. Գործոնային վերլուծություն. 22

9. Ռեգրեսիոն վերլուծություն. 27

10. Դիսպերսիոն վերլուծություն. 35

11. Գործոնների արժեքների և կատարողականի ցուցանիշների օպտիմալացում: 35

Եզրակացություններ.. 36

Դիմում. 37

Անհատական ​​առաջադրանք

BUF1 - 3 տեղի համար;

BUF2 - անսահմանափակ նստատեղեր;

GOT - էքսպոնենցիալ օրենք, միջին ժամանակի 20000 միավոր;

VOSST - սպեկտր. earl.law, միջինը մեկ փուլով 25 միավոր: ժամանակը, համարը փուլ 3;

GT − միասնական օրենք, 225±25 ժամանակի միավոր;

RK1 - էքսպոնենցիալ օրենք, միջին Х1=100 միավոր։ ժամանակ;

RK2 − նորմալ օրենք, միջին Х2=90, արտ. անջատված է 8 միավոր vr.

KAN1-KANM – միասնական օրենք, 75±15 ժամանակային միավոր;

Х3=М – ալիքների քանակը։

Ընտրելով KANal-ը փոխանցման համար՝ ըստ նվազագույն թվով առաջադրանքների, որոնց համար տեղեկատվությունը փոխանցվում է: Անմատչելիության ռեժիմը վերադրվում և հեռացվում է միմյանցից անկախ ալիքների միջոցով:

Ավարտեք սիմուլյացիան 300 առաջադրանքներից դուրս գալուց հետո (լուծված գումարած անհաջողությունները):

Օպտիմիզացված գործոններ. Х1 – միջին լուծման ժամանակը PC1-ում, Х2 – լուծման միջին ժամանակը PC2-ում, Х3 – ալիքների քանակը: X1 և X2 փոփոխվում են նշված միջին արժեքների ± 20%-ով. X3 2-ից 6:

Եկեք մոդել կառուցենք Արենա համակարգում

Նկ.1 - Արենա մոդելավորման համակարգում կառուցված սիմուլյացիոն մոդել

Փորձերի ձևավորում

Պլանավորման նպատակն է նվազագույն գնով ստանալ տվյալ հուսալիությամբ արդյունքներ: Տարբերակել ռազմավարական և մարտավարական պլանավորումը:

Ռազմավարական պլանավորում

Ռազմավարական պլանավորման համար մենք կօգտագործենք «սև արկղ» հայեցակարգը, որի էությունը մոդելավորված համակարգում տեղի ունեցող գործընթացների ֆիզիկական էությունից վերացումն է և միայն մուտքային և ելքային փոփոխականների հիման վրա դրա գործունեության մասին եզրակացություններ տալը: Ներածումը, անկախ փոփոխականները կոչվում են գործոններ։ Արդյունք - պատասխաններ, դրանց արժեքը կախված է OI-ի գործոնների և պարամետրերի արժեքներից:

Գործոնները մեր դեպքում ցուցանիշներն են (պարամետրերը), որոնք մենք օպտիմալացնելու ենք. պատասխանները մոդելավորված համակարգի գործունեության արդյունավետության արդյունավետ ցուցիչներ են: Սև արկղի բլոկային դիագրամը ներկայացված է Նկար 1-ում:

Նկ.1 Սև արկղի հայեցակարգի բլոկային դիագրամ

Երկրորդ կարգի պլանները թույլ են տալիս ձևավորել պատասխան ֆունկցիա լրիվ քառակուսային բազմանդամի տեսքով, որը պարունակում է ավելի շատ տերմիններ, քան առաջին կարգի պլաններից ձևավորված թերի քառակուսի բազմանդամը, և, հետևաբար, պահանջում է ավելի մեծ թվով փորձեր կատարել: m=3-ի լրիվ քառակուսի բազմանդամն ունի ձև.

D - օպտիմալ պլաններ

AT Դ-օպտիմալ պլաններում գործոնների արժեքները դուրս չեն գալիս դրանց փոփոխության միջակայքերի սահմանված սահմաններից: Բացի այդ, նրանք ունեն ևս մեկ նշանակալի առավելություն՝ ապահովելով նվազագույն սխալ գործոնների փոփոխությունների ողջ ընդունված միջակայքում։ Գործնականում առավել հաճախ օգտագործվում են Կոնոյի և Կիֆերի պլանները:

Բրինձ. 2 Կիֆերի երեք գործոնային պլանի երկրաչափական մեկնաբանությունը խորանարդի վրա

ռազմավարական պլանորոշում է մոդելավորվող համակարգի տարբերակների քանակը և յուրաքանչյուր տարբերակի գործոնների արժեքները: 3 օպտիմիզացված գործոնների համար առաջարկվում է D-օպտիմալ պլան՝ ըստ Kiefer ալգորիթմի, որը բաղկացած է 26 տարբերակից և ներկայացված է Աղյուսակ 1-ում։

Աղյուսակ 1 - Կիֆերի պլանը 3 գործոնով փորձի համար

x 1 x2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x4 x5 x6
-1 -1 -1 -1 -1
-1 -1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1
-1 -1
-1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1
-1 -1
-1 -1 -1 -1

Այստեղ: ; ;

Մենք հաշվարկում ենք X 1, X 2, X 3 արժեքները՝ ըստ անհատական ​​առաջադրանքի: Ըստ առանձին առաջադրանքի պայմանի՝ օպտիմալացման ենթակա գործոններն են՝ Х1 – միջին լուծման ժամանակը PC1-ում, Х2 – լուծման միջին ժամանակը PC2-ում, Х3 – ալիքների քանակը: X1 և X2 փոփոխվում են նշված միջին արժեքների ± 20%-ով. X3 2-ից 6:

PK1-ի վրա, էքսպոնենցիալ օրենքի պայմանը, միջինը 100 միավոր ժամանակ է, հետևաբար արժեքը 0 - 100, 1-120, -1 -80 է (քանի որ մենք փոխում ենք նշված միջին արժեքի ± 20% -ով:

RK2-ը ենթարկվում է նորմալ օրենքին՝ ըստ նշանակման պայմանի, և միջին արժեքը 90 միավոր է: ժամանակ և փոփոխիչ ±20 ժամանակի միավոր, հետևաբար՝ 0-90, 1 – 108, -1-72: Բոլոր տվյալները մուտքագրված են Աղյուսակ 2-ում:

Աղյուսակ 1 - X 1, X 2, X 3 գործոնների տվյալները

-1
x1
x2
x3

Y 1 – PC1 օգտագործման գործակից (0÷1)*100%;

Y 2 - PK2 օգտագործման գործակից (0÷1)*100%;

Y 3 - Առաջադրանքները կատարելու միջին ընդհանուր ժամանակը:

D-օպտիմալ պլանը ըստ Kiefer ալգորիթմի անհատական ​​առաջադրանքի և Y 1 ,Y 2 ,Y 3 պատասխանները առանձին առաջադրանքի գործոնների վերաբերյալ ներկայացված են Աղյուսակ 3-ում:

Աղյուսակ 2 - D-օպտիմալ պլան՝ ըստ Կիֆերի ալգորիթմի (առանձին առաջադրանքների համար)

x 1 x2 x 3 x 1 x 2 x 1 x 3 x 2 x 3 x 1 x 2 x 3 x4 x5 x6

Աղյուսակ 4 - Պատասխաններ Y 1 , Y 2 ,Y 3

Յ 1 Y2 Յ 3
32,24 30,41 309,16
36,41 28,81 322,98
43,54 26,95 322,92
32,23 38,00 326,79
36,42 36,00 339,98
43,54 33,75 338,75
32,22 45,6 344,71
36,44 43,18 357,16
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,82 310,97
43,54 26,95 322,91
32,23 38,00 326,79
36,42 36,01 327,97
32,22 45,59 344,70
36,44 43,19 345,15
43,54 40,56 354,91
32,24 30,41 309,16
36,41 28,77 314,34
43,54 26,95 322,91
32,23 38,00 326,79
36,42 35,96 331,34
43,54 33,75 338,75
32,22 45,59 344,70
36,44 43,14 348,51
43,54 40,56 354,91

ՄԶՀ-ի հիմնական վիճակագրական բնութագրերը.

Հիմնական վիճակագրական բնութագրերն են.

1. Valid N - նմուշի չափը;

2. Միջին - թվաբանական միջին: Պատահական փոփոխականի միջին արժեքը նրա առավել բնորոշ, ամենահավանական արժեքն է, մի տեսակ կենտրոն, որի շուրջ ցրված են հատկանիշի բոլոր արժեքները:

3. Միջին - միջին: Միջինը պատահական փոփոխականի արժեքն է, որը նմուշի բոլոր դեպքերը բաժանում է երկու հավասար մասերի:

4. Ստանդարտ շեղում - ստանդարտ շեղում: Ստանդարտ շեղումը (կամ ստանդարտ շեղումը) հատկանիշի փոփոխականության (տարբերակի) չափումն է: Այն ցույց է տալիս, թե միջինում որքան դեպքեր են շեղվում հատկանիշի միջին արժեքից:

5. Տարբերություն - ցրվածություն: Դիսպերսիան փոփոխականության, հատկանիշի փոփոխության չափումն է և դեպքերի շեղումների միջին քառակուսին է հատկանիշի միջին արժեքից։ Ի տարբերություն տատանումների այլ ցուցիչների, շեղումը կարող է տարրալուծվել իր բաղադրիչ մասերի, ինչը հնարավորություն է տալիս գնահատել ազդեցությունը. տարբեր գործոններհատկանիշի փոփոխության համար.

6. Միջին չափի ստանդարտ սխալ Միջինի ստանդարտ սխալն այն քանակությունն է, որով ընտրանքի միջինը տարբերվում է պոպուլյացիայի միջինից, պայմանով, որ բաշխումը մոտ է նորմալին:

7. 95% վստահության սահմանաչափեր - 95% վստահության միջակայք միջինի համար: Այն միջակայքը, որում ընդհանուր բնակչության հատկանիշի միջին արժեքը ընկնում է 0,95 հավանականությամբ:

8. Նվազագույն, առավելագույն - նվազագույն և առավելագույն արժեքներ:

9. Թեքություն-ասիմետրիա. Ասիմետրիան բնութագրում է տատանումների շարքի տեղաշարժի աստիճանը մեծության և ուղղության միջին արժեքի նկատմամբ:

10. Skewness-ի ստանդարտ սխալ – անհամաչափության ստանդարտ սխալ:

11. Կուրտոզ՝ ավելորդություն: Կուրտոզը բնութագրում է դեպքերի կենտրոնացվածության աստիճանը միջին արժեքի շուրջ և հանդիսանում է կորի կտրուկության մի տեսակ:

12. Կուրտոսի ստանդարտ սխալ

Աղյուսակ 5 - Նկարագրական վիճակագրության արդյունքներ


ISD-ի նորմալության գնահատում.

Նորմալ օրենքը ամենատարածվածն է: Այն օգտագործվում է պատահական գործընթացների լայն տեսականի ներկայացնելու համար, ինչպիսիք են մարդկանց կյանքի տեւողությունը, տնտեսական եւ տեխնիկական ցուցանիշների փոփոխությունները:

Եկեք արձանագրենք այն վարկածը, որ նախնական վիճակագրական տվյալները ենթակա են նորմալ օրենքի, և որպես նորմալ օրենքի պարամետրեր մենք կվերցնենք գնահատումները. մաթեմատիկական ակնկալիքև ստանդարտ շեղումը հաշվարկված բանաձևերով:

Նորմալ օրենքի խտության ֆունկցիան ունի ձև.

; .

Եթե ​​էմպիրիկ բաշխման նորմալության ենթադրության մեջ վստահության P գործակիցը, որը կարելի է գտնել վիճակագրական աղյուսակներից, 0,20-ից ոչ պակաս է, ապա նորմալության ենթադրությունը չի մերժվում։ Եթե ​​P դեպի<0,20, то предположение о нормальности рекомендуется отвергнуть.

Էմպիրիկ և հիպոթետիկ բաշխումների միջև համապատասխանությունը կարելի է տեսողականորեն հետևել գրաֆիկներից: Կոլմոգորովի համապատասխանության չափանիշն օգտագործելիս նախընտրելի է օգտագործել բաշխման ֆունկցիաները։ Նման գրաֆիկները կառուցվում և թողարկվում են Statistica 6.0 և Excel 2007 ծրագրային ապահովման հատուկ ծրագրային ընթացակարգերում, որոնց վրա հաշվարկներն ուղղված են նշված մաթեմատիկական ապարատի համաձայն: Պատկերացնենք փոփոխականների բաշխումը հիստոգրամների վրա (նկ.3.-նկ.8.):

Նորմալ բաշխման խտությունը դրվում է հիստոգրամների վրա՝ Կոլմոգորով-Սմիրնովի չափանիշով բաշխման մոտիկությունը նորմալ ձևին ստուգելու համար։


Նմանատիպ տեղեկատվություն.


Թեմա 2.1.Ագրոնոմիական հետազոտություններում փորձարարական տվյալների վիճակագրական մշակման հիմունքները. Քանակական և որակական փոփոխականության վիճակագրական բնութագրերը

Պլանավորել.

  1. Վիճակագրության հիմունքներ
  2. Քանակական փոփոխականության վիճակագրական բնութագրերը
  3. Վիճակագրական բաշխման տեսակները
  4. Վիճակագրական վարկածների փորձարկման մեթոդներ

1. Վիճակագրության հիմունքներ

Մեզ շրջապատող աշխարհը հագեցած է տեղեկատվությամբ՝ մեզ շրջապատում են տվյալների տարբեր հոսքեր՝ գրավելով մեզ իրենց գործողությունների դաշտում, զրկելով մեզ իրականության ճիշտ ընկալումից։ Չափազանցություն չի լինի ասել, որ տեղեկատվությունը դառնում է իրականության և մեր գիտակցության մաս:

Առանց տվյալների վերլուծության համարժեք տեխնոլոգիաների՝ մարդը պարզվում է, որ անօգնական է դաժան տեղեկատվական միջավայրում և ավելի շուտ նմանվում է Բրաունյան մասնիկի՝ զգալով ուժեղ հարվածներ դրսից և չի կարողանում ռացիոնալ որոշում կայացնել։

Վիճակագրությունը թույլ է տալիս կոմպակտ նկարագրել տվյալները, հասկանալ դրանց կառուցվածքը, դասակարգել դրանք և տեսնել պատահական երևույթների քաոսի օրինաչափությունները: Նույնիսկ տեսողական և հետախուզական տվյալների վերլուծության ամենապարզ մեթոդները կարող են զգալիորեն պարզաբանել բարդ իրավիճակը, որն ի սկզբանե հարվածում է թվերի կույտին:

Օբյեկտների մի շարքի վիճակագրական նկարագրությունը միջանկյալ դիրք է գրավում մի կողմից հավաքածուի օբյեկտներից յուրաքանչյուրի անհատական ​​նկարագրության և հավաքածուի նկարագրության միջև՝ ըստ նրա ընդհանուր հատկությունների, ինչը չի պահանջում դրա բաժանումը առանձինների։ առարկաներ ընդհանրապես, մյուս կողմից: Համեմատած առաջին մեթոդի հետ՝ վիճակագրական տվյալները միշտ քիչ թե շատ անանձնական են և ունեն միայն սահմանափակ արժեք այն դեպքերում, երբ անհատական ​​տվյալներ են նշանակալի (օրինակ՝ ուսուցիչը, ծանոթանալով դասի հետ, կստանա միայն շատ նախնական կողմնորոշում այդ մասին. իրերի վիճակը մեկ վիճակագրությունից՝ գերազանց, լավ, բավարար և անբավարար գնահատականներով իր բացահայտված նախորդի թվի մասին): Մյուս կողմից, համեմատած բնակչության արտաքինից դիտարկվող ընդհանուր հատկությունների տվյալների հետ, վիճակագրական տվյալները թույլ են տալիս ավելի խորը պատկերացում կազմել հարցի էության մեջ: Օրինակ, ապարների հատիկաչափական վերլուծության տվյալները (այսինքն՝ ժայռը ձևավորող մասնիկների ըստ չափերի բաշխման տվյալները) արժեքավոր լրացուցիչ տեղեկատվություն են տալիս չբաժանված ապարների նմուշների փորձարկման համեմատ՝ թույլ տալով որոշ չափով բացատրել ապարների հատկությունները։ ժայռը, դրա առաջացման պայմանները և այլն։

Հետազոտության մեթոդը, որը հիմնված է օբյեկտների որոշակի խմբերի վերաբերյալ վիճակագրական տվյալների դիտարկման վրա, կոչվում է վիճակագրական: Վիճակագրական մեթոդը կիրառվում է գիտելիքի տարբեր ոլորտներում։ Այնուամենայնիվ, վիճակագրական մեթոդի առանձնահատկությունները, երբ կիրառվում են տարբեր բնույթի օբյեկտների վրա, այնքան յուրօրինակ են, որ անիմաստ կլինի համատեղել, օրինակ, սոցիալ-տնտեսական վիճակագրությունը, ֆիզիկական վիճակագրությունը:

Վիճակագրական մեթոդի ընդհանուր առանձնահատկությունները գիտելիքի տարբեր ոլորտներում կրճատվում են որոշակի խմբերում ընդգրկված օբյեկտների քանակի հաշվարկով, հաշվի առնելով քանակների, առանձնահատկությունների բաշխումը, նմուշառման մեթոդի կիրառումը (այն դեպքերում, երբ վիթխարի օբյեկտների մանրամասն ուսումնասիրությունը բնակչությունը դժվար է), օգտագործելով հավանականությունների տեսությունը որոշակի եզրակացությունների համար դիտարկումների քանակի բավարարությունը գնահատելու համար և այլն: Վիճակագրական հետազոտության մեթոդների այս պաշտոնական մաթեմատիկական կողմը, անտարբեր ուսումնասիրվող օբյեկտների հատուկ բնույթի նկատմամբ, առարկա է: մաթեմատիկական վիճակագրություն

Մաթեմատիկական վիճակագրության և հավանականությունների տեսության կապը տարբեր դեպքերում տարբեր բնույթ է կրում։ Հավանականությունների տեսությունը ոչ թե ուսումնասիրում է որևէ երևույթ, այլ պատահական և հենց «հավանականորեն պատահական» երևույթներ, այսինքն՝ դրանք, որոնց համար իմաստ ունի խոսել դրանց համապատասխան հավանականության բաշխումների մասին։ Այնուամենայնիվ, հավանականության տեսությունը որոշակի դեր է խաղում նաև ցանկացած բնույթի զանգվածային երևույթների վիճակագրական ուսումնասիրության մեջ, որոնք հնարավոր է չդասակարգվեն հավանականորեն պատահական: Դա արվում է նմուշառման տեսության և հավանականությունների տեսության վրա հիմնված չափման սխալների տեսության միջոցով: Այս դեպքերում հավանականական օրինաչափությունները ենթակա են ոչ թե բուն ուսումնասիրված երեւույթներին, այլ դրանց ուսումնասիրության մեթոդներին։

Ավելի կարևոր դեր է խաղում հավանականության տեսությունը հավանականության երևույթների վիճակագրական ուսումնասիրության մեջ։ Այստեղ լիարժեք կիրառություն են գտնում հավանականության տեսության վրա հիմնված մաթեմատիկական վիճակագրության այնպիսի բաժինները, ինչպիսիք են հավանականության վարկածների վիճակագրական փորձարկման տեսությունը, հավանականության բաշխումների վիճակագրական գնահատման տեսությունը և դրանց պարամետրերը և այլն։ Այս ավելի խորը վիճակագրական մեթոդների կիրառման ոլորտը շատ ավելի նեղ է, քանի որ այստեղ պահանջվում է, որ ուսումնասիրվող երևույթներն իրենք ենթարկվեն բավական որոշակի հավանականության օրենքներին:

Հավանական օրինաչափությունները ստանում են վիճակագրական արտահայտություն (հավանականությունները կատարվում են մոտավորապես հաճախականությունների տեսքով, իսկ մաթեմատիկական ակնկալիքները՝ միջինների տեսքով) մեծ թվերօրենք.

Դաշտային փորձարկումներում ուսումնասիրված գյուղատնտեսական լավագույն փորձը և սորտերը բացահայտելու և գնահատելու համար օգտագործվում է փորձարարական տվյալների վիճակագրական մշակում, որը ներկայացված է փորձարարական բույսերի բերքատվության և այլ հատկությունների ու որակների սյուժեի թվային ցուցիչների տեսքով: Այս ցուցանիշները բնութագրում են ուսումնասիրվող երևույթը և արտացոլում են ուսումնասիրված գործոնների գործողության արդյունքը, որոնք դրսևորվել են որոշակի վայրում որոշակի ժամանակահատվածում, փորձի ընթացքում նկատված տարբեր պատճառներով բոլոր աղավաղումներով, իրական տվյալներից շեղումներով:

Վիճակագրությունլայն իմաստով այն կարելի է սահմանել որպես բնության և հասարակության զանգվածային երևույթների քանակական վերլուծության գիտություն, որը ծառայում է դրանց որակական հատկանիշների բացահայտմանը։

Վիճակագրությունը գիտելիքի մի ճյուղ է, որը միավորում է սկզբունքներն ու մեթոդները զանգվածային երևույթները բնութագրող թվային տվյալների հետ։ Այս առումով վիճակագրությունը ներառում է մի քանի անկախ առարկաներ՝ վիճակագրության ընդհանուր տեսություն՝ որպես ներածական դասընթաց, հավանականության տեսություն և մաթեմատիկական վիճակագրություն՝ որպես ընդհանուր բնակչության հիմնական կատեգորիաների և մաթեմատիկական հատկությունների գիտություն և դրանց ընտրովի գնահատականները:

«Վիճակագրություն» բառը գալիս է լատիներեն «status» բառից՝ պետություն, իրերի վիճակ։ Սկզբում այն ​​օգտագործվում է «քաղաքական վիճակ» իմաստով։ Այստեղից էլ առաջացել է իտալերեն stato՝ պետություն և statista՝ պետության գիտակ բառը։ «Վիճակագրություն» բառը գիտական ​​կիրառություն է ստացել 18-րդ դարում և ի սկզբանե օգտագործվել է որպես «պետական ​​գիտություն»:

Ներկայումս վիճակագրությունը կարող է սահմանվել որպես զանգվածային տվյալների հավաքում, դրանց ընդհանրացում, ներկայացում, վերլուծություն և մեկնաբանում։ Սա հատուկ մեթոդ է, որն օգտագործվում է գործունեության տարբեր ոլորտներում, տարբեր խնդիրներ լուծելիս։

Վիճակագրությունը հնարավորություն է տալիս բացահայտել և չափել սոցիալ-տնտեսական երևույթների և գործընթացների զարգացման օրինաչափությունները, դրանց փոխհարաբերությունները: Օրինաչափությունների ճանաչումը հնարավոր է միայն այն դեպքում, եթե ուսումնասիրվեն ոչ թե առանձին երևույթներ, այլ երևույթների ամբողջություն, քանի որ օրինաչափությունները դրսևորվում են ամբողջությամբ, միայն երևույթների զանգվածում։ Յուրաքանչյուր առանձին երևույթի մեջ անհրաժեշտը՝ այն, ինչը բնորոշ է տվյալ տեսակի բոլոր երևույթներին, դրսևորվում է միասնության մեջ պատահականի, անհատականի հետ, որը բնորոշ է միայն այս կոնկրետ երևույթին:

Այն օրինաչափությունները, որոնցում անհրաժեշտությունը յուրաքանչյուր առանձին երևույթի մեջ անքակտելիորեն կապված է պատահականության հետ, և միայն բազմաթիվ երևույթների մեջ է օրենքը դրսևորվում, կոչվում են վիճակագրական:

Ըստ այդմ, վիճակագրական ուսումնասիրության առարկան միշտ էլ որոշակի երևույթների ամբողջությունն է՝ ներառյալ ուսումնասիրված օրինաչափության դրսևորումների ամբողջությունը։ Մեծ ագրեգատի մեջ առանձին սորտերը ջնջում են միմյանց, և կանոնավոր հատկությունները հայտնվում են առաջին պլանում: Քանի որ վիճակագրությունը նախատեսված է օրինաչափությունը բացահայտելու համար, այն, հենվելով ուսումնասիրված օրինաչափության յուրաքանչյուր առանձին դրսևորման տվյալների վրա, ընդհանրացնում է դրանք և այդպիսով ստանում է այս օրինաչափության քանակական արտահայտությունը:

Ուսումնասիրության յուրաքանչյուր քայլ ավարտվում է արդյունքների մեկնաբանմամբ՝ ի՞նչ եզրակացություն կարելի է անել վերլուծությունից, ի՞նչ են ասում թվերը՝ դրանք հաստատո՞ւմ են նախնական ենթադրությունները, թե՞ նոր բան են բացահայտում։ Տվյալների մեկնաբանումը սահմանափակվում է սկզբնաղբյուր նյութով: Եթե ​​եզրակացությունները հիմնված են ընտրանքային տվյալների վրա, ապա ընտրանքը պետք է լինի ներկայացուցչական, որպեսզի եզրակացությունները կիրառվեն ամբողջ բնակչության վրա: Վիճակագրությունը թույլ է տալիս պարզել այն ամենը, ինչ օգտակար է, որը պարունակվում է աղբյուրի տվյալների մեջ և որոշել, թե ինչ և ինչպես կարելի է օգտագործել որոշումներ կայացնելիս:

Ժամկետ տատանումների վիճակագրություններկայացվել է 1899 թվականին Դանկերի կողմից՝ նշելու համար մաթեմատիկական վիճակագրության մեթոդները, որոնք օգտագործվում են որոշակի կենսաբանական երևույթների ուսումնասիրության ժամանակ։ Մի փոքր ավելի վաղ՝ 1889 թվականին, Ֆ. Գալթոնը ներմուծեց ևս մեկ տերմին. կենսաչափություն(հունարեն «bios» - կյանք և «մետր» - չափել բառերից), որը նշանակում է մաթեմատիկական վիճակագրության որոշակի մեթոդների օգտագործումը ժառանգականության, փոփոխականության և այլ կենսաբանական երևույթների ուսումնասիրության մեջ։ Հավանականության տեսության հիման վրա փոփոխական վիճակագրությունը թույլ է տալիս ճիշտ մոտենալ ուսումնասիրված երևույթների քանակական արտահայտման վերլուծությանը, քննադատական ​​գնահատական ​​տալ ստացված քանակական ցուցանիշների հավաստիությանը, հաստատել ուսումնասիրված երևույթների միջև կապի բնույթը։ , և, հետևաբար, հասկանալ դրանց որակական ինքնատիպությունը։

Կարևոր է հիշել, որ յուրաքանչյուր կենսաբանական օբյեկտ ունի փոփոխականություն: Նրանք. Հատկանիշներից յուրաքանչյուրը (բույսի բարձրությունը, մեկ հասկի հատիկների քանակը, սննդանյութերի պարունակությունը) տարբեր անհատների մոտ կարող է ունենալ տարբեր աստիճանի ծանրություն, ինչը ցույց է տալիս հատկանիշի փոփոխականությունը կամ տատանումները:

Հետազոտության վիճակագրական մեթոդով ուշադրությունը կենտրոնանում է ոչ թե մեկ օբյեկտի, այլ միատարր օբյեկտների խմբի վրա, այսինքն. դրանց ամբողջականության մի մասի վրա՝ միավորված համատեղ ուսումնասիրության համար: Որոշակի թվով միատարր միավորներ, որոնք տեղակայված են ըստ մեկ կամ մի քանի փոփոխվող բնութագրերի, կոչվում են վիճակագրական բնակչություն:

Վիճակագրական ագրեգատները բաժանվում են.

  1. գեներալ
  2. ընտրովի

Բնակչությունմիավորում է ուսումնասիրվող բոլոր հնարավոր միատարր միավորները, օրինակ՝ բույսերը դաշտում, վնասատուների պոպուլյացիաները դաշտում, բույսերի հարուցիչներ։ Նմուշի բնակչություններկայացնում է ընդհանուր բնակչությունից վերցված և ստուգման ենթակա միավորների մի մասը: Ուսումնասիրելով, օրինակ, որոշակի սորտի խնձորենիների բերքատվությունը, ընդհանուր պոպուլյացիան ներկայացված է տվյալ սորտի, տարիքի բոլոր ծառերով, որոնք աճում են որոշակի միատարր պայմաններում։ Նմուշային հավաքածուն բաղկացած է ուսումնասիրվող տնկարկների փորձնական հողատարածքներից վերցված որոշակի քանակությամբ խնձորի ծառերից:

Ակնհայտ է, որ վիճակագրական հետազոտություններում պետք է գործ ունենալ բացառապես ընտրանքային պոպուլյացիաների հետ: Ընտրանքային բնակչության վերլուծության հիման վրա ընդհանուր բնակչության հատկությունների վերաբերյալ դատողությունների ճիշտությունը, առաջին հերթին, կախված է դրա բնորոշությունից: Այսպիսով, որպեսզի ընտրանքը իսկապես արտացոլի ընդհանուր բնակչության բնորոշ հատկությունները, ընտրանքի պոպուլյացիան պետք է ներառի բավարար թվով միատարր միավորներ, որոնք ունեն հատկություն. ներկայացուցչականությունը. Ներկայացուցչականությունը ձեռք է բերվում ընդհանուր բնակչությունից տարբերակի պատահական ընտրությամբ, որը հավասար հնարավորություն է տալիս ընդհանուր բնակչության բոլոր անդամներին մտնել ընտրանք:

Որոշ երևույթների վիճակագրական ուսումնասիրությունը հիմնված է վիճակագրական ագրեգատները կազմող ցուցանիշների կամ մեծությունների փոփոխականության վերլուծության վրա։ Վիճակագրական արժեքները կարող են տարբեր արժեքներ ընդունել՝ միաժամանակ բացահայտելով դրանց փոփոխականության որոշակի օրինաչափություն։ Այս առումով վիճակագրական մեծությունները կարող են սահմանվել որպես մեծություններ, որոնք որոշակի հավանականություններով տարբեր արժեքներ են ստանում:

Դիտարկումների կամ փորձերի ընթացքում մենք բախվում ենք տարբեր տեսակի փոփոխական ցուցիչների հետ։ Նրանցից ոմանք կրում են ընդգծված քանակականբնությունը և հեշտությամբ չափելի են, իսկ մյուսները չեն կարող արտահայտվել սովորական քանակական ձևով և բնորոշ են որակականբնավորություն.

Այս առումով առանձնանում են փոփոխականության կամ տատանումների երկու տեսակ.

  1. քանակական
  2. որակ

2. Քանակական փոփոխականության վիճակագրական բնութագրերը

Որպես քանակական փոփոխականության օրինակ՝ պետք է ներառել. Որակական տատանումների օրինակ է. բույսերի տարբեր օրգանների գույնի կամ սեռի փոփոխություն, կանաչ կամ դեղին գույն ունեցող հարթ և կնճռոտ ոլոռ, ինչպես նաև հիվանդությունների և վնասատուների կողմից բույսերի վնասման տարբեր աստիճաններ:

Քանակական տատանումն իր հերթին կարելի է բաժանել երկու տեսակի՝ տատանումների շարունակական և ընդհատվող.

Շարունակականտատանումները ներառում են դեպքեր, երբ ուսումնասիրվող պոպուլյացիաները բաղկացած են վիճակագրական միավորներից, որոնք որոշվում են չափումների կամ այդ չափումների վրա հիմնված հաշվարկների միջոցով: Շարունակական տատանումների օրինակ կարելի է արտահայտել՝ սերմերի քաշը և չափը, միջհանգույցների երկարությունը, բերքատվությունը։ Այս բոլոր դեպքերում ուսումնասիրված քանակական ցուցիչները տեսականորեն կարող են ընդունել բոլոր հնարավոր արժեքները՝ ինչպես ամբողջ, այնպես էլ կոտորակային՝ իրենց ծայրահեղ սահմանների միջև։ Ծայրահեղ նվազագույն արժեքից առավելագույնին անցումը տեսականորեն աստիճանական է և կարող է ներկայացվել հոծ գծով:

ժամը ընդհատվողտատանումները, առանձին վիճակագրական մեծությունները առանձին տարրերի հավաքածու են, որոնք արտահայտվում են այլևս ոչ թե չափման և ոչ թե հաշվարկի միջոցով, այլ հաշվելու միջոցով: Նման տատանումների օրինակ է մրգերում սերմերի քանակի, ծաղկաթերթիկների քանակի, միավորի վրա ծառերի քանակի, մեկ բույսի եգիպտացորենի կոճերի քանակի փոփոխությունը: Այս տեսակի ընդհատվող տատանումները երբեմն կոչվում են նաև ամբողջ թվեր, քանի որ առանձին վիճակագրական մեծություններ ձեռք են բերում բավականին որոշակի ամբողջ արժեքներ, մինչդեռ շարունակական տատանումների դեպքում այդ մեծությունները կարող են արտահայտվել ինչպես ամբողջ, այնպես էլ կոտորակային արժեքներով:

Քանակական փոփոխականության հիմնական վիճակագրական բնութագրերը հետևյալն են.

1. Թվաբանական միջին;

Հատկանիշների փոփոխականության ցուցիչներ.

2. ցրվածություն;

3. ստանդարտ շեղում;

4. տատանումների գործակից;

5. Միջին թվաբանական սխալ.

6. Հարաբերական սխալ.

Թվաբանական միջին. Տարբեր քանակական ցուցանիշներ ուսումնասիրելիս հիմնական ամփոփ արժեքը նրանց թվաբանական միջինն է: Թվաբանական միջինը ծառայում է ինչպես առանձին ուսումնասիրված պոպուլյացիաների դատելու, այնպես էլ համապատասխան պոպուլյացիաները միմյանց հետ համեմատելու համար: Ստացված միջին արժեքները հիմք են հանդիսանում եզրակացություններ անելու և որոշակի գործնական խնդիրներ լուծելու համար։

Միջին թվաբանականը հաշվարկելու համար օգտագործվում է հետևյալ բանաձևը. եթե բոլոր տարբերակների գումարը (x 1 + x 2 + ... + x n) նշվում է Σ x i, տարբերակների քանակը՝ n-ով, ապա միջին թվաբանականը. որոշվել է:

x տես. =Σ x i / n)

Միջին թվաբանականը տալիս է ուսումնասիրված վիճակագրական բնակչության առաջին ընդհանուր քանակական բնութագիրը։ Մի շարք տեսական և գործնական խնդիրներ լուծելիս, վերլուծված ցուցանիշի միջին արժեքը իմանալու հետ մեկտեղ, անհրաժեշտ է դառնում հավելյալ հաստատել այս միջինի շուրջ տարբերակի բաշխման բնույթը:

Գյուղատնտեսական և կենսաբանական հետազոտությունների օբյեկտները բնութագրվում են ժամանակի և տարածության մեջ նշանների և հատկությունների փոփոխականությամբ։ Դրա պատճառներն են ինչպես օրգանիզմների ներքին, ժառանգական բնութագրերը, այնպես էլ շրջակա միջավայրի պայմաններին նրանց արձագանքման տարբեր նորմերը։

Ցրման բնույթի բացահայտումը փորձարարական տվյալների վիճակագրական վերլուծության հիմնական խնդիրներից մեկն է, որը թույլ է տալիս ոչ միայն գնահատել դիտարկման ցրվածության աստիճանը, այլև օգտագործել այս գնահատականը՝ ուսումնասիրության արդյունքները վերլուծելու և մեկնաբանելու համար:

Իրենց միջին արժեքին մոտ խմբավորման տարբերակի բնույթը, որը նաև կոչվում է ցրում, կարող է ծառայել որպես ուսումնասիրվող նյութի փոփոխականության աստիճանի ցուցիչ։ Փոփոխականության ցուցիչներ. Սահմանափակումներ (տարբերակների միջակայք)ագրեգատում հատկանիշի նվազագույն և առավելագույն արժեքներն են: Որքան մեծ է նրանց միջև տարբերությունը, այնքան ավելի փոփոխական է նշանը:

Տարբերակ S 2 և ստանդարտ շեղում S. Այս վիճակագրական բնութագրերը հետազոտվող հատկանիշի փոփոխության (ցրման) հիմնական չափորոշիչներն են։ Շեղումները (միջին քառակուսին) Ս (x – x) 2 քառակուսի շեղումների գումարի քանորդն է, որը բաժանվում է առանց միասնության բոլոր չափումների թվի.

Σ (x - x) 2 / n -1

Ստանդարտը կամ ստանդարտ շեղումը ստացվում է դիսպերսիայի քառակուսի արմատը վերցնելով.

S = √ S 2

Ստանդարտ շեղումբնութագրում է ուսումնասիրված նյութի փոփոխականության աստիճանը, դրա փոփոխության տարբեր երկրորդական պատճառների հատկանիշի վրա ազդեցության աստիճանի չափը՝ արտահայտված բացարձակ թվերով, այսինքն. նույն միավորներով, ինչ առանձին տարբերակի արժեքները: Այս առումով ստանդարտ շեղումը կարող է օգտագործվել միայն վիճակագրական պոպուլյացիաների փոփոխականությունը համեմատելիս, որոնց տարբերակներն արտահայտված են նույն չափման միավորներով:

Վիճակագրության մեջ ընդհանուր առմամբ ընդունված է, որ բավականաչափ մեծ ծավալի ագրեգատների փոփոխականության շրջանակը, որոնք գտնվում են բազմաթիվ բազմազան և բազմակողմ գործոնների (կենսաբանական երևույթների) մշտական ​​ազդեցության տակ, չի անցնում թվաբանական միջինի 3S-ից: Ասվում է, որ նման պոպուլյացիաները հետևում են նորմալ տարբերակի բաշխմանը:

Հաշվի առնելով այն հանգամանքը, որ յուրաքանչյուր ուսումնասիրված կենսաբանական պոպուլյացիայի փոփոխականության միջակայքը գտնվում է միջին թվաբանականի 3S-ի սահմաններում, որքան մեծ է ստանդարտ շեղումը, այնքան մեծ է հատկանիշի փոփոխականությունը ուսումնասիրված պոպուլյացիաներում: Ստանդարտ շեղումը օգտագործվում է որպես անկախ ցուցանիշ և որպես հիմք այլ ցուցանիշների հաշվարկման համար:

Տարասեռ պոպուլյացիաների փոփոխականությունը համեմատելիս անհրաժեշտ է օգտագործել փոփոխականության չափանիշ, որը վերացական թիվ է։ Այդ նպատակով ներկայացվել է վիճակագրությունը տատանումների գործակիցը, որը հասկացվում է որպես ստանդարտ շեղում, որն արտահայտվում է որպես այս բնակչության թվաբանական միջինի տոկոս.

V = S / x × 100%:

Տատանումների գործակիցը թույլ է տալիս օբյեկտիվ գնահատել տատանումների աստիճանը ցանկացած պոպուլյացիաների համեմատության ժամանակ: Քանակական հատկանիշներն ուսումնասիրելիս այն թույլ է տալիս ընտրել դրանցից ամենակայունը։ Փոփոխականությունը համարվում է աննշան, եթե տատանումների գործակիցը չի գերազանցում 10%-ը, միջինը՝ 10%-ից մինչև 20%-ը, և նշանակալի՝ եթե այն 20%-ից ավելի է։

Ելնելով դիտարկված ցուցանիշներից՝ մենք հանգում ենք դատողության ողջ ընդհանուր բնակչության որակական ինքնատիպության մասին։ Ակնհայտ է, որ ընդհանուր բնակչության վերաբերյալ մեր դատողությունների հավաստիության աստիճանը, առաջին հերթին, կախված կլինի նրանից, թե որքանով ընտրանքային բնակչության այս կամ այն ​​մասում նրա անհատական, ինչպես նաև պատահական հատկանիշները չեն խանգարում ուսումնասիրվող երևույթի ընդհանուր օրինաչափությունների և հատկությունների դրսևորում.

Ելնելով այն հանգամանքից, որ շատ դեպքերում փորձարարական աշխատանքներ և գիտական ​​հետազոտություններ կատարելիս մենք չենք կարող գործել շատ մեծ նմուշներով, անհրաժեշտ է դառնում այդ նմուշների հիման վրա որոշել ուսումնասիրված նյութի մեր բնութագրերի հնարավոր սխալները: Հարկ է նշել, որ այս դեպքում սխալները պետք է հասկանալ ոչ թե որպես որոշակի վիճակագրական ցուցանիշների հաշվարկների սխալներ, այլ ամբողջ բնակչության նկատմամբ դրանց արժեքների հնարավոր տատանումների սահմանները.

Վիճակագրական ցուցանիշների առանձին հայտնաբերված արժեքների համեմատությունը դրանց շեղումների հնարավոր սահմանների հետ, ի վերջո, ծառայում է որպես ստացված նմուշի բնութագրերի հուսալիությունը գնահատելու չափանիշ: Այս կարևոր հարցի լուծումը թե՛ տեսական, թե՛ գործնականում տալիս է վիճակագրական սխալների տեսությունը։

Ինչպես տատանումների շարքի տարբերակները բաշխված են իրենց միջինի շուրջ, այնպես էլ առանձին նմուշներից ստացված միջոցների մասնակի արժեքները կբաշխվեն նույն կերպ: Այսինքն, որքան շատ են տարբերվում ուսումնասիրված օբյեկտները, այնքան ավելի շատ են տարբերվելու մասնավոր արժեքները: Միևնույն ժամանակ, որքան ավելի շատ միջինների մասնավոր արժեքներ ստացվեն ավելի մեծ թվով տարբերակների վրա, այնքան ավելի մոտ կլինեն դրանք ամբողջ վիճակագրական բնակչության թվաբանական միջինի իրական արժեքին: Ելնելով վերը նշվածից նմուշի միջին սխալ (ստանդարտ սխալ)ընտրանքային միջինի շեղման չափն է ընդհանուր բնակչության միջինից: Ընտրանքային սխալներն առաջանում են ընտրանքային պոպուլյացիայի թերի ներկայացուցչականության, ինչպես նաև ընտրանքի ուսումնասիրությունից ստացված տվյալները ողջ բնակչությանը փոխանցելիս: Սխալի արժեքը կախված է ուսումնասիրվող հատկանիշի փոփոխականության աստիճանից և ընտրանքի չափից:

Ստանդարտ սխալն ուղիղ համեմատական ​​է նմուշի ստանդարտ շեղմանը և հակադարձ համեմատական ​​է չափումների քանակի քառակուսի արմատին.

S X = S / √ n

Ընտրանքային սխալներն արտահայտվում են նույն չափման միավորներով, ինչ փոփոխական հատկանիշը և ցույց են տալիս այն սահմանները, որոնց սահմաններում կարող է լինել ուսումնասիրված բնակչության թվաբանական միջինի իրական արժեքը: Ընտրանքային միջինի բացարձակ սխալն օգտագործվում է ընդհանուր բնակչության շրջանում վստահության սահմանները, ընտրանքի ցուցիչների և տարբերության հուսալիությունը, ինչպես նաև հետազոտական ​​աշխատանքում ընտրանքի չափը սահմանելու համար:

Միջին սխալը կարող է օգտագործվել ուսումնասիրության ճշգրտության ցուցիչ ստանալու համար. ընտրանքի միջինի հարաբերական սխալ:Սա ընտրանքի սխալն է՝ արտահայտված որպես համապատասխան միջինի տոկոս.

S X, % = S x / x cf × 100

Արդյունքները համարվում են բավականին գոհացուցիչ, եթե հարաբերական սխալը չի ​​գերազանցում 3-5%-ը և համապատասխանում է բավարար մակարդակի, 1-2%-ում` շատ բարձր ճշգրտություն, 2-3%` բարձր ճշգրտություն:

3. Վիճակագրական բաշխման տեսակները

Ագրեգատում հատկանիշի որոշակի արժեքների դրսևորման հաճախականությունը կոչվում է բաշխում: Տարբերակել դիտարկումների արդյունքների ամբողջականության էմպիրիկ և տեսական հաճախականությունների բաշխումները: Էմպիրիկ բաշխումը նմուշի ուսումնասիրությունից ստացված չափումների արդյունքների բաշխումն է: Տեսական բաշխումը ենթադրում է հավանականությունների տեսության հիման վրա չափումների բաշխում։ Դրանք ներառում են՝ նորմալ (Գաուսյան) բաշխում, Ուսանողի բաշխում (t - բաշխում), F - բաշխում, Պուասոնի բաշխում, երկանդամ:

Կենսաբանական հետազոտության մեջ ամենակարևորը նորմալ կամ գաուսյան բաշխումն է. սա չափումների մի շարք է, որտեղ տարբերակները խմբավորված են բաշխման կենտրոնի շուրջ, և դրանց հաճախականությունները հավասարապես նվազում են բաշխման կենտրոնից աջ և ձախ (x): Առանձին տարբերակները սիմետրիկորեն շեղվում են թվաբանական միջինից, և երկու ուղղություններով տատանումների միջակայքը չի գերազանցում 3 σ-ը։ Նորմալ բաշխումը բնորոշ է այն պոպուլյացիաներին, որոնց անդամները միասին ենթարկվում են անսահման թվով տարբեր և բազմակողմ գործոնների ազդեցությանը: Յուրաքանչյուր գործոն որոշակի մասով նպաստում է հատկանիշի ընդհանուր փոփոխականությանը: Գործոնների անսահման տատանումները առաջացնում են ագրեգատների առանձին անդամների փոփոխականությունը։

Այս չափանիշը մշակվել է Ուիլյամ Գոսեթի կողմից՝ Գինեսում գարեջրի որակը գնահատելու համար: Ընկերության առևտրային գաղտնիքները չհրապարակելու պարտավորությունների հետ կապված (և Գինեսի ղեկավարությունը համարում էր վիճակագրական ապարատի օգտագործումը իրենց աշխատանքում որպես այդպիսին), Գոսեթի հոդվածը հրապարակվել է Biometrics ամսագրում «Ուսանող» կեղծանունով:

Այս չափանիշը կիրառելու համար անհրաժեշտ է, որ սկզբնական տվյալները ունենան նորմալ բաշխում։ Անկախ նմուշների համար երկընտրանքային թեստ կիրառելու դեպքում անհրաժեշտ է պահպանել նաև շեղումների հավասարության պայմանը։ Այնուամենայնիվ, կան Student's t-test-ի այլընտրանքներ անհավասար շեղումներ ունեցող իրավիճակների համար:

Իրական հետազոտություններում Student-ի t-թեստի սխալ օգտագործումը բարդանում է նաև նրանով, որ հետազոտողների ճնշող մեծամասնությունը ոչ միայն չի ստուգում ընդհանուր շեղումների հավասարության վարկածը, այլև չի ստուգում առաջին սահմանափակումը. խմբեր. Արդյունքում, նման հրապարակումների հեղինակները մոլորեցնում են ինչպես իրենց, այնպես էլ իրենց ընթերցողներին միջոցների հավասարության ստուգման իրական արդյունքների վերաբերյալ։ Սրան հավելենք այն փաստը, որ անտեսվում է բազմակի համեմատությունների խնդիրը, երբ հեղինակները զույգ-զույգ համեմատություններ են կատարում երեք և ավելի համեմատվող խմբերի համար։ Հարկ է նշել, որ վիճակագրական նման անփույթությունից են տառապում ոչ միայն սկսնակ ասպիրանտներն ու դիմորդները, այլև մասնագետները, որոնք ներդրում են կատարել տարբեր ակադեմիական և կառավարչական ռեգալիաներով՝ ակադեմիկոսներ, համալսարանների ռեկտորներ, դոկտորներ և գիտությունների թեկնածուներ և շատ այլ գիտնականներ։

Student's t-test-ի սահմանափակումների անտեսման արդյունքը հոդվածների և ատենախոսությունների հեղինակների, ապա այդ հրապարակումների ընթերցողների շփոթությունն է համեմատվող խմբերի ընդհանուր միջինների իրական հարաբերակցության վերաբերյալ: Այսպիսով, մի դեպքում եզրակացություն է արվում միջոցների էական տարբերության մասին, երբ դրանք իրականում չեն տարբերվում, մյուս դեպքում, ընդհակառակը, եզրակացություն է արվում միջոցների էական տարբերության բացակայության մասին, երբ նման տարբերություն կա.

Ինչու՞ է կարևոր նորմալ բաշխումը:Նորմալ բաշխումը կարևոր է բազմաթիվ պատճառներով: Շատ վիճակագրությունների բաշխումը նորմալ է կամ կարելի է ստանալ նորմալից՝ որոշ փոխակերպումներով: Փիլիսոփայական առումով կարելի է ասել, որ նորմալ բաշխումը իրականության ընդհանուր բնույթի էմպիրիկորեն ստուգված ճշմարտություններից մեկն է, և դրա դիրքը կարելի է համարել որպես բնության հիմնարար օրենքներից մեկը։ Նորմալ բաշխման ճշգրիտ ձևը (բնորոշ «զանգի կորը») որոշվում է միայն երկու պարամետրով՝ միջին և ստանդարտ շեղում։

Նորմալ բաշխման բնորոշ հատկությունն այն է, որ նրա բոլոր դիտարկումների 68%-ը գտնվում է միջինի և միջակայքի ±1 ստանդարտ շեղման մեջ. ± 2 ստանդարտ շեղումները պարունակում են արժեքների 95% -ը: Այլ կերպ ասած, նորմալ բաշխման դեպքում ստանդարտացված դիտարկումները -2-ից փոքր կամ +2-ից ավելին ունեն 5%-ից պակաս հարաբերական հաճախականություն (Ստանդարտացված դիտարկումը նշանակում է, որ միջինը հանվում է սկզբնական արժեքից և արդյունքը բաժանվում է ստանդարտի շեղում (տարբերության արմատ)): Եթե ​​դուք մուտք ունեք STATISTICA փաթեթին, կարող եք հաշվարկել ճշգրիտ հավանականությունները, որոնք կապված են նորմալ բաշխման տարբեր արժեքների հետ, օգտագործելով Հավանականության Հաշվիչը. Օրինակ, եթե z արժեքը (այսինքն՝ ստանդարտ նորմալ բաշխում ունեցող պատահական փոփոխականի արժեքը) սահմանեք 4, ապա STATISTICA-ի կողմից հաշվարկված հավանականության համապատասխան մակարդակը կլինի 0,0001-ից պակաս, քանի որ նորմալ բաշխման դեպքում գրեթե բոլոր դիտարկումները (այսինքն՝ ավելի քան 99, 99%) ընկնելու են ±4 ստանդարտ շեղումների սահմաններում:

Այս բաշխման գրաֆիկական արտահայտությունը կոչվում է Գաուսի կոր, կամ նորմալ բաշխման կոր։ Փորձնականորեն հաստատվել է, որ նման կորը հաճախ կրկնում է ստացված հիստոգրամների ձևը մեծ թվերդիտարկումներ։

Նորմալ բաշխման կորի ձևը և դրա դիրքը որոշվում են երկու արժեքով՝ ընդհանուր միջին և ստանդարտ շեղում:

Գործնական հետազոտություններում նրանք ուղղակիորեն չեն օգտագործում բանաձեւը, այլ դիմում են աղյուսակների օգնությանը։

Նորմալ բաշխման առավելագույնը կամ կենտրոնը գտնվում է x = μ կետում, կորի թեքման կետը x1 = μ - σ և x2 = μ + σ է, n = ± ∞-ում կորը հասնում է զրոյի: Մ-ից աջ և ձախ տատանումների միջակայքը կախված է σ արժեքից և գտնվում է երեք ստանդարտ շեղումների սահմաններում.

1. Բոլոր դիտարկումների 68,26% -ը գտնվում է μ + σ սահմանների տարածքում;

2. μ + 2 σ սահմաններում կա պատահական փոփոխականի բոլոր արժեքների 95,46%-ը.

3. μ + 3σ միջակայքում 99,73% է, հատկանիշի գրեթե բոլոր արժեքները:

Արդյո՞ք բոլոր չափանիշների վիճակագրությունը սովորաբար բաշխված է:Ոչ բոլորը, բայց դրանցից շատերը կա՛մ ունեն նորմալ բաշխում, կա՛մ ունեն բաշխում, որը կապված է նորմալի հետ և հաշվարկվում է նորմալից, օրինակ՝ t, F կամ chi-square: Սովորաբար, այս չափանիշի վիճակագրությունը պահանջում է, որ վերլուծված փոփոխականներն իրենք նորմալ բաշխվեն բնակչության մեջ: Դիտարկված փոփոխականներից շատերն իսկապես նորմալ բաշխված են, ինչը ևս մեկ փաստարկ է, որ նորմալ բաշխումը ներկայացնում է «հիմնարար օրենք»: Խնդիր կարող է առաջանալ, երբ փորձում են թեստեր կիրառել, որոնք հիմնված են նորմալության ենթադրության վրա ոչ նորմալ տվյալների վրա: Այս դեպքերում դուք կարող եք ընտրել երկուսից մեկը: Նախ, դուք կարող եք օգտագործել այլընտրանքային «ոչ պարամետրիկ» թեստեր (այսպես կոչված «ազատ բաշխված թեստեր», տես բաժինը Ոչ պարամետրային վիճակագրություն և բաշխումներ): Այնուամենայնիվ, սա հաճախ անհարմար է, քանի որ այս չափանիշները սովորաբար ավելի քիչ հզոր են և ավելի քիչ ճկուն: Որպես այլընտրանք, շատ դեպքերում դուք դեռ կարող եք օգտագործել թեստեր, որոնք հիմնված են նորմալության ենթադրության վրա, եթե վստահ եք, որ ընտրանքի չափը բավականաչափ մեծ է: Վերջին հնարավորությունը հիմնված է չափազանց կարևոր սկզբունքի վրա՝ հասկանալու նորմալության վրա հիմնված թեստերի հանրաճանաչությունը: Մասնավորապես, երբ ընտրանքի չափը մեծանում է, նմուշի բաշխման ձևը (այսինքն՝ թեստի ընտրանքային վիճակագրության բաշխումը, տերմինն առաջին անգամ օգտագործվել է Fisher, Fisher 1928a-ի կողմից) մոտենում է նորմալ, նույնիսկ եթե ուսումնասիրվող փոփոխականների բաշխումը։ նորմալ չէ. Այս սկզբունքը պատկերված է հետևյալ անիմացիայի միջոցով, որը ցույց է տալիս նմուշների բաշխումների հաջորդականությունը (ստացված է աճող չափի նմուշների հաջորդականության համար՝ 2, 5, 10, 15 և 30), որոնք համապատասխանում են նորմալությունից ընդգծված շեղում ունեցող փոփոխականներին, այսինքն. ընդգծված շեղված բաշխմամբ։

Այնուամենայնիվ, քանի որ ընտրանքի միջին բաշխումը ստանալու համար օգտագործվող ընտրանքի չափը մեծանում է, այս բաշխումը մոտենում է նորմալին: Նկատի ունեցեք, որ n=30 ընտրանքի չափի դեպքում նմուշի բաշխումը «գրեթե» նորմալ է (տե՛ս մոտ տեղադրման գիծը):

Վիճակագրական հուսալիությունը կամ հավանականության մակարդակը կորի տակ գտնվող տարածքն է, որը սահմանափակվում է միջինից t ստանդարտ շեղումներով, արտահայտված որպես ընդհանուր տարածքի տոկոս: Այլ կերպ ասած, սա μ + t σ տարածաշրջանում ընկած հատկանիշի արժեքի առաջացման հավանականությունն է: Նշանակության մակարդակը հավանականությունն է, որ փոփոխվող հատկանիշի արժեքը դուրս է μ + t σ սահմաններից, այսինքն՝ նշանակության մակարդակը ցույց է տալիս պատահական փոփոխականի՝ սահմանված տատանումների սահմաններից շեղվելու հավանականությունը։ Որքան բարձր է հավանականության մակարդակը, այնքան ցածր է նշանակալիության մակարդակը:

Ագրոնոմիական հետազոտությունների պրակտիկայում հնարավոր է համարվում օգտագործել 0,95 - 95% և 0,99 - 99% հավանականությունները, որոնք կոչվում են վստահություն, այսինքն՝ նրանք, որոնց կարելի է վստահել և վստահորեն օգտագործել։ Այսպիսով, 0,95 - 95% հավանականությամբ, 0,05 - 5% սխալ թույլ տալու հնարավորություն կամ 20-ից 1; 0,99 - 99% հավանականությամբ, համապատասխանաբար 0,01 - 1%, կամ 1-ը 100-ից:

Նմանատիպ մոտեցումը կիրառելի է ընտրանքային միջոցների բաշխման դեպքում, քանի որ ցանկացած ուսումնասիրություն կրճատվում է միջինների համեմատությամբ, որոնք ենթարկվում են նորմալ բաշխման օրենքին: Միջին μ, շ 2 շեղումը և ստանդարտ շեղումը σ ընդհանուր բնակչության պարամետրերն են n > ∞-ում: Ընտրանքային դիտարկումները հնարավորություն են տալիս ստանալ այդ պարամետրերի գնահատականները: Մեծ նմուշների համար (n>20-30, n>100) նորմալ բաշխման օրինաչափությունները օբյեկտիվ են դրանց գնահատումների համար, այսինքն՝ 68,26%-ը գտնվում է x ± S տարածաշրջանում, 95,46%-ը՝ x ± 2S տարածաշրջանում, 99,46%: գտնվում են x ± 3S տարածաշրջանում, բոլոր դիտարկումների 73%-ը: Միջին թվաբանականը և ստանդարտ շեղումը հիմնական բնութագրիչներից են, որոնցով սահմանվում է չափումների էմպիրիկ բաշխումը:

4. Վիճակագրական վարկածների փորձարկման մեթոդներ

Ցանկացած գյուղատնտեսական կամ կենսաբանական փորձի եզրակացությունները պետք է գնահատվեն՝ ելնելով դրանց նշանակության կամ էականությունից: Նման գնահատումն իրականացվում է փորձի տարբերակները միմյանց հետ համեմատելով կամ հսկողության (ստանդարտի) կամ տեսականորեն սպասվող բաշխման հետ։

Վիճակագրական վարկած- Դիտարկվող պատահական փոփոխականների բաշխման որոշակի վիճակագրական օրենքների վերաբերյալ գիտական ​​ենթադրություն, որը կարելի է ստուգել նմուշի հիման վրա: Համեմատեք պոպուլյացիաները՝ ստուգելով զրոյական վարկածը, որ իրական և տեսական դիտարկումների միջև իրական տարբերություն չկա՝ օգտագործելով ամենահարմար վիճակագրական թեստը: Եթե ​​թեստավորման արդյունքում փաստացի և տեսական ցուցանիշների տարբերությունները մոտ են զրոյի կամ գտնվում են ընդունելի արժեքների միջակայքում, ապա զրոյական վարկածը չի հերքվում։ Եթե ​​պարզվում է, որ տարբերությունները տվյալ վիճակագրական չափանիշի համար կրիտիկական տարածաշրջանում են, մեր վարկածի համաձայն անհնարին են և հետևաբար անհամատեղելի են դրա հետ, ապա զրոյական վարկածը հերքվում է:

Զրոյական վարկածի ընդունումը նշանակում է, որ տվյալները չեն հակասում այն ​​ենթադրությանը, որ իրական և տեսական կատարողականի միջև տարբերություն չկա: Վարկածի հերքումը նշանակում է, որ էմպիրիկ ապացույցը անհամապատասխան է զրոյական վարկածին, իսկ մեկ այլ՝ այլընտրանքային վարկածը ճշմարիտ է: Զրոյական վարկածի վավերականությունը ստուգվում է նշանակության որոշակի մակարդակի համար վիճակագրական թեստի չափանիշների հաշվարկով:

Նշանակության մակարդակը բնութագրում է այն աստիճանը, որով մենք վտանգում ենք սխալվել՝ մերժելով զրոյական վարկածը, այսինքն. որքա՞ն է պատահական փոփոխականի փոփոխության սահմանված սահմաններից շեղվելու հավանականությունը: Հետեւաբար, որքան բարձր է հավանականության մակարդակը, այնքան ցածր է նշանակության մակարդակը:

Հավանականություն հասկացությունը անքակտելիորեն կապված է հասկացության հետ պատահական իրադարձություն. Գյուղատնտեսական և կենսաբանական հետազոտություններում՝ ազդեցության տակ գտնվող կենդանի օրգանիզմներին բնորոշ փոփոխականության պատճառով արտաքին պայմաններիրադարձության առաջացումը կարող է լինել պատահական կամ ոչ պատահական: Ոչ պատահական իրադարձություններ կլինեն այն իրադարձությունները, որոնք դուրս են գալիս ընտրանքային դիտարկումների հնարավոր պատահական տատանումների սահմաններից: Այս հանգամանքը թույլ է տալիս որոշել ինչպես պատահական, այնպես էլ ոչ պատահական իրադարձությունների առաջացման հավանականությունը։

Այս կերպ, հավանականությունը- իրադարձության օբյեկտիվ հնարավորության չափանիշ, բարենպաստ դեպքերի թվի հարաբերակցությունը դեպքերի ընդհանուր թվին: Նշանակության մակարդակը ցույց է տալիս հավանականությունը, որով ստուգված վարկածը կարող է սխալ արդյունք տալ: Գյուղատնտեսական հետազոտությունների պրակտիկայում հնարավոր է համարվում օգտագործել 0,95 (95%) և 0,99 (99%) հավանականությունները, որոնք համապատասխանում են հետևյալ նշանակության մակարդակներին՝ 0,05 - 5% և 0,01 - 1%: Այս հավանականությունները կոչվում են վստահության հավանականություններ, այսինքն. նրանց, ում կարելի է վստահել:

Վիճակագրական չափորոշիչները, որոնք օգտագործվում են վիճակագրական բնակչության միջև անհամապատասխանությունը գնահատելու համար, երկու տեսակի են.

1) պարամետրային (նորմալ բաշխվածություն ունեցող պոպուլյացիաների գնահատման համար).

2) ոչ պարամետրիկ (կիրառվում է ցանկացած ձևի բաշխումների վրա):

Գյուղատնտեսական և կենսաբանական հետազոտությունների պրակտիկայում կան երկու տեսակի փորձեր.

Որոշ փորձերում տարբերակները միմյանց հետ կապված են հետազոտողի կողմից վերահսկվող մեկ կամ մի քանի պայմաններով: Արդյունքում, փորձարարական տվյալները չեն տարբերվում ինքնուրույն, բայց զուգորդել, քանի որ տարբերակները կապող պայմանների ազդեցությունը դրսևորվում է, որպես կանոն, միանշանակ։ Այս տեսակի փորձը ներառում է, օրինակ, դաշտային փորձարկում՝ կրկնություններով, որոնցից յուրաքանչյուրը գտնվում է համեմատաբար հավասար պտղաբերության վայրում: Նման փորձի ժամանակ տարբերակները միմյանց հետ հնարավոր է համեմատել միայն կրկնության սահմաններում։ Հարակից դիտարկումների մեկ այլ օրինակ է ֆոտոսինթեզի ուսումնասիրությունը; այստեղ միավորող պայմանը յուրաքանչյուր փորձարարական բույսի բնութագրերն են:

Սրա հետ մեկտեղ հաճախ համեմատվում են պոպուլյացիաները, որոնց տարբերակները փոխվում են միմյանցից անկախ։ Չկոնյուգացված, անկախ են տարբեր պայմաններում աճեցված բույսերի բնութագրերի տատանումները. բուսականության փորձարկումներում նույն տարբերակների անոթները ծառայում են որպես կրկնություններ, և մի տարբերակի ցանկացած անոթ կարելի է համեմատել մյուսի ցանկացած անոթի հետ:

Վիճակագրական վարկած- որոշ ենթադրություն պատահական փոփոխականի բաշխման օրենքի կամ տվյալ ընտրանքի շրջանակներում այս օրենքի պարամետրերի վերաբերյալ:

Վիճակագրական վարկածի օրինակ՝ «ընդհանուր բնակչությունը բաշխված է նորմալ օրենքի համաձայն», «երկու նմուշների շեղումների տարբերությունը աննշան է» և այլն։

Վերլուծական հաշվարկներում հաճախ անհրաժեշտ է լինում վարկածներ առաջ քաշել և փորձարկել։ Վիճակագրական վարկածը փորձարկվում է՝ օգտագործելով վիճակագրական չափանիշ՝ համաձայն հետևյալ ալգորիթմի.

Հիպոթեզը ձևակերպված է արժեքների տարբերության առումով։ Օրինակ, կա պատահական արժեք x և հաստատուն a. Նրանք հավասար չեն (թվաբանորեն), բայց մենք պետք է պարզենք, թե արդյոք նրանց միջև տարբերությունը վիճակագրորեն նշանակալի է:

Կան երկու տեսակի չափանիշներ.

Հարկ է նշել, որ ≥, ≤, = նշաններն այստեղ օգտագործվում են ոչ թե թվաբանական, այլ «վիճակագրական» իմաստով։ Դրանք պետք է կարդալ «զգալիորեն ավելի», «զգալիորեն ավելի քիչ», «տարբերությունն աննշան է»:

Ուսանողի t-test մեթոդը

Երկու անկախ նմուշների միջինները համեմատելիս մենք օգտագործում ենք մեթոդ ըստ t - Ուսանողի չափանիշառաջարկել է անգլիացի գիտնական Ֆ.Գոսեթը։ Օգտագործելով այս մեթոդը, գնահատվում է միջինների տարբերության նշանակությունը (d \u003d x 1 - x 2): Այն հիմնված է փաստացի և աղյուսակային արժեքների հաշվարկի և դրանց համեմատության վրա:

Վիճակագրության տեսության մեջ նույն թվով դիտարկումներով (n 1 + n 2) անկախ նմուշների տարբերության սխալը կամ թվաբանական միջոցների գումարը որոշվում է բանաձևով.

S d = √ S X1 2 + S X2 2,

որտեղ S d-ը տարբերության կամ գումարի սխալն է.

S X1 2 և S X2 2 - համեմատված թվաբանական միջոցների սխալներ:

Տարբերության և դրա սխալի հարաբերակցությունը ծառայում է որպես թվաբանական միջոցների միջև եղած տարբերությունների նշանակության կամ աննշանության մասին եզրակացության հավաստիության երաշխիք։ Այս հարաբերակցությունը կոչվում է տարբերության նշանակության չափանիշ.

t \u003d x 1 - x 2 / "√ S X1 2 + S X2 2 \u003d d / S d.

t չափանիշի տեսական արժեքը հայտնաբերվում է աղյուսակից՝ իմանալով ազատության աստիճանների քանակը Y = n 1 + n 2 - 2 և նշանակության ընդունված մակարդակը։

Եթե ​​t փաստը ≥ t տեսություն է, ապա միջոցների միջև էական տարբերությունների բացակայության մասին զրոյական վարկածը հերքվում է, և եթե տարբերությունները պատահական տատանումների սահմաններում են՝ ընդունված նշանակության մակարդակի համար, այն չի հերքվում:

ինտերվալների գնահատման մեթոդ

Ինտերվալների գնահատումբնութագրվում է երկու թվով` գնահատված պարամետրը ծածկող միջակայքի ծայրերը: Դա անելու համար անհրաժեշտ է որոշել միջին ընդհանուր բնակչության հնարավոր արժեքների վստահության միջակայքերը: Միևնույն ժամանակ, x-ը ընդհանուր միջինի կետային գնահատումն է, ապա ընդհանուր միջինի կետային գնահատումը կարելի է գրել հետևյալ կերպ. ազատության աստիճանների տրված քանակ և նշանակության ընդունված մակարդակ։

Վստահության միջակայքայն միջակայքն է, որը ծածկում է գնահատված պարամետրը տվյալ հավանականությամբ: Ինտերվալի կենտրոնը նմուշային կետի գնահատումն է: Սահմանները կամ վստահության սահմանները որոշվում են միջին գնահատման սխալով և հավանականության մակարդակով՝ x - t 0.5 *S X և x + t 0.5 *S X: Ուսանողի թեստի արժեքը տարբեր մակարդակների նշանակության և ազատության աստիճանների համար տրված են աղյուսակում:

Միջին հարակից շարքերի տարբերության գնահատում

Կոնյուգացված նմուշների համար միջոցների տարբերության գնահատումը հաշվարկվում է տարբերության մեթոդով: Էությունը կայանում է նրանում, որ միջին տարբերության նշանակությունը գնահատվում է փորձի տարբերակների զույգ համեմատությամբ։ S d-ը տարբերության մեթոդով գտնելու համար հաշվարկվում է d դիտումների զուգակցված զույգերի տարբերությունը, միջին տարբերության արժեքը (d = Σ d / n) և միջին տարբերության սխալը որոշվում են բանաձևով.

S d \u003d √ Σ (d - d) 2 / n (n - 1)

Նյութականության չափանիշը հաշվարկվում է բանաձևով՝ t = d / S d: Ազատության աստիճանների թիվը գտնում ենք Y= n-1 հավասարությամբ, որտեղ n-1-ը խոնարհված զույգերի թիվն է։

թեստի հարցեր

  1. Ի՞նչ է փոփոխական վիճակագրությունը (մաթեմատիկական, կենսաբանական վիճակագրություն, կենսաչափություն):
  2. Ինչ է կոչվում հավաքածու: Ագրեգատների տեսակները.
  3. Ի՞նչ է կոչվում փոփոխականություն, փոփոխականություն: Փոփոխականության տեսակները.
  4. Սահմանեք փոփոխական շարք:
  5. Որո՞նք են քանակական փոփոխականության վիճակագրական ցուցանիշները:
  6. Պատմե՛ք մեզ հատկանիշի փոփոխականության ցուցանիշների մասին։
  7. Ինչպե՞ս է հաշվարկվում շեղումը, դրա հատկությունները:
  8. Ի՞նչ տեսական բաշխումներ գիտեք:
  9. Ո՞րն է ստանդարտ շեղումը, դրա հատկությունները:
  10. Ի՞նչ գիտեք նորմալ բաշխման մասին:
  11. Անվանե՛ք որակական փոփոխականության ցուցանիշները և դրանց հաշվարկման բանաձևերը:
  12. Ի՞նչ է վստահության միջակայքը և վիճակագրական հուսալիությունը:
  13. Ի՞նչ է նշանակում ընտրանքի բացարձակ և հարաբերական սխալը, ինչպե՞ս հաշվարկել դրանք:
  14. Տատանումների գործակիցը և դրա հաշվարկը քանակական և որակական փոփոխականության համար:
  15. Անուն վիճակագրական մեթոդներվարկածների փորձարկում.
  16. Սահմանեք վիճակագրական վարկած:
  17. Որո՞նք են զրոյական և այլընտրանքային վարկածները:
  18. Ի՞նչ է վստահության միջակայքը:
  19. Որոնք են զուգակցված և անկախ նմուշները:
  20. Ինչպե՞ս է հաշվարկվում ընդհանուր բնակչության պարամետրերի միջակայքային գնահատականը:

Լաբորատորիա թիվ 9

Վիճակագրական տվյալների վերլուծություն

Նպատակը: սովորել, թե ինչպես մշակել վիճակագրական տվյալները աղյուսակներում՝ օգտագործելով ներկառուցված գործառույթները. ուսումնասիրել MS Excel 2010-ի վերլուծական փաթեթի և դրա որոշ գործիքների հնարավորությունները՝ Պատահական թվերի ստեղծում, հիստոգրամ, նկարագրական վիճակագրություն:

Տեսական մաս

Շատ հաճախ, մեծ թվով օբյեկտների կամ երևույթների հետազոտման արդյունքում ստացված տվյալների մշակման համար ( վիճակագրական տվյալներ), կիրառվում են մաթեմատիկական վիճակագրության մեթոդներ։

Ժամանակակից մաթեմատիկական վիճակագրությունը բաժանված է երկու լայն ոլորտների. նկարագրականև վերլուծական վիճակագրություն. Նկարագրական վիճակագրությունն ընդգրկում է վիճակագրական տվյալների նկարագրության, դրանք աղյուսակների, բաշխումների և այլնի տեսքով ներկայացնելու մեթոդներ:

Վերլուծական վիճակագրությունը կոչվում է նաև վիճակագրական եզրակացության տեսություն։ Դրա առարկան փորձի ընթացքում ստացված տվյալների մշակումն է և եզրակացությունների ձևակերպումը, որոնք կիրառական նշանակություն ունեն մարդու գործունեության տարբեր ոլորտների համար։

Հարցման արդյունքում ստացված թվերի բազմությունը կոչվում է վիճակագրական ագրեգատ.

նմուշառման հավաքածու(կամ նմուշառում) պատահականորեն ընտրված օբյեկտների մի շարք է: Ընդհանուր բնակչությունայն առարկաների ամբողջությունն է, որոնցից պատրաստված է նմուշը: Ծավալըհավաքածու (ընդհանուր կամ նմուշ) այս հավաքածուի օբյեկտների քանակն է:

Վիճակագրական մշակման համար օբյեկտների ուսումնասիրության արդյունքները ներկայացված են թվերի տեսքով x 1 ,x 2 ,…, x k. Եթե ​​արժեքը x 1 դիտարկված n 1 անգամ, արժեք x 2 դիտարկված n 2 անգամ և այլն, ապա դիտարկված արժեքները x iկանչեց տարբերակները, և դրանց կրկնությունների քանակը n iկանչեց հաճախականություններ. Հաճախականությունների հաշվման կարգը կոչվում է տվյալների խմբավորում:

Նմուշի չափը n հավասար է գումարինբոլոր հաճախականությունները n i:

Հարաբերական հաճախականությունարժեքներ x iկոչվում է այս արժեքի հաճախականության հարաբերակցություն n iնմուշի չափին n:

Վիճակագրական հաճախականության բաշխում(կամ պարզապես հաճախականության բաշխում) կոչվում է տարբերակների ցանկ և դրանց համապատասխան հաճախականություններ՝ գրված աղյուսակի տեսքով.



Հաճախականության հարաբերական բաշխումկոչվում է ընտրանքների ցանկ և դրանց համապատասխան հարաբերական հաճախականություններ:


Հիմնական վիճակագրական բնութագրեր.

Ժամանակակից աղյուսակներն ունեն վիճակագրական տվյալների վերլուծության գործիքների հսկայական փաթեթ: Ամենից հաճախ օգտագործվող վիճակագրական գործառույթները ներկառուցված են ծրագրի հիմնական առանցքում, այսինքն՝ այդ գործառույթները հասանելի են ծրագրի գործարկման պահից: Այլ ավելի մասնագիտացված գործառույթներ ներառված են լրացուցիչ առօրյայում: Մասնավորապես, Excel-ում նման ռեժիմը կոչվում է Analysis ToolPak: Անալիզի փաթեթի հրամաններն ու գործառույթները կոչվում են վերլուծության գործիքներ: Մենք կսահմանափակվենք մի քանի հիմնական ներկառուցված վիճակագրական գործառույթներով և վերլուծության ամենաօգտակար գործիքներով Excel աղյուսակի վերլուծական փաթեթից:

Նկատի ունեմ.

AVERAGE ֆունկցիան հաշվարկում է ընտրանքային (կամ ընդհանուր) միջինը, այսինքն՝ ընտրանքի (կամ ընդհանուր) բնակչության հատկանիշի միջին թվաբանականը։ AVERAGE ֆունկցիայի փաստարկը թվերի հավաքածու է, որը սովորաբար նշվում է որպես բջիջների տիրույթ, օրինակ՝ =AVERAGE(A3:A201):

ԴԱՍԱԽՈՍՈՒԹՅՈՒՆ 2

Մաթեմատիկական վիճակագրության հիմնական հասկացությունները.Ընտրովի մեթոդ. Թվային բնութագրերվիճակագրական շարք Կետային վիճակագրական գնահատականներ և դրանց համար պահանջներ: Վստահության միջակայքերի մեթոդ. Վիճակագրական վարկածների փորձարկում.

Գլուխ 3
ՄԱԹԵՄԱՏԻԿԱԿԱՆ ՎԻՃԱԿԱԳՐՈՒԹՅԱՆ ՀԻՄՆԱԿԱՆ ՀԱՍԿԱՑՈՒԹՅՈՒՆՆԵՐԸ

Նմուշառման մեթոդ

Այս գլուխը ապահովում է կարճ ակնարկմաթեմատիկական վիճակագրության հիմնական հասկացությունները և արդյունքները, որոնք օգտագործվում են էկոնոմետրիկայի ընթացքում:

Մաթեմատիկական վիճակագրության կենտրոնական խնդիրներից մեկը վիճակագրական տվյալների օրինաչափությունների հայտնաբերումն է, որոնց հիման վրա կարելի է կառուցել համապատասխան մոդելներ և կայացնել տեղեկացված որոշումներ: Առաջին առաջադրանքըմաթեմատիկական վիճակագրությունը դիտարկումների կամ հատուկ մշակված փորձերի արդյունքում ստացված վիճակագրական տեղեկատվության հավաքագրման և խմբավորման մեթոդների մշակումն է: Երկրորդ առաջադրանքմաթեմատիկական վիճակագրությունը վիճակագրական տվյալների մշակման և վերլուծության մեթոդների մշակումն է՝ կախված ուսումնասիրության նպատակներից: Նման վերլուծության տարրերն են, մասնավորապես՝ հայտնի բաշխման ֆունկցիայի պարամետրերի գնահատումը, բաշխման տեսակի վերաբերյալ վիճակագրական վարկածների փորձարկումը և այլն։

Մաթեմատիկական վիճակագրության և հավանականությունների տեսության միջև սերտ կապ կա: Հավանականությունների տեսությունը լայնորեն կիրառվում է զանգվածային երևույթների վիճակագրական ուսումնասիրության մեջ, որոնք կարող են դասակարգվել կամ չդասակարգվել որպես պատահական։ Դա արվում է նմուշառման մեթոդի տեսության միջոցով: Այստեղ հավանականական օրենքները ենթակա են ոչ թե ուսումնասիրվող երեւույթներին, այլ դրանց ուսումնասիրության մեթոդներին։ Բացի այդ, հավանականության տեսությունը կարևոր դեր է խաղում հավանականության երևույթների վիճակագրական ուսումնասիրության մեջ։ Այս դեպքերում ուսումնասիրվող երևույթներն իրենք են ենթարկվում լավ սահմանված հավանականական օրենքներին։

Մաթեմատիկական վիճակագրության հիմնական խնդիրը զանգվածային երևույթների և պրոցեսների վերաբերյալ դիտողական կամ փորձարարական տվյալներից գիտականորեն հիմնավորված եզրակացություններ ստանալու մեթոդների մշակումն է։ Օրինակ, դուք պետք է կատարեք արտադրված մասերի խմբաքանակի որակի հսկողություն կամ ուսումնասիրեք տեխնոլոգիական գործընթացի որակը: Դուք, իհարկե, կարող եք անցկացնել ամբողջական հարցում, այսինքն. ստուգեք երեկույթի բոլոր մանրամասները. Այնուամենայնիվ, եթե շատ մանրամասներ կան, ապա ֆիզիկապես անհնար է ամբողջական հետազոտություն անցկացնել, իսկ եթե օբյեկտի հետազոտությունը կապված է դրա ոչնչացման հետ կամ թանկ է, ապա անիմաստ է շարունակական հետազոտություն անցկացնել: Հետևաբար, հետազոտության համար անհրաժեշտ է ընտրել օբյեկտների ամբողջ հավաքածուի միայն մի մասը, այսինքն. անցկացնել ընտրանքային հետազոտություն. Այսպիսով, գործնականում հաճախ անհրաժեշտ է լինում պատահականորեն ընտրված փոքր թվով տարրերից գնահատել մեծ բնակչության պարամետրերը:



Ուսումնասիրվող առարկաների ամբողջությունը կոչվում է ընդհանուր բնակչությունը. Օբյեկտների այն մասը, որն ընտրվել է ընդհանուր բնակչությունից, կոչվում է ընտրանքային բնակչությունկամ ավելի հակիրճ - նմուշառում. Մենք համաձայն ենք նմուշի չափը նշել տառով n, իսկ ընդհանուր բնակչության ծավալը տառով Ն.

Ընտրանքը, ընդհանուր դեպքում, ձևավորվում է ընդհանուր բնակչության ցանկացած առանձնահատկություն գնահատելու համար: Այնուամենայնիվ, ոչ բոլոր նմուշները կարող են իրական պատկերացում տալ ընդհանուր բնակչության մասին: Օրինակ, մասերը սովորաբար պատրաստվում են տարբեր հմտությունների մակարդակի աշխատողների կողմից: Եթե ​​հսկողության մեջ ներառվեն միայն ավելի ցածր որակավորում ունեցող աշխատողների պատրաստած մասերը, ապա բոլոր ապրանքների որակի գաղափարը «կթերագնահատվի», եթե աշխատողների կողմից ավելի քան բարձր որակավորում ունեցող, ապա այս ներկայացվածությունը կգերագնահատվի։

Որպեսզի օգտագործենք ընտրանքի տվյալները, որպեսզի կարողանանք վստահորեն դատել մեզ հետաքրքրող ընդհանուր բնակչության առանձնահատկությունը, անհրաժեշտ է, որ ընտրանքի առարկաները ճիշտ ներկայացնեն այն: Այլ կերպ ասած, ընտրանքը պետք է ճիշտ ներկայացնի բնակչության համամասնությունները. Այս պահանջն ամփոփված է հետևյալ կերպ. նմուշը պետք է լինի ներկայացուցիչ(կամ ներկայացուցիչ) .

Ընտրանքի ներկայացուցչականությունն ապահովվում է պատահական ընտրությամբ. Պատահական ընտրությամբ Բնակչության բոլոր տարրերն ունեն ընտրանքում ընդգրկվելու նույն հնարավորությունը:. Այս դեպքում ներս Մեծ թվերի օրենքի ուժը, կարելի է պնդել, որ նմուշը ներկայացուցչական է լինելու։ Օրինակ, հացահատիկի որակը գնահատվում է նրա փոքր նմուշով: Թեև պատահականորեն ընտրված հատիկների թիվը փոքր է հատիկի ամբողջ զանգվածի համեմատ, բայց ինքնին բավականին մեծ է։ Հետևաբար, ընտրանքային պոպուլյացիայի բնութագրիչները, հավանականության առումով, քիչ են տարբերվելու ընդհանուր բնակչության բնութագրերից:

Տարբերել կրկնեցև չկրկնվող նմուշներ. Առաջին դեպքում ընտրված օբյեկտը վերադարձվում է ընդհանուր բնակչությանը մինչև հաջորդի ընտրությունը: Երկրորդ դեպքում, նմուշում ընտրված օբյեկտը չի վերադարձվում ընդհանուր բնակչությանը: Եթե ​​ընտրանքի չափը զգալիորեն փոքր է ընդհանուր բնակչության չափից, ապա երկու նմուշներն էլ գործնականում համարժեք կլինեն:

Շատ դեպքերում վերլուծության համար որոշակի տնտեսական գործընթացներԿարևոր է վիճակագրության ստացման հերթականությունը: Բայց այսպես կոչված տարածական տվյալներ դիտարկելիս դրանց ստացման հերթականությունը էական դեր չի խաղում։ Բացի այդ, նմուշառված արժեքների արդյունքները x 1 , x 2 , …, x nքանակական հատկանիշ XԸնդհանուր բնակչության թվաքանակը, որը գրանցվում է իրենց գրանցման հերթականությամբ, սովորաբար դժվար է տեսնել և անհարմար հետագա վերլուծության համար: Վիճակագրական տվյալների նկարագրության խնդիրն է ստանալ այնպիսի ներկայացում, որը թույլ կտա տեսողականորեն բացահայտել հավանականական բնութագրերը: Դրա համար դիմեք տարբեր ձևերտվյալների պատվիրում և խմբավորում:

Դիտարկումների (չափումների) արդյունքում ստացված վիճակագրական նյութը կարելի է գրել երկու տողից բաղկացած աղյուսակի տեսքով։ Առաջին տողը պարունակում է չափման համարը, երկրորդը `ստացված արժեքը: Նման աղյուսակը կոչվում է պարզ վիճակագրական շարք:

ես n
x 1 x 2 x i x n

Այնուամենայնիվ, մեծ թվով չափումների դեպքում վիճակագրական շարքը դժվար է վերլուծել: Ուստի դիտարկումների արդյունքներն ինչ-որ կերպ անհրաժեշտ են ուղղել. Դա անելու համար դիտարկվող արժեքները դասավորված են աճման կարգով.

որտեղ . Նման վիճակագրությունը կոչվում է դասվել է.

Քանի որ վիճակագրական շարքի որոշ արժեքներ կարող են ունենալ նույն արժեքները, դրանք կարող են համակցվել: Այնուհետև յուրաքանչյուր արժեք x iթիվը կհամապատասխանի n i, հավասար է տվյալ արժեքի առաջացման հաճախականությանը.

x 1 x 2 x k
n 1 n 2 նկ

Նման շարքը կոչվում է խմբավորված.

Դասակարգված և խմբավորված շարքը կոչվում է փոփոխական. Դիտարկված արժեքներ x iկանչեց տարբերակները, և բոլոր դիտարկումների տարբերակների քանակը n iհաճախականությունը. Բոլոր դիտարկումների քանակը nկանչեց ծավալըտատանումների շարք. Հաճախականության հարաբերակցությունը n iշարքի ծավալին nկանչեց հարաբերական հաճախականություն:

Բացի դիսկրետ տատանումների շարքից, կիրառեք և ընդմիջումտատանումների գծեր. Նման շարք կառուցելու համար անհրաժեշտ է որոշել ինտերվալների չափը և, դրանց համապատասխան, խմբավորել դիտարկումների արդյունքները.

[x 1 ,x 2 ] (x 2 ,x 3 ] (x 3 ,x 4 ] (x k-1, x k]
n 1 n 2 n 3 նկ

Ինտերվալային տատանումների շարքը սովորաբար կառուցվում է այն դեպքերում, երբ դիտարկվող տարբերակների թիվը շատ մեծ է: Այս իրավիճակը սովորաբար առաջանում է դիտարկելիս շարունակական արժեք(օրինակ, որոշ չափումներ ֆիզիկական քանակություն) Կա որոշակի հարաբերություն ինտերվալային և դիսկրետ տատանումների շարքերի միջև. ցանկացած դիսկրետ շարք կարող է գրվել որպես ինտերվալային շարք և հակառակը:

Դիսկրետ տատանումների շարքի գրաֆիկական նկարագրության համար ես օգտագործում եմ բազմանկյուն. մեջ պոլիգոն կառուցելու համար ուղղանկյուն համակարգկոորդինացնում է գծագրության կետերը կոորդինատներով ( x i,n i) կամ ( x i,w i) Այնուհետեւ այս կետերը միացված են հատվածներով: Ստացված կոտրված գիծը կոչվում է բազմանկյուն (տե՛ս, օրինակ, նկ. 3.1ա):

Ինտերվալների տատանումների շարքի գրաֆիկական նկարագրության համար օգտագործեք հիստոգրամ. Այն կառուցելու համար աբսցիսայի առանցքի երկայնքով գծագրվում են հատվածներ, որոնք ներկայացնում են տատանումների միջակայքերը, և այդ հատվածների վրա, ինչպես հիմքի վրա, ուղղանկյուններ են կառուցվում համապատասխան ինտերվալի հաճախականություններին կամ հարաբերական հաճախականություններին հավասար բարձրություններով: Ստացվում է ուղղանկյուններից կազմված պատկեր, որը կոչվում է հիստոգրամ (տե՛ս, օրինակ, նկ. 3.1բ):

ա բ
Բրինձ. 3.1

Վիճակագրական շարքի թվային բնութագրերը

Վարիացիոն շարքի կառուցումը միայն առաջին քայլն է մի շարք դիտարկումների ընկալման համար: Սա բավարար չէ ամբողջական ուսումնասիրությունուսումնասիրվող երևույթի բաշխումը. ամենահարմար և ամբողջական մեթոդէ վերլուծական եղանակհետազոտությունների շարք, որը բաղկացած է թվային բնութագրերի հաշվարկից։ Վարիացիոն շարքերն ուսումնասիրելու համար օգտագործվող թվային բնութագրերը նման են հավանականությունների տեսության մեջ օգտագործվողներին:

Վարիացիոն շարքի ամենաբնական բնութագիրը հայեցակարգն է Միջին չափ. Վիճակագրության մեջ օգտագործվում են միջինների մի քանի տեսակներ՝ միջին թվաբանական, երկրաչափական միջին, ներդաշնակ միջին և այլն։ Ամենատարածվածը հայեցակարգն է։ թվաբանական միջին:

Եթե ​​վարիացիոն շարքը կառուցվում է դիտողական տվյալների հիման վրա, ապա օգտագործվում է հայեցակարգը կշռված միջին արժեքը:

. (3.3)

Թվաբանական միջինն ունի նույն հատկությունները, ինչ մաթեմատիկական ակնկալիքը:

Քանակը

, (3.4)

որը, ինչպես հավանականության տեսության մեջ, կոչվում է ցրվածություն. Արժեք

կանչեց ստանդարտ շեղում(կամ ստանդարտ շեղում) Վիճակագրական շեղումն ունի նույն հատկությունները, ինչ հավանականության շեղումը, և այն հաշվարկելու համար կարող է օգտագործվել այլընտրանքային բանաձև

. (3.6)

Օրինակ 3.1. 199X-ի տվյալները բերված են մարզի տարածքների համար (Աղյուսակ 3.1):

Աղյուսակ 3.1

Գտե՛ք միջին թվաբանականը և ստանդարտ շեղումը: Կազմեք հաճախականությունների հիստոգրամ:

Լուծում.Միջին թվաբանականը և դիսպերսիան հաշվարկելու համար մենք կառուցում ենք հաշվարկային աղյուսակ (Աղյուսակ 3.4).

Աղյուսակ 3.4

x i n i n i x i n i x i 2
Գումար

Այստեղ փոխարեն x iվերցված են համապատասխան ինտերվալների միջնակետերը: Աղյուսակի համաձայն մենք գտնում ենք.

, ,

Կառուցենք հաճախականությունների հիստոգրամ՝ ըստ նախնական տվյալների (նկ. 3.3): ա

Հաշվի առնելով շարքի հիմնական վիճակագրական բնութագրերը, գնահատեք ընտրանքի կենտրոնական միտումը և շեղումը կամ տատանումները . Նմուշի կենտրոնական միտումըթույլ է տալիս գնահատել այնպիսի վիճակագրական բնութագրեր, ինչպիսիք են թվաբանական միջինը, եղանակը, միջինը: Միջին արժեքը բնութագրում է խմբի հատկությունները, բաշխման կենտրոնն է, զբաղեցնում է կենտրոնական դիրքհատկանիշի տարբեր արժեքների ընդհանուր զանգվածում:

Թվաբանական միջինՉափումների անկանոն շարքի համար հաշվարկվում է բոլոր չափումները գումարելով և գումարը բաժանելով չափումների քանակի վրա՝ ըստ բանաձևի. = ,

որտեղ է բոլոր արժեքների գումարը x i, n ընդհանուր թիվըչափումներ։

Նորաձևություն(Mo) վերաբերում է ընտրանքի կամ պոպուլյացիայի արդյունքին, որն առավել հաճախ հանդիպում է այդ ընտրանքում: Ինտերվալների տատանումների շարքի համար մոդալ ինտերվալն ընտրվում է ըստ ամենաբարձր հաճախականության: Օրինակ՝ թվերի շարքում՝ 2, 3, 4, 4, 4, 5, 6, 6, 7, ռեժիմը 4 է, քանի որ այն ավելի հաճախ է հանդիպում, քան մյուս թվերը։

Այն դեպքում, երբ խմբի բոլոր արժեքները տեղի են ունենում հավասարապես հաճախ, ենթադրվում է, որ խումբը չունի ռեժիմ: Երբ երկու հարակից արժեքներ ունեն նույն հաճախականությունը և ավելի մեծ են, քան ցանկացած այլ արժեքի հաճախականությունը, ռեժիմը երկու արժեքների միջինն է: Օրինակ՝ թվերի շարքում՝ 2, 3, 4, 4, 5, 5, 6, 7, ռեժիմը 4.5 է։ Եթե ​​խմբի մեջ երկու ոչ հարակից արժեքներ ունեն հավասար հաճախականություններ և ավելի մեծ են, քան որևէ արժեքի հաճախականությունը, ապա կա երկու ռեժիմ: Օրինակ՝ թվերի շարքում՝ 2, 3, 3, 4, 5, 5, 6, 7, ռեժիմները 3 և 5 են։

Միջին(Ես) - չափման արդյունքը, որը գտնվում է դասակարգված շարքի մեջտեղում: Միջինը բաժանում է պատվիրված հավաքածուն կիսով չափ այնպես, որ արժեքների մի կեսը մեծ լինի միջինից, իսկ մյուս կեսը փոքր լինի: Եթե ​​թվերի շարքը պարունակում է կենտ թվով արժեքներ, ապա միջինը միջինն է: Օրինակ՝ թվերի շարքում՝ 6, 9, 11 , 19, 31 միջին թիվ 11.

Եթե ​​տվյալները պարունակում են չափումների զույգ քանակ, ապա մեդիանն այն թիվն է, որը երկու կենտրոնական արժեքների միջինն է: Օրինակ՝ թվերի շարքում՝ 6, 9, 11, 19, 31, 48, միջինը (11+19) է՝ 2 = 15։

Ռեժիմը և մեդիանը օգտագործվում են միջինը գնահատելու համար, երբ չափվում են պատվերի սանդղակներով (և ռեժիմը նաև անվանական սանդղակով):

Չափման արդյունքների տատանումների կամ տատանումների բնութագրերը ներառում են միջակայքը, ստանդարտ շեղումը, տատանումների գործակիցը և այլն:

Բոլոր միջին բնութագրերը տալիս են ընդհանուր բնութագրերըմի շարք չափումների արդյունքներ: Գործնականում մեզ հաճախ հետաքրքրում է, թե յուրաքանչյուր արդյունք որքանով է շեղվում միջինից: Այնուամենայնիվ, հեշտ է պատկերացնել, որ չափման արդյունքների երկու խմբերն ունեն նույն միջին, բայց տարբեր չափման արժեքները: Օրինակ, 3, 6, 3 սերիաների համար - միջին արժեքը = 4, 5, 2, 5 սերիայի համար նաև միջին արժեքը = 4, չնայած այս շարքերի միջև զգալի տարբերությանը:



Հետևաբար, միջին բնութագրերը միշտ պետք է լրացվեն տատանումների կամ փոփոխականության ցուցիչներով: Տատանումների ամենապարզ բնութագիրը տատանումների միջակայքն է, որը սահմանվում է որպես ամենամեծ և ամենափոքր չափումների տարբերությունը: Այնուամենայնիվ, այն գրավում է միայն ծայրահեղ շեղումները, բայց չի արտացոլում բոլոր արդյունքների շեղումները:

Ընդհանրացված բնութագիր տալու համար կարող եք հաշվարկել շեղումները միջին արդյունքից։ Ստանդարտ շեղումհաշվարկվում է բանաձևով.

որտեղ X-ը ամենաբարձր ցուցանիշն է. X - ամենափոքր ցուցանիշը; K - աղյուսակային գործակից (Հավելված 4):

Ստանդարտ շեղումը (նաև կոչվում է ստանդարտ շեղում) ունի նույն միավորները, ինչ չափման արդյունքները: Այնուամենայնիվ, այս հատկանիշը հարմար չէ երկու կամ ավելի պոպուլյացիաների տատանումները տարբեր չափման միավորներով համեմատելու համար: Դրա համար օգտագործվում է տատանումների գործակիցը:

Տատանումների գործակիցըսահմանվում է որպես ստանդարտ շեղման հարաբերակցություն միջին թվաբանականին` արտահայտված որպես տոկոս: Այն հաշվարկվում է բանաձևով՝ V = . 100%

Չափման արդյունքների տատանումները կախված տատանումների գործակիցի արժեքից համարվում են փոքր (0–10%), միջին (11–20%) և մեծ (>20%)։

Տատանումների գործակիցը կարևոր է, քանի որ լինելով հարաբերական արժեք (չափվում է որպես տոկոս), այն թույլ է տալիս համեմատել չափման արդյունքների փոփոխականությունը տարբեր չափման միավորների հետ: Տատանումների գործակիցը կարող է օգտագործվել միայն այն դեպքում, եթե չափումները կատարվում են հարաբերակցության սանդղակով:



Ցրվածության մեկ այլ ցուցանիշ է միջին թվաբանականի ստանդարտ (արմատի միջին քառակուսի) սխալ. Այս ցուցանիշը (սովորաբար այն նշվում է m կամ S նշաններով) բնութագրում է միջինի տատանումը։

Միջին թվաբանական սխալը հաշվարկվում է բանաձևով.

որտեղ σ-ն չափման արդյունքների ստանդարտ շեղումն է, n-ը նմուշի չափն է: