Pearson-ի հարաբերակցության թեստը պարամետրային վիճակագրության մեթոդ է, որը թույլ է տալիս որոշել երկու քանակական ցուցանիշների միջև գծային կապի առկայությունը կամ բացակայությունը, ինչպես նաև գնահատել դրա սերտությունը և վիճակագրական նշանակությունը: Այլ կերպ ասած, Pearson հարաբերակցության թեստը թույլ է տալիս որոշել, թե արդյոք կա գծային հարաբերություն երկու փոփոխականների արժեքների փոփոխությունների միջև: Վիճակագրական հաշվարկներում և եզրակացություններում հարաբերակցության գործակիցը սովորաբար նշվում է որպես rxyկամ Rxy.
1. Հարաբերակցության չափանիշի զարգացման պատմություն
Պիրսոնի հարաբերակցության թեստը մշակվել է բրիտանացի գիտնականների խմբի կողմից՝ գլխավորությամբ Կարլ Փիրսոն(1857-1936) 19-րդ դարի 90-ական թվականներին երկու պատահական փոփոխականների կովարիանսի վերլուծությունը պարզեցնելու համար։ Բացի Կարլ Փիրսոնից, աշխատել է նաև Պիրսոնի հարաբերակցության թեստի վրա Ֆրենսիս Էջվորթև Ռաֆայել Ուելդոն.
2. Ինչի՞ համար է օգտագործվում Պիրսոնի հարաբերակցության թեստը:
Պիրսոնի հարաբերակցության չափանիշը թույլ է տալիս որոշել, թե որն է քանակական մասշտաբով չափվող երկու ցուցանիշների հարաբերակցության սերտությունը (կամ ուժը): Լրացուցիչ հաշվարկների օգնությամբ դուք կարող եք նաև որոշել, թե որքանով է վիճակագրորեն նշանակալի բացահայտված հարաբերությունը:
Օրինակ, օգտագործելով Pearson հարաբերակցության չափանիշը, կարելի է պատասխանել այն հարցին, թե արդյոք սուր շնչառական վարակների դեպքում կա մարմնի ջերմաստիճանի և արյան մեջ լեյկոցիտների պարունակության, հիվանդի հասակի և քաշի, պարունակության միջև կապ: խմելու ջուրֆտորիդը և կարիեսի դեպքերը բնակչության շրջանում:
3. Պիրսոնի chi-square թեստի օգտագործման պայմաններն ու սահմանափակումները
- Համադրելի ցուցանիշները պետք է չափվեն քանակական սանդղակ(օրինակ, սրտի հաճախությունը, մարմնի ջերմաստիճանը, լեյկոցիտների քանակը 1 մլ արյան վրա, սիստոլիկ արյան ճնշում):
- Պիրսոնի հարաբերակցության չափանիշի միջոցով հնարավոր է որոշել միայն գծային հարաբերությունների առկայությունը և ուժըքանակների միջև։ Հարաբերությունների այլ բնութագրերը, ներառյալ ուղղությունը (ուղիղ կամ հակադարձ), փոփոխությունների բնույթը (ուղղագիծ կամ կորագիծ), ինչպես նաև մեկ փոփոխականի կախվածությունը մյուսից, որոշվում են ռեգրեսիոն վերլուծության միջոցով:
- Համեմատվող արժեքների թիվը պետք է հավասար լինի երկուսի: Երեք և ավելի պարամետրերի փոխհարաբերությունները վերլուծելու դեպքում դուք պետք է օգտագործեք մեթոդը գործոնային վերլուծություն.
- Պիրսոնի հարաբերակցության չափանիշն է պարամետրային, որի կապակցությամբ դրա կիրառման պայմանն է նորմալ բաշխումհամընկնող փոփոխականներ. Եթե անհրաժեշտ է կատարել այն ցուցանիշների հարաբերակցության վերլուծություն, որոնց բաշխումը տարբերվում է նորմալից, ներառյալ սովորական սանդղակով չափվածները, պետք է օգտագործվի Սփիրմանի աստիճանի հարաբերակցության գործակիցը:
- Անհրաժեշտ է հստակ տարբերակել կախվածություն և հարաբերակցություն հասկացությունները: Արժեքների կախվածությունը որոշում է դրանց միջև հարաբերակցության առկայությունը, բայց ոչ հակառակը:
Օրինակ՝ երեխայի աճը կախված է նրա տարիքից, այսինքն՝ ինչից մեծ երեխա, այնքան բարձր է: Եթե վերցնենք տարբեր տարիքի երկու երեխա, ապա մեծ հավանականության դեպքում մեծ երեխայի աճն ավելի մեծ կլինի, քան փոքրինը։ Այս երեւույթը կոչվում է կախվածություն, ենթադրելով պատճառահետևանքային կապ ցուցանիշների միջև։ Իհարկե, կան նաև հարաբերակցությունը, այսինքն՝ մեկ ցուցանիշի փոփոխություններն ուղեկցվում են մեկ այլ ցուցանիշի փոփոխություններով։
Մեկ այլ իրավիճակում հաշվի առեք երեխայի աճի և սրտի զարկերի փոխհարաբերությունները (HR): Ինչպես գիտեք, այս երկու արժեքներն էլ ուղղակիորեն կախված են տարիքից, հետևաբար, շատ դեպքերում ավելի մեծ հասակի (և հետևաբար ավելի մեծ տարիքի) երեխաները կունենան սրտի զարկերի ավելի ցածր արժեքներ: Այն է, հարաբերակցությունըկդիտարկվի և կարող է ունենալ բավականաչափ բարձր ձգություն: Այնուամենայնիվ, եթե մենք վերցնենք երեխաներին նույն տարիքը, բայց տարբեր բարձրություն, ապա, ամենայն հավանականությամբ, նրանց սրտի բաբախյունը աննշանորեն կտարբերվի, ինչի կապակցությամբ կարելի է եզրակացնել, որ. անկախությունՍրտի հաճախությունը աճից:
Վերոնշյալ օրինակը ցույց է տալիս, թե որքան կարևոր է տարբերակել վիճակագրության մեջ հիմնարար հասկացությունները կապերև կախվածություններցուցանիշներ՝ ճիշտ եզրակացություններ անելու համար։
4. Ինչպե՞ս հաշվարկել Պիրսոնի հարաբերակցության գործակիցը:
Պիրսոնի հարաբերակցության գործակիցը հաշվարկվում է հետևյալ բանաձևով.
5. Ինչպե՞ս մեկնաբանել Պիրսոնի հարաբերակցության գործակցի արժեքը:
Պիրսոնի հարաբերակցության գործակիցի արժեքները մեկնաբանվում են դրա բացարձակ արժեքների հիման վրա: Հարաբերակցության գործակիցի հնարավոր արժեքները տատանվում են 0-ից ±1: Որքան մեծ է r xy-ի բացարձակ արժեքը, այնքան բարձր է երկու մեծությունների միջև հարաբերությունների սերտությունը: r xy = 0 ցույց է տալիս կապի ամբողջական բացակայությունը: r xy = 1 - ցույց է տալիս բացարձակ (ֆունկցիոնալ) կապի առկայությունը: Եթե Պիրսոնի հարաբերակցության չափանիշի արժեքը 1-ից մեծ է կամ -1-ից պակաս, ապա հաշվարկներում սխալ է թույլ տրվել։
Հարաբերակցության սերտությունը կամ ուժը գնահատելու համար օգտագործվում են ընդհանուր ընդունված չափանիշներ, որոնց համաձայն r xy-ի բացարձակ արժեքները.< 0.3 свидетельствуют о թույլկապ, r xy արժեքները 0,3-ից 0,7 - միացման մասին միջինխստություն, r xy արժեքներ > 0,7 - o ուժեղկապեր.
Հարաբերակցության ուժի ավելի ճշգրիտ գնահատում կարելի է ստանալ օգտագործելով Chaddock սեղան:
Դասարան վիճակագրական նշանակությունհարաբերակցության գործակիցը r xy իրականացվում է t-թեստի միջոցով, որը հաշվարկվում է հետևյալ բանաձևով.
Ստացված t r արժեքը համեմատվում է նշանակության որոշակի մակարդակի կրիտիկական արժեքի և n-2 ազատության աստիճանների քանակի հետ։ Եթե t r-ը գերազանցում է t crit-ը, ապա եզրակացություն է արվում բացահայտված հարաբերակցության վիճակագրական նշանակության մասին:
6. Պիրսոնի հարաբերակցության գործակիցը հաշվարկելու օրինակ
Հետազոտության նպատակն էր բացահայտել, որոշել երկու քանակական ցուցանիշների՝ արյան մեջ տեստոստերոնի մակարդակի (X) և մարմնում մկանային զանգվածի տոկոսի (Y) հարաբերակցության խստությունը և վիճակագրական նշանակությունը: 5 առարկաներից կազմված ընտրանքի սկզբնական տվյալները (n = 5) ամփոփված են աղյուսակում:
Հարաբերակցությամբմի հատկանիշի նույն արժեքը համապատասխանում է մյուսի տարբեր արժեքներին: Օրինակ՝ կա հարաբերակցություն հասակի և քաշի, չարորակ նորագոյացությունների դեպքերի և տարիքի միջև և այլն։
Գոյություն ունի հարաբերակցության գործակիցը հաշվարկելու 2 եղանակ՝ քառակուսիների մեթոդ (Pearson), աստիճանների մեթոդ (Spearman)։
Առավել ճշգրիտ է քառակուսիների մեթոդը (Pearson), որտեղ հարաբերակցության գործակիցը որոշվում է բանաձևով.
r xy-ը X և Y վիճակագրական շարքերի հարաբերակցության գործակիցն է:
d x-ը թվերից յուրաքանչյուրի շեղումն է վիճակագրական շարք X իր թվաբանական միջինից:
d y-ը վիճակագրական Y շարքի թվերից յուրաքանչյուրի շեղումն է նրա միջին թվաբանականից:
Կախված կապի ուժից և դրա ուղղությունից, հարաբերակցության գործակիցը կարող է տատանվել 0-ից մինչև 1 (-1): 0 հարաբերակցության գործակիցը ցույց է տալիս կապի ամբողջական բացակայությունը: Որքան հարաբերակցության գործակիցի մակարդակը մոտ է 1-ին կամ (-1-ին), այնքան մեծ է, համապատասխանաբար, այնքան մոտ է դրանով չափվող ուղիղը կամ հետադարձ կապը: 1 կամ (-1) հավասար հարաբերակցության գործակցով կապը ամբողջական է, ֆունկցիոնալ։
Հարաբերակցության ուժի գնահատման սխեման հարաբերակցության գործակցով
Կապի ուժը |
Հարաբերակցության գործակիցի արժեքը, եթե առկա է |
|
ուղիղ միացում (+) |
հետադարձ կապ (-) |
|
Կապ չկա | ||
Հաղորդակցությունը փոքր է (թույլ) |
0-ից մինչև +0,29 |
0-ից -0,29 |
Հաղորդակցման միջին մակարդակ (չափավոր) |
+0,3-ից +0,69 |
-0,3-ից -0,69 |
Հաղորդակցություն մեծ (ուժեղ) |
+0,7-ից +0,99 |
-0,7-ից -0,99 |
Հաղորդակցությունն ավարտված է (ֆունկցիոնալ) |
Քառակուսիների մեթոդով հարաբերակցության գործակիցը հաշվարկելու համար կազմվում է 7 սյունակներից բաղկացած աղյուսակ։ Եկեք վերլուծենք հաշվարկման գործընթացը՝ օգտագործելով օրինակ.
ՈՐՈՇԵՔ ՄԻՋԵՎ ՀԱՐԱԲԵՐՈՒԹՅՈՒՆՆԵՐԻ ՈՒԺԵՂԸ ԵՎ ԲՆՈՒՅԹԸ.
Ժամանակն է- էս goiter (Վ y ) |
դ x= Վ x –Մ x |
դ y= Վ y –Մ y |
դ x դ y |
դ x 2 |
դ y 2 |
|
Σ -1345 ,0 |
Σ 13996 ,0 |
Σ 313 , 47 |
1. Որոշեք ջրի մեջ յոդի միջին պարունակությունը (մգ/լ):
մգ/լ
2. Որոշեք խոպոպի միջին հաճախականությունը տոկոսով:
3. Որոշեք յուրաքանչյուր V x-ի շեղումը M x-ից, այսինքն. դ x.
201–138=63; 178–138=40 և այլն։
4. Նմանապես, մենք որոշում ենք յուրաքանչյուր V y-ի շեղումը M y-ից, այսինքն. դ
0,2–3,8=-3,6; 0,6–38=-3,2 և այլն:
5. Մենք որոշում ենք շեղումների արտադրանքները. Ստացված արդյունքն ամփոփվում և ստացվում է։
6. Քառակուսի ենք դնում d x և ամփոփում ենք արդյունքները, ստանում ենք.
7. Նմանապես, մենք քառակուսի ենք d y, ամփոփում ենք արդյունքները, ստանում ենք
8. Վերջապես, ստացված բոլոր գումարները փոխարինում ենք բանաձևով.
Հարաբերակցության գործակիցի հուսալիության հարցը լուծելու համար դրա միջին սխալը որոշվում է բանաձևով.
(Եթե դիտարկումների թիվը 30-ից պակաս է, ապա հայտարարը n-1 է):
Մեր օրինակում
Հարաբերակցության գործակցի արժեքը համարվում է հուսալի, եթե այն առնվազն 3 անգամ գերազանցում է իր միջին սխալը:
Մեր օրինակում
Այսպիսով, հարաբերակցության գործակիցը հուսալի չէ, ինչը ստիպում է ավելացնել դիտարկումների քանակը։
Հարաբերակցության գործակիցը կարող է որոշվել մի փոքր ավելի քիչ ճշգրիտ, բայց շատ ավելի հեշտ եղանակով, աստիճանի մեթոդով (Spearman):
Սփիրմանի մեթոդը՝ P=1-(6∑d 2 /n-(n 2-1))
կազմել զուգակցված համեմատվող հատկանիշների երկու շարք՝ համապատասխանաբար նշելով առաջին և երկրորդ տողերը՝ x և y: Միևնույն ժամանակ հատկանիշի առաջին տողը ներկայացրեք նվազման կամ աճման կարգով և տեղադրեք երկրորդ շարքի թվային արժեքները առաջին շարքի այն արժեքներին հակառակ, որոնց դրանք համապատասխանում են:
Համեմատված տողերից յուրաքանչյուրում հատկանիշի արժեքը պետք է փոխարինվի հերթական համարով (աստիճան): Շարքերը կամ թվերը ցույց են տալիս առաջին և երկրորդ շարքերի ցուցիչների (արժեքների) տեղերը: Միևնույն ժամանակ, շարքերը պետք է վերագրվեն երկրորդ հատկանիշի թվային արժեքներին նույն կարգով, որն ընդունվել է դրանց արժեքները առաջին հատկանիշի արժեքներին բաշխելիս: Շարքի հատկանիշի նույն արժեքներով, շարքերը պետք է որոշվեն որպես միջին թիվ այս արժեքների հերթական թվերի գումարից:
որոշել x-ի և y-ի (d) շարքերի տարբերությունը. d = x - y
քառակուսի է ստացված վարկանիշային տարբերությունը (d 2)
ստացեք տարբերության քառակուսիների գումարը (Σ d 2) և ստացված արժեքները փոխարինեք բանաձևով.
Օրինակ:օգտագործելով կոչման մեթոդը` հաստատելու տարիների ծառայության երկարության և վնասվածքների հաճախականության միջև կապի ուղղությունն ու ուժը, եթե ստացվում են հետևյալ տվյալները.
Մեթոդի ընտրության հիմնավորումը.Խնդիրը լուծելու համար կարելի է ընտրել միայն վարկանիշային հարաբերակցության մեթոդը, քանի որ «Աշխատանքային փորձ տարիներով» հատկանիշի առաջին շարքում կան բաց տարբերակներ (աշխատանքային ստաժ՝ մինչև 1 տարի և 7 և ավելի տարի), ինչը թույլ չի տալիս օգտագործել ավելի ճշգրիտ մեթոդ՝ քառակուսիների մեթոդ՝ հարաբերություններ հաստատելու համար: համեմատած բնութագրերը.
Լուծում. Հաշվարկների հաջորդականությունը նկարագրված է տեքստում, արդյունքները ներկայացված են Աղյուսակում: 2.
աղյուսակ 2
Աշխատանքային փորձը տարիների ընթացքում |
Վնասվածքների թիվը |
Սովորական թվեր (շարքեր) |
Վարկանիշային տարբերություն |
վարկանիշային տարբերությունը՝ քառակուսի |
|
d (x-y) |
դ 2 |
||||
Զույգ նշանների տողերից յուրաքանչյուրը նշվում է «x» և «y» (սյունակներ 1-2):
Նշաններից յուրաքանչյուրի արժեքը փոխարինվում է շարքային (սերիական) համարով: «x» շարքի աստիճանների բաշխման կարգը հետևյալն է. հատկանիշի նվազագույն արժեքին (մինչև 1 տարի փորձ) վերագրվում է «1» սերիական համարը, հատկանիշի նույն շարքի հաջորդ տարբերակները, համապատասխանաբար. , 2-րդ, 3-րդ, 4-րդ և 5-րդ սերիական համարների՝ շարքերի աճման կարգով (տես սյունակ 3): Նմանատիպ կարգ է նկատվում երկրորդ «y» հատկանիշին (սյունակ 4) շարքերը բաշխելիս։ Այն դեպքերում, երբ կան միևնույն չափի մի քանի տարբերակներ (օրինակ, ստանդարտ առաջադրանքում դրանք 12 և 12 վնասվածքներ են 100 աշխատողի համար 3-4 տարի և 5-6 տարվա փորձ ունեցող), սերիական համարը նշվում է. միջին թիվը դրանց սերիական համարների գումարից: Վարկանիշային աղյուսակում վնասվածքների թվի (12 վնասվածքներ) այս տվյալները պետք է զբաղեցնեն 2-րդ և 3-րդ տեղերը, ուստի նրանց միջին թիվը (2 + 3) / 2 = 2,5 է: պետք է բաշխի նույն վարկանիշային համարները՝ «2.5» (սյունակ 4):
Որոշեք d = (x - y) - (սյունակ 5) շարքերի տարբերությունը
Քառակուսիացնելով շարքերի տարբերությունը (d 2) և ստանալ Ս d 2 շարքերի տարբերության քառակուսիների գումարը (սյունակ 6):
Հաշվարկել վարկանիշային հարաբերակցության գործակիցը բանաձևով.
որտեղ n-ը «x» և «y» տողերի համընկնող զույգ տարբերակների թիվն է
Ամենակարևոր նպատակը վիճակագրություներևույթների միջև օբյեկտիվորեն գոյություն ունեցող հարաբերությունների ուսումնասիրությունն է։ ընթացքում վիճակագրական ուսումնասիրությունայս հարաբերությունները, անհրաժեշտ է բացահայտել ցուցիչների միջև պատճառահետևանքային կապերը, այսինքն. ինչպես է որոշ ցուցանիշների փոփոխությունը կախված այլ ցուցանիշների փոփոխությունից:
Գոյություն ունեն կախվածության երկու կատեգորիա (ֆունկցիոնալ և հարաբերական) և նշանների երկու խումբ (նշան-գործոններ և արդյունավետ նշաններ): Ի տարբերություն ֆունկցիոնալ հարաբերությունների, որտեղ կա գործոնի և արդյունքի բնութագրերի միջև լիակատար համապատասխանություն, հարաբերակցության հարաբերություններում այդպիսի ամբողջական համապատասխանություն չկա:
հարաբերակցությունը- սա հարաբերություն է, որտեղ առանձին գործոնների ազդեցությունը հայտնվում է միայն որպես միտում (միջին հաշվով) փաստացի տվյալների զանգվածային դիտարկմամբ: Հարաբերական կախվածության օրինակներ կարող են լինել կախվածությունը բանկի ակտիվների չափի և բանկի շահույթի մեծության, աշխատանքի արտադրողականության աճի և աշխատողների ստաժի միջև:
Հարաբերակցության կախվածության ամենապարզ տարբերակը զույգ հարաբերակցությունն է, այսինքն. կախվածություն երկու նշանների միջև (արդյունավետ և գործոնային կամ երկու գործոնային նշանների միջև): Մաթեմատիկորեն այս կախվածությունը կարող է արտահայտվել որպես y արդյունավետ ցուցիչի կախվածություն x գործոնի ցուցիչից: Միացումները կարող են լինել ուղղակի և հակադարձ: Առաջին դեպքում x հատկանիշի աճով մեծանում է նաև y հատկանիշը, հետադարձ կապի դեպքում x հատկանիշի ավելացման դեպքում y հատկանիշը նվազում է։
Ամենակարևոր խնդիրն է որոշել կապի ձևը հավասարման պարամետրերի հետագա հաշվարկով, կամ, այլ կերպ ասած, գտնել կապի հավասարումը ( ռեգրեսիայի հավասարումներ).
Կարող են լինել տարբեր կոնտակտային ձևեր:
ուղղագիծ
կորագիծձևով՝ երկրորդ կարգի պարաբոլներ (կամ ավելի բարձր կարգեր)
հիպերբոլիա
էքսպոնենցիալ ֆունկցիա և այլն:
Այս բոլոր միացման հավասարումների պարամետրերը սովորաբար որոշվում են նորմալ հավասարումների համակարգեր, որը պետք է համապատասխանի նվազագույն քառակուսիների մեթոդի (LSM) պահանջին.
Եթե հարաբերություններն արտահայտվում են երկրորդ կարգի պարաբոլայով ( ), այնուհետև a0, a1, a2 պարամետրերը գտնելու նորմալ հավասարումների համակարգը (նման կապը կոչվում է բազմակի, քանի որ այն ենթադրում է ավելի քան երկու գործոնի կախվածություն) կարող է ներկայացվել որպես.
Մեկ այլ կարևոր խնդիր է կախվածության խստության չափում- կապի բոլոր ձևերի համար կարելի է լուծել՝ հաշվարկելով էմպիրիկ հարաբերակցության հարաբերակցությունը.
որտեղ - արդյունավետ ցուցիչի մի շարք հավասարեցված արժեքների շեղում.
Ցրվածությունը փաստացի արժեքների շարքում y.
Զույգ գծային կախվածության խստության աստիճանը որոշելու համար, գծային հարաբերակցության գործակից r, որը կարելի է հաշվարկել՝ օգտագործելով, օրինակ, հետևյալ երկու բանաձևերը.
Գծային հարաբերակցության գործակիցը կարող է ընդունել -1-ից +1 արժեքներ կամ մոդուլներ 0-ից 1: Որքան մոտ է այն 1-ին բացարձակ արժեքով, այնքան ավելի մոտ է հարաբերությունը: Նշանը ցույց է տալիս կապի ուղղությունը՝ «+»՝ ուղղակի կախվածություն, «-»-ը տեղի է ունենում հակադարձ կախվածությամբ։
Վիճակագրական պրակտիկայում կարող են լինել դեպքեր, երբ գործոնի և արդյունքի հատկանիշների որակները չեն կարող թվային արտահայտվել։ Հետեւաբար, կախվածության սերտությունը չափելու համար անհրաժեշտ է օգտագործել այլ ցուցանիշներ: Այդ նպատակով այսպես կոչված ոչ պարամետրիկ մեթոդներ.
Առավել տարածված են աստիճանի հարաբերակցության գործակիցները, որոնք հիմնված են վիճակագրական շարքի արժեքների համարակալման սկզբունքի վրա։ Շարքերի հարաբերակցության գործակիցներն օգտագործելիս փոխկապակցված են ոչ թե x և y ցուցանիշների արժեքները, այլ միայն դրանց տեղերի համարները, որոնք նրանք զբաղեցնում են արժեքների յուրաքանչյուր շարքում: Այս դեպքում յուրաքանչյուր առանձին միավորի համարը կլինի նրա աստիճանը:
Հարաբերակցության գործակիցները, որոնք հիմնված են վարկանիշային մեթոդի կիրառման վրա, առաջարկել են Կ. Սփիրմանը և Մ. Քենդալը:
Սփիրմանի աստիճանի հարաբերակցության գործակիցը(ժ) հիմնված է արդյունքի և գործոնային բնութագրերի արժեքների շարքերի տարբերությունը հաշվի առնելով և կարող է հաշվարկվել բանաձևով.
որտեղ d = Nx - Ny, այսինքն. x և y արժեքների յուրաքանչյուր զույգի շարքերի տարբերությունը. n-ը դիտարկումների թիվն է:
Քենդալի աստիճանի հարաբերակցության գործակիցը() կարող է որոշվել բանաձևով
որտեղ S = P + Q:
Ոչ պարամետրիկ հետազոտության մեթոդները ներառում են ասոցիացիայի գործակիցըԿուս և պատահականության գործոնԿկոն, որոնք օգտագործվում են, եթե, օրինակ, անհրաժեշտ է ուսումնասիրել որակական հատկանիշների միջև փոխհարաբերությունների սերտությունը, որոնցից յուրաքանչյուրը ներկայացված է այլընտրանքային հատկանիշների տեսքով։
Այս գործակիցները որոշելու համար ստեղծվում է հաշվարկային աղյուսակ («չորս դաշտ» աղյուսակ), որտեղ վիճակագրական պրեդիկատը սխեմատիկորեն ներկայացված է հետևյալ ձևով.
նշաններ |
|||
Այստեղ a, b, c, d երկու այլընտրանքային նշանների փոխադարձ համակցության (համակցության) հաճախականություններն են. n- ընդհանուր գումարըհաճախականություններ.
Արտադրանքի տեղաբաշխման գործակիցը հաշվարկվում է բանաձևով
Պետք է նկատի ունենալ, որ նույն տվյալների դեպքում պատահականության գործակիցը (տատանվում է -1-ից մինչև +1) միշտ պակաս է ասոցիացիայի գործակիցից:
Եթե անհրաժեշտ է գնահատել այլընտրանքային հատկանիշների միջև փոխհարաբերությունների սերտությունը, որոնք կարող են ընդունել ցանկացած արժեքային տարբերակներ, կիրառեք Պիրսոնի փոխադարձ խոնարհման գործակիցը(KP):
Այս տեսակի հարաբերություններն ուսումնասիրելու համար առաջնային վիճակագրական տեղեկատվությունը տեղադրվում է աղյուսակի տեսքով.
նշաններ |
||||
Այստեղ mij են երկու վերագրվող հատկանիշների փոխադարձ համակցության հաճախականությունները. P-ն դիտարկումների զույգերի թիվն է:
Պիրսոնի փոխադարձ պատահականության գործակիցըորոշվում է բանաձևով
որտեղ է միջին քառակուսի խոնարհության ինդեքսը.
Փոխադարձ պատահականության գործակիցը տատանվում է 0-ից 1:
Ի վերջո, պետք է նշել Ֆեխների գործակիցը, որը բնութագրում է կապի խստության տարրական աստիճանը, որը նպատակահարմար է օգտագործել կապի առկայության փաստը հաստատելու համար, երբ առկա է նախնական տեղեկատվության փոքր քանակություն։ Այս գործակիցը որոշվում է բանաձևով
որտեղ na-ն անհատական արժեքների շեղումների նշանների համընկնումների թիվն է նրանց թվաբանական միջինից. nb - համապատասխանաբար, անհամապատասխանությունների քանակը:
Ֆեխների գործակիցը կարող է տատանվել -1,0 Kf +1,0 սահմաններում:
Հարաբերակցության գործակցի բանաձևը
Ընթացքում տնտեսական գործունեությունմարդը աստիճանաբար ձևավորվեց ամբողջ դասարանառաջադրանքներ՝ բացահայտելու տարբեր վիճակագրական օրինաչափություններ:
Անհրաժեշտ էր գնահատել որոշ գործընթացների դետերմինիզմի աստիճանը մյուսների կողմից, անհրաժեշտ էր հաստատել տարբեր գործընթացների և փոփոխականների միջև փոխկախվածության խստությունը:
Հարաբերակցությունը փոփոխականների փոխհարաբերությունն է միմյանցից:
Կախվածության խստությունը գնահատելու համար ներդրվել է հարաբերակցության գործակից:
Հարաբերակցության գործակցի ֆիզիկական նշանակությունը
փխրուն ֆիզիկական իմաստհարաբերակցության գործակիցն ունի, եթե անկախ փոփոխականների վիճակագրական պարամետրերը ենթակա են նորմալ բաշխման, ապա այդպիսի բաշխումը գրաֆիկորեն ներկայացնում է Գաուսի կորը: Իսկ հարաբերությունները գծային են։
Հարաբերակցության գործակիցը ցույց է տալիս, թե ինչպես է մի գործընթաց որոշվում մյուսի կողմից: Նրանք. երբ մեկ գործընթաց փոխվում է, որքան հաճախ է փոխվում նաև կախված գործընթացը: Ընդհանրապես չի փոխվում՝ կախվածություն չկա, ամեն անգամ անմիջապես փոխվում է՝ լիակատար կախվածություն։
Հարաբերակցության գործակիցը կարող է արժեքներ ընդունել [-1:1] միջակայքում:
Գործակիցի զրոյական արժեքը նշանակում է, որ դիտարկվող փոփոխականների միջև կապ չկա:
Շրջանի ծայրահեղ արժեքները նշանակում են ամբողջական կախվածություն փոփոխականների միջև:
Եթե գործակցի արժեքը դրական է, ապա կախվածությունն ուղղակի է։
Բացասական գործակցով - հակառակը: Նրանք. առաջին դեպքում, երբ արգումենտը փոխվում է, ֆունկցիան փոխվում է համաչափ, երկրորդ դեպքում՝ հակադարձ։
Երբ հարաբերակցության գործակիցի արժեքը գտնվում է միջակայքի միջին մասում, այսինքն. 0-ից 1-ը կամ -1-ից 0-ը ցույց են տալիս թերի ֆունկցիոնալ հարաբերություն:
Որքան մոտ է գործակցի արժեքը ծայրահեղ ցուցանիշներին, այնքան մեծ է փոխհարաբերությունը փոփոխականների կամ պատահական փոփոխականներ. Որքան արժեքը մոտ է 0-ին, այնքան փոքր է փոխկախվածությունը:
Սովորաբար հարաբերակցության գործակիցը միջանկյալ արժեքներ է ընդունում։
Հարաբերակցության գործակիցը անչափելի մեծություն է
Հարաբերակցության գործակիցը օգտագործվում է վիճակագրության մեջ, հարաբերակցության վերլուծության մեջ՝ վիճակագրական վարկածները ստուգելու համար։
Մի պատահական փոփոխականի մյուսից կախվածության վիճակագրական որոշ վարկած առաջ քաշելով՝ հաշվարկվում է հարաբերակցության գործակիցը։ Ըստ դրա՝ կարելի է դատողություն անել՝ կապ կա՞ քանակությունների միջև և որքանով է այն խիտ։
Բանն այն է, որ դուք միշտ չէ, որ կարող եք տեսնել կապը: Հաճախ արժեքները ուղղակիորեն կապված չեն միմյանց հետ, բայց կախված են բազմաթիվ գործոններից: Այնուամենայնիվ, կարող է պարզվել, որ պատահական փոփոխականները փոխկապակցված են մի շարք միջնորդավորված կապերի միջոցով: Իհարկե, դա չի կարող նշանակել նրանց անմիջական կապը, ուստի, օրինակ, միջնորդի անհետացման հետ կարող է վերանալ նաեւ կախվածությունը։
Հարաբերակցության վերլուծության նպատակըպատահական փոփոխականների (հատկանիշների) միջև կապի ուժի գնահատումն է, որը բնութագրում է որոշ իրական գործընթաց:Հարաբերակցության վերլուծության խնդիրներ:
ա) երկու կամ ավելի երևույթների կապակցման աստիճանի (ամուր, ուժ, խստություն, ինտենսիվություն) չափում.
բ) Ստացված հատկանիշի վրա առավել նշանակալի ազդեցություն ունեցող գործոնների ընտրություն՝ հիմնված երևույթների միջև կապակցվածության աստիճանի չափման վրա: Այս առումով նշանակալի գործոնները հետագայում օգտագործվում են ռեգրեսիոն վերլուծության մեջ:
գ) Անհայտ պատճառահետևանքային կապերի հայտնաբերում.
Շատ բազմազան են փոխհարաբերությունների դրսևորման ձևերը։ Որպես դրանց ամենատարածված տեսակները՝ ֆունկցիոնալ (ամբողջական) և հարաբերական (թերի) կապ.
հարաբերակցությունըդրսևորվում է միջինում զանգվածային դիտարկումների համար, երբ կախված փոփոխականի տվյալ արժեքները համապատասխանում են անկախ փոփոխականի հավանականական արժեքների որոշակի քանակին: Կապը կոչվում է հարաբերակցություն, եթե գործոնի հատկանիշի յուրաքանչյուր արժեք համապատասխանում է արդյունքի հատկանիշի լավ սահմանված ոչ պատահական արժեքին։
Հարաբերակցության դաշտը ծառայում է որպես հարաբերակցության աղյուսակի տեսողական ներկայացում: Դա գրաֆիկ է, որտեղ X արժեքները գծագրված են աբսցիսայի առանցքի վրա, Y արժեքները գծագրված են օրդինատների առանցքի երկայնքով, իսկ X և Y համակցությունները ցուցադրվում են կետերով: Կապի առկայությունը կարելի է դատել ըստ գտնվելու վայրի: կետերը.
Խստության ցուցանիշներհնարավորություն են տալիս բնութագրել ստացված հատկանիշի տատանումների կախվածությունը հատկանիշ-գործոնի տատանումներից:
Խստության աստիճանի ավելի լավ ցուցանիշ հարաբերակցությունըէ գծային հարաբերակցության գործակից. Այս ցուցանիշը հաշվարկելիս հաշվի են առնվում ոչ միայն շեղումները անհատական արժեքներնշանը միջինից, բայց նաև այդ շեղումների մեծությունը:
Այս թեմայի առանցքային խնդիրներն են ստացված հատկանիշի և բացատրական փոփոխականի ռեգրեսիոն հարաբերությունների հավասարումները, պարամետրերի գնահատման նվազագույն քառակուսիների մեթոդը։ ռեգրեսիոն մոդել, ստացված ռեգրեսիոն հավասարման որակի վերլուծություն, ռեգրեսիոն հավասարման համաձայն ստացված հատկանիշի արժեքների կանխատեսման համար վստահության միջակայքերի կառուցում։
Օրինակ 2
Նորմալ հավասարումների համակարգ.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Մեր տվյալների համար հավասարումների համակարգն ունի ձև
30a + 5763 բ = 21460
5763 a + 1200261 b = 3800360
Առաջին հավասարումից մենք արտահայտում ենք աև փոխարինել երկրորդ հավասարման մեջ.
Մենք ստանում ենք b = -3.46, a = 1379.33
Ռեգրեսիայի հավասարում.
y = -3,46 x + 1379,33
2. Ռեգրեսիայի հավասարման պարամետրերի հաշվարկ.
Նմուշային միջոցներ.
Նմուշի տարբերություններ.
ստանդարտ շեղում
1.1. Հարաբերակցության գործակից
կովարիանս.
Մենք հաշվարկում ենք հաղորդակցության սերտության ցուցանիշը: Նման ցուցանիշը ընտրովի գծային հարաբերակցության գործակիցն է, որը հաշվարկվում է բանաձևով.
Գծային հարաբերակցության գործակիցը արժեքներ է ընդունում –1-ից մինչև +1:
Հատկանիշների միջև փոխհարաբերությունները կարող են լինել թույլ կամ ուժեղ (մոտ): Նրանց չափանիշները գնահատվում են Chaddock սանդղակով.
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Մեր օրինակում Y հատկանիշի և X գործոնի միջև կապը բարձր է և հակադարձ:
Բացի այդ, գծային զույգերի հարաբերակցության գործակիցը կարող է որոշվել ռեգրեսիայի գործակցի բ.
1.2. Ռեգրեսիայի հավասարում(ռեգեսիոն հավասարման գնահատում):
Գծային ռեգրեսիայի հավասարումը y = -3,46 x + 1379,33 է
b = -3,46 գործակիցը ցույց է տալիս արդյունավետ ցուցիչի միջին փոփոխությունը (y-ի միավորներով)՝ x գործոնի արժեքի աճով կամ նվազմամբ դրա չափման միավորի վրա։ Այս օրինակում 1 միավորի ավելացման դեպքում y-ը նվազում է միջինը -3,46-ով։
a = 1379.33 գործակիցը պաշտոնապես ցույց է տալիս y-ի կանխատեսված մակարդակը, բայց միայն այն դեպքում, եթե x=0 մոտ է ընտրանքի արժեքներին:
Բայց եթե x=0-ը հեռու է x նմուշի արժեքներից, ապա բառացի մեկնաբանությունը կարող է հանգեցնել սխալ արդյունքների, և նույնիսկ եթե ռեգրեսիոն գիծը ճշգրիտ նկարագրում է դիտարկված նմուշի արժեքները, երաշխիք չկա, որ դա նույնպես կլինի: դեպք, երբ էքստրապոլյացիա է արվում դեպի ձախ կամ աջ:
Փոխարինելով x-ի համապատասխան արժեքները ռեգրեսիոն հավասարման մեջ՝ հնարավոր է որոշել y(x) արդյունավետ ցուցիչի հավասարեցված (կանխատեսված) արժեքները յուրաքանչյուր դիտարկման համար:
y-ի և x-ի միջև կապը որոշում է ռեգրեսիայի b գործակցի նշանը (եթե > 0 - ուղղակի հարաբերություն, հակառակ դեպքում՝ հակադարձ): Մեր օրինակում հարաբերությունները հակառակ են:
1.3. առաձգականության գործակիցը.
Անցանկալի է օգտագործել ռեգրեսիոն գործակիցները (օրինակ բ) արդյունավետ հատկանիշի վրա գործոնների ազդեցության ուղղակի գնահատման համար, եթե տարբերություն կա արդյունավետ ցուցանիշի y և x գործոնի հատկանիշի չափման միավորներում:
Այս նպատակների համար հաշվարկվում են առաձգականության գործակիցները և բետա գործակիցները:
Էլաստիկության E միջին գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով կփոխվի արդյունքը ժամըգործակիցը փոխելիս իր միջին արժեքից xնրա միջին արժեքի 1%-ը։
Առաձգականության գործակիցը հայտնաբերվում է բանաձևով.
Էլաստիկության գործակիցը 1-ից փոքր է: Հետևաբար, եթե X-ը փոխվի 1%-ով, Y-ը կփոխվի 1%-ից պակաս: Այսինքն՝ X-ի ազդեցությունը Y-ի վրա էական չէ։
Բետա գործակիցցույց է տալիս, թե իր ստանդարտ շեղման արժեքի որ մասով էֆեկտիվ հատկանիշի արժեքը կփոխվի միջինում, երբ գործոնի հատկանիշը փոխվում է իր ստանդարտ շեղման արժեքով մնացած անկախ փոփոխականների արժեքով՝ հաստատուն մակարդակով.
Նրանք. x-ի աճը S x ստանդարտ շեղման արժեքով կհանգեցնի Y-ի միջին արժեքի նվազմանը 0,74 ստանդարտ շեղման S y-ով:
1.4. Մոտավորության սխալ.
Եկեք գնահատենք ռեգրեսիոն հավասարման որակը՝ օգտագործելով բացարձակ մոտարկման սխալը: Միջին մոտավոր սխալը հաշվարկված արժեքների միջին շեղումն է իրական արժեքներից.
Քանի որ սխալը 15%-ից պակաս է, այս հավասարումը կարող է օգտագործվել որպես ռեգրեսիա:
Դիսպերսիայի վերլուծություն.
Տարբերակման վերլուծության խնդիրն է վերլուծել կախված փոփոխականի շեղումը.
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
որտեղ
∑(y i - y cp) 2 - քառակուսի շեղումների ընդհանուր գումարը;
∑(y(x) - y cp) 2 - ռեգրեսիայի պատճառով քառակուսի շեղումների գումարը («բացատրված» կամ «գործոնային»);
∑(y - y(x)) 2 - քառակուսի շեղումների մնացորդային գումար:
Տեսական հարաբերակցության հարաբերակցությունըքանի որ գծային հարաբերությունը հավասար է r xy հարաբերակցության գործակցին:
Կախվածության ցանկացած ձևի դեպքում կապի խստությունը որոշվում է օգտագործելով բազմակի հարաբերակցության գործակից:
Այս գործակիցը ունիվերսալ է, քանի որ այն արտացոլում է կապի խստությունը և մոդելի ճշգրտությունը, ինչպես նաև կարող է օգտագործվել փոփոխականների միջև կապի ցանկացած ձևի համար: Մեկ գործոնով հարաբերակցության մոդել կառուցելիս բազմակի հարաբերակցության գործակիցը հավասար է r xy զույգ հարաբերակցության գործակցին:
1.6. Որոշման գործակից.
(բազմակի) հարաբերակցության գործակցի քառակուսին կոչվում է որոշման գործակից, որը ցույց է տալիս արդյունքի հատկանիշի տատանումների հարաբերակցությունը, որը բացատրվում է գործոն հատկանիշի փոփոխությամբ։
Ամենից հաճախ, տալով որոշման գործակիցի մեկնաբանություն, այն արտահայտվում է որպես տոկոս։
R 2 \u003d -0.74 2 \u003d 0.5413
դրանք. 54,13% դեպքերում x-ի փոփոխությունները հանգեցնում են y-ի փոփոխության: Այսինքն՝ ռեգրեսիոն հավասարման ընտրության ճշգրտությունը միջին է։ Y-ի փոփոխության մնացած 45,87%-ը պայմանավորված է մոդելում չհաշվառված գործոններով:
Մատենագիտություն
- Տնտեսագիտություն. Դասագիրք / Էդ. Ի.Ի. Էլիզեևա. - Մ.: Ֆինանսներ և վիճակագրություն, 2001, էջ. 34..89.
- Մագնուս Յա.Ռ., Կատիշև Պ.Կ., Պերեսեցկի Ա.Ա. Էկոնոմետրիկա. Մեկնարկային դասընթաց. Ուսուցողական. - 2-րդ հրատ., Վեր. – Մ.: Դելո, 1998, էջ. 17..42.
- Էկոնոմետրիկայի սեմինար. Պրոց. նպաստ / I.I. Էլիզեևա, Ս.Վ. Կուրիշևա, Ն.Մ. Գորդենկոն և ուրիշներ; Էդ. Ի.Ի. Էլիզեևա. - Մ.: Ֆինանսներ և վիճակագրություն, 2001, էջ. 5..48.