Ո՞րն է հարաբերակցությունը: Հարաբերակցության վերլուծություն. Ծրագրային ապահովման օգտագործումը հարաբերակցության վերլուծության մեջ

Pearson-ի հարաբերակցության թեստը պարամետրային վիճակագրության մեթոդ է, որը թույլ է տալիս որոշել երկու քանակական ցուցանիշների միջև գծային կապի առկայությունը կամ բացակայությունը, ինչպես նաև գնահատել դրա սերտությունը և վիճակագրական նշանակությունը: Այլ կերպ ասած, Pearson հարաբերակցության թեստը թույլ է տալիս որոշել, թե արդյոք կա գծային հարաբերություն երկու փոփոխականների արժեքների փոփոխությունների միջև: Վիճակագրական հաշվարկներում և եզրակացություններում հարաբերակցության գործակիցը սովորաբար նշվում է որպես rxyկամ Rxy.

1. Հարաբերակցության չափանիշի զարգացման պատմություն

Պիրսոնի հարաբերակցության թեստը մշակվել է բրիտանացի գիտնականների խմբի կողմից՝ գլխավորությամբ Կարլ Փիրսոն(1857-1936) 19-րդ դարի 90-ական թվականներին երկու պատահական փոփոխականների կովարիանսի վերլուծությունը պարզեցնելու համար։ Բացի Կարլ Փիրսոնից, աշխատել է նաև Պիրսոնի հարաբերակցության թեստի վրա Ֆրենսիս Էջվորթև Ռաֆայել Ուելդոն.

2. Ինչի՞ համար է օգտագործվում Պիրսոնի հարաբերակցության թեստը:

Պիրսոնի հարաբերակցության չափանիշը թույլ է տալիս որոշել, թե որն է քանակական մասշտաբով չափվող երկու ցուցանիշների հարաբերակցության սերտությունը (կամ ուժը): Լրացուցիչ հաշվարկների օգնությամբ դուք կարող եք նաև որոշել, թե որքանով է վիճակագրորեն նշանակալի բացահայտված հարաբերությունը:

Օրինակ, օգտագործելով Pearson հարաբերակցության չափանիշը, կարելի է պատասխանել այն հարցին, թե արդյոք սուր շնչառական վարակների դեպքում կա մարմնի ջերմաստիճանի և արյան մեջ լեյկոցիտների պարունակության, հիվանդի հասակի և քաշի, պարունակության միջև կապ: խմելու ջուրֆտորիդը և կարիեսի դեպքերը բնակչության շրջանում:

3. Պիրսոնի chi-square թեստի օգտագործման պայմաններն ու սահմանափակումները

  1. Համադրելի ցուցանիշները պետք է չափվեն քանակական սանդղակ(օրինակ, սրտի հաճախությունը, մարմնի ջերմաստիճանը, լեյկոցիտների քանակը 1 մլ արյան վրա, սիստոլիկ արյան ճնշում):
  2. Պիրսոնի հարաբերակցության չափանիշի միջոցով հնարավոր է որոշել միայն գծային հարաբերությունների առկայությունը և ուժըքանակների միջև։ Հարաբերությունների այլ բնութագրերը, ներառյալ ուղղությունը (ուղիղ կամ հակադարձ), փոփոխությունների բնույթը (ուղղագիծ կամ կորագիծ), ինչպես նաև մեկ փոփոխականի կախվածությունը մյուսից, որոշվում են ռեգրեսիոն վերլուծության միջոցով:
  3. Համեմատվող արժեքների թիվը պետք է հավասար լինի երկուսի: Երեք և ավելի պարամետրերի փոխհարաբերությունները վերլուծելու դեպքում դուք պետք է օգտագործեք մեթոդը գործոնային վերլուծություն.
  4. Պիրսոնի հարաբերակցության չափանիշն է պարամետրային, որի կապակցությամբ դրա կիրառման պայմանն է նորմալ բաշխումհամընկնող փոփոխականներ. Եթե ​​անհրաժեշտ է կատարել այն ցուցանիշների հարաբերակցության վերլուծություն, որոնց բաշխումը տարբերվում է նորմալից, ներառյալ սովորական սանդղակով չափվածները, պետք է օգտագործվի Սփիրմանի աստիճանի հարաբերակցության գործակիցը:
  5. Անհրաժեշտ է հստակ տարբերակել կախվածություն և հարաբերակցություն հասկացությունները: Արժեքների կախվածությունը որոշում է դրանց միջև հարաբերակցության առկայությունը, բայց ոչ հակառակը:

Օրինակ՝ երեխայի աճը կախված է նրա տարիքից, այսինքն՝ ինչից մեծ երեխա, այնքան բարձր է: Եթե ​​վերցնենք տարբեր տարիքի երկու երեխա, ապա մեծ հավանականության դեպքում մեծ երեխայի աճն ավելի մեծ կլինի, քան փոքրինը։ Այս երեւույթը կոչվում է կախվածություն, ենթադրելով պատճառահետևանքային կապ ցուցանիշների միջև։ Իհարկե, կան նաև հարաբերակցությունը, այսինքն՝ մեկ ցուցանիշի փոփոխություններն ուղեկցվում են մեկ այլ ցուցանիշի փոփոխություններով։

Մեկ այլ իրավիճակում հաշվի առեք երեխայի աճի և սրտի զարկերի փոխհարաբերությունները (HR): Ինչպես գիտեք, այս երկու արժեքներն էլ ուղղակիորեն կախված են տարիքից, հետևաբար, շատ դեպքերում ավելի մեծ հասակի (և հետևաբար ավելի մեծ տարիքի) երեխաները կունենան սրտի զարկերի ավելի ցածր արժեքներ: Այն է, հարաբերակցությունըկդիտարկվի և կարող է ունենալ բավականաչափ բարձր ձգություն: Այնուամենայնիվ, եթե մենք վերցնենք երեխաներին նույն տարիքը, բայց տարբեր բարձրություն, ապա, ամենայն հավանականությամբ, նրանց սրտի բաբախյունը աննշանորեն կտարբերվի, ինչի կապակցությամբ կարելի է եզրակացնել, որ. անկախությունՍրտի հաճախությունը աճից:

Վերոնշյալ օրինակը ցույց է տալիս, թե որքան կարևոր է տարբերակել վիճակագրության մեջ հիմնարար հասկացությունները կապերև կախվածություններցուցանիշներ՝ ճիշտ եզրակացություններ անելու համար։

4. Ինչպե՞ս հաշվարկել Պիրսոնի հարաբերակցության գործակիցը:

Պիրսոնի հարաբերակցության գործակիցը հաշվարկվում է հետևյալ բանաձևով.

5. Ինչպե՞ս մեկնաբանել Պիրսոնի հարաբերակցության գործակցի արժեքը:

Պիրսոնի հարաբերակցության գործակիցի արժեքները մեկնաբանվում են դրա բացարձակ արժեքների հիման վրա: Հարաբերակցության գործակիցի հնարավոր արժեքները տատանվում են 0-ից ±1: Որքան մեծ է r xy-ի բացարձակ արժեքը, այնքան բարձր է երկու մեծությունների միջև հարաբերությունների սերտությունը: r xy = 0 ցույց է տալիս կապի ամբողջական բացակայությունը: r xy = 1 - ցույց է տալիս բացարձակ (ֆունկցիոնալ) կապի առկայությունը: Եթե ​​Պիրսոնի հարաբերակցության չափանիշի արժեքը 1-ից մեծ է կամ -1-ից պակաս, ապա հաշվարկներում սխալ է թույլ տրվել։

Հարաբերակցության սերտությունը կամ ուժը գնահատելու համար օգտագործվում են ընդհանուր ընդունված չափանիշներ, որոնց համաձայն r xy-ի բացարձակ արժեքները.< 0.3 свидетельствуют о թույլկապ, r xy արժեքները 0,3-ից 0,7 - միացման մասին միջինխստություն, r xy արժեքներ > 0,7 - o ուժեղկապեր.

Հարաբերակցության ուժի ավելի ճշգրիտ գնահատում կարելի է ստանալ օգտագործելով Chaddock սեղան:

Դասարան վիճակագրական նշանակությունհարաբերակցության գործակիցը r xy իրականացվում է t-թեստի միջոցով, որը հաշվարկվում է հետևյալ բանաձևով.

Ստացված t r արժեքը համեմատվում է նշանակության որոշակի մակարդակի կրիտիկական արժեքի և n-2 ազատության աստիճանների քանակի հետ։ Եթե ​​t r-ը գերազանցում է t crit-ը, ապա եզրակացություն է արվում բացահայտված հարաբերակցության վիճակագրական նշանակության մասին:

6. Պիրսոնի հարաբերակցության գործակիցը հաշվարկելու օրինակ

Հետազոտության նպատակն էր բացահայտել, որոշել երկու քանակական ցուցանիշների՝ արյան մեջ տեստոստերոնի մակարդակի (X) և մարմնում մկանային զանգվածի տոկոսի (Y) հարաբերակցության խստությունը և վիճակագրական նշանակությունը: 5 առարկաներից կազմված ընտրանքի սկզբնական տվյալները (n = 5) ամփոփված են աղյուսակում:

Հարաբերակցությամբմի հատկանիշի նույն արժեքը համապատասխանում է մյուսի տարբեր արժեքներին: Օրինակ՝ կա հարաբերակցություն հասակի և քաշի, չարորակ նորագոյացությունների դեպքերի և տարիքի միջև և այլն։

Գոյություն ունի հարաբերակցության գործակիցը հաշվարկելու 2 եղանակ՝ քառակուսիների մեթոդ (Pearson), աստիճանների մեթոդ (Spearman)։

Առավել ճշգրիտ է քառակուսիների մեթոդը (Pearson), որտեղ հարաբերակցության գործակիցը որոշվում է բանաձևով.

r xy-ը X և Y վիճակագրական շարքերի հարաբերակցության գործակիցն է:

d x-ը թվերից յուրաքանչյուրի շեղումն է վիճակագրական շարք X իր թվաբանական միջինից:

d y-ը վիճակագրական Y շարքի թվերից յուրաքանչյուրի շեղումն է նրա միջին թվաբանականից:

Կախված կապի ուժից և դրա ուղղությունից, հարաբերակցության գործակիցը կարող է տատանվել 0-ից մինչև 1 (-1): 0 հարաբերակցության գործակիցը ցույց է տալիս կապի ամբողջական բացակայությունը: Որքան հարաբերակցության գործակիցի մակարդակը մոտ է 1-ին կամ (-1-ին), այնքան մեծ է, համապատասխանաբար, այնքան մոտ է դրանով չափվող ուղիղը կամ հետադարձ կապը: 1 կամ (-1) հավասար հարաբերակցության գործակցով կապը ամբողջական է, ֆունկցիոնալ։

Հարաբերակցության ուժի գնահատման սխեման հարաբերակցության գործակցով

Կապի ուժը

Հարաբերակցության գործակիցի արժեքը, եթե առկա է

ուղիղ միացում (+)

հետադարձ կապ (-)

Կապ չկա

Հաղորդակցությունը փոքր է (թույլ)

0-ից մինչև +0,29

0-ից -0,29

Հաղորդակցման միջին մակարդակ (չափավոր)

+0,3-ից +0,69

-0,3-ից -0,69

Հաղորդակցություն մեծ (ուժեղ)

+0,7-ից +0,99

-0,7-ից -0,99

Հաղորդակցությունն ավարտված է

(ֆունկցիոնալ)

Քառակուսիների մեթոդով հարաբերակցության գործակիցը հաշվարկելու համար կազմվում է 7 սյունակներից բաղկացած աղյուսակ։ Եկեք վերլուծենք հաշվարկման գործընթացը՝ օգտագործելով օրինակ.

ՈՐՈՇԵՔ ՄԻՋԵՎ ՀԱՐԱԲԵՐՈՒԹՅՈՒՆՆԵՐԻ ՈՒԺԵՂԸ ԵՎ ԲՆՈՒՅԹԸ.

Ժամանակն է-

էս

goiter

(Վ y )

դ x= Վ xՄ x

դ y= Վ yՄ y

դ x դ y

դ x 2

դ y 2

Σ -1345 ,0

Σ 13996 ,0

Σ 313 , 47

1. Որոշեք ջրի մեջ յոդի միջին պարունակությունը (մգ/լ):

մգ/լ

2. Որոշեք խոպոպի միջին հաճախականությունը տոկոսով:

3. Որոշեք յուրաքանչյուր V x-ի շեղումը M x-ից, այսինքն. դ x.

201–138=63; 178–138=40 և այլն։

4. Նմանապես, մենք որոշում ենք յուրաքանչյուր V y-ի շեղումը M y-ից, այսինքն. դ

0,2–3,8=-3,6; 0,6–38=-3,2 և այլն:

5. Մենք որոշում ենք շեղումների արտադրանքները. Ստացված արդյունքն ամփոփվում և ստացվում է։

6. Քառակուսի ենք դնում d x և ամփոփում ենք արդյունքները, ստանում ենք.

7. Նմանապես, մենք քառակուսի ենք d y, ամփոփում ենք արդյունքները, ստանում ենք

8. Վերջապես, ստացված բոլոր գումարները փոխարինում ենք բանաձևով.

Հարաբերակցության գործակիցի հուսալիության հարցը լուծելու համար դրա միջին սխալը որոշվում է բանաձևով.

(Եթե դիտարկումների թիվը 30-ից պակաս է, ապա հայտարարը n-1 է):

Մեր օրինակում

Հարաբերակցության գործակցի արժեքը համարվում է հուսալի, եթե այն առնվազն 3 անգամ գերազանցում է իր միջին սխալը:

Մեր օրինակում

Այսպիսով, հարաբերակցության գործակիցը հուսալի չէ, ինչը ստիպում է ավելացնել դիտարկումների քանակը։

Հարաբերակցության գործակիցը կարող է որոշվել մի փոքր ավելի քիչ ճշգրիտ, բայց շատ ավելի հեշտ եղանակով, աստիճանի մեթոդով (Spearman):

Սփիրմանի մեթոդը՝ P=1-(6∑d 2 /n-(n 2-1))

կազմել զուգակցված համեմատվող հատկանիշների երկու շարք՝ համապատասխանաբար նշելով առաջին և երկրորդ տողերը՝ x և y: Միևնույն ժամանակ հատկանիշի առաջին տողը ներկայացրեք նվազման կամ աճման կարգով և տեղադրեք երկրորդ շարքի թվային արժեքները առաջին շարքի այն արժեքներին հակառակ, որոնց դրանք համապատասխանում են:

Համեմատված տողերից յուրաքանչյուրում հատկանիշի արժեքը պետք է փոխարինվի հերթական համարով (աստիճան): Շարքերը կամ թվերը ցույց են տալիս առաջին և երկրորդ շարքերի ցուցիչների (արժեքների) տեղերը: Միևնույն ժամանակ, շարքերը պետք է վերագրվեն երկրորդ հատկանիշի թվային արժեքներին նույն կարգով, որն ընդունվել է դրանց արժեքները առաջին հատկանիշի արժեքներին բաշխելիս: Շարքի հատկանիշի նույն արժեքներով, շարքերը պետք է որոշվեն որպես միջին թիվ այս արժեքների հերթական թվերի գումարից:

որոշել x-ի և y-ի (d) շարքերի տարբերությունը. d = x - y

քառակուսի է ստացված վարկանիշային տարբերությունը (d 2)

ստացեք տարբերության քառակուսիների գումարը (Σ d 2) և ստացված արժեքները փոխարինեք բանաձևով.

Օրինակ:օգտագործելով կոչման մեթոդը` հաստատելու տարիների ծառայության երկարության և վնասվածքների հաճախականության միջև կապի ուղղությունն ու ուժը, եթե ստացվում են հետևյալ տվյալները.

Մեթոդի ընտրության հիմնավորումը.Խնդիրը լուծելու համար կարելի է ընտրել միայն վարկանիշային հարաբերակցության մեթոդը, քանի որ «Աշխատանքային փորձ տարիներով» հատկանիշի առաջին շարքում կան բաց տարբերակներ (աշխատանքային ստաժ՝ մինչև 1 տարի և 7 և ավելի տարի), ինչը թույլ չի տալիս օգտագործել ավելի ճշգրիտ մեթոդ՝ քառակուսիների մեթոդ՝ հարաբերություններ հաստատելու համար: համեմատած բնութագրերը.

Լուծում. Հաշվարկների հաջորդականությունը նկարագրված է տեքստում, արդյունքները ներկայացված են Աղյուսակում: 2.

աղյուսակ 2

Աշխատանքային փորձը տարիների ընթացքում

Վնասվածքների թիվը

Սովորական թվեր (շարքեր)

Վարկանիշային տարբերություն

վարկանիշային տարբերությունը՝ քառակուսի

d (x-y)

դ 2

Զույգ նշանների տողերից յուրաքանչյուրը նշվում է «x» և «y» (սյունակներ 1-2):

Նշաններից յուրաքանչյուրի արժեքը փոխարինվում է շարքային (սերիական) համարով: «x» շարքի աստիճանների բաշխման կարգը հետևյալն է. հատկանիշի նվազագույն արժեքին (մինչև 1 տարի փորձ) վերագրվում է «1» սերիական համարը, հատկանիշի նույն շարքի հաջորդ տարբերակները, համապատասխանաբար. , 2-րդ, 3-րդ, 4-րդ և 5-րդ սերիական համարների՝ շարքերի աճման կարգով (տես սյունակ 3): Նմանատիպ կարգ է նկատվում երկրորդ «y» հատկանիշին (սյունակ 4) շարքերը բաշխելիս։ Այն դեպքերում, երբ կան միևնույն չափի մի քանի տարբերակներ (օրինակ, ստանդարտ առաջադրանքում դրանք 12 և 12 վնասվածքներ են 100 աշխատողի համար 3-4 տարի և 5-6 տարվա փորձ ունեցող), սերիական համարը նշվում է. միջին թիվը դրանց սերիական համարների գումարից: Վարկանիշային աղյուսակում վնասվածքների թվի (12 վնասվածքներ) այս տվյալները պետք է զբաղեցնեն 2-րդ և 3-րդ տեղերը, ուստի նրանց միջին թիվը (2 + 3) / 2 = 2,5 է: պետք է բաշխի նույն վարկանիշային համարները՝ «2.5» (սյունակ 4):

Որոշեք d = (x - y) - (սյունակ 5) շարքերի տարբերությունը

Քառակուսիացնելով շարքերի տարբերությունը (d 2) և ստանալ Ս d 2 շարքերի տարբերության քառակուսիների գումարը (սյունակ 6):

Հաշվարկել վարկանիշային հարաբերակցության գործակիցը բանաձևով.

որտեղ n-ը «x» և «y» տողերի համընկնող զույգ տարբերակների թիվն է

Ամենակարևոր նպատակը վիճակագրություներևույթների միջև օբյեկտիվորեն գոյություն ունեցող հարաբերությունների ուսումնասիրությունն է։ ընթացքում վիճակագրական ուսումնասիրությունայս հարաբերությունները, անհրաժեշտ է բացահայտել ցուցիչների միջև պատճառահետևանքային կապերը, այսինքն. ինչպես է որոշ ցուցանիշների փոփոխությունը կախված այլ ցուցանիշների փոփոխությունից:

Գոյություն ունեն կախվածության երկու կատեգորիա (ֆունկցիոնալ և հարաբերական) և նշանների երկու խումբ (նշան-գործոններ և արդյունավետ նշաններ): Ի տարբերություն ֆունկցիոնալ հարաբերությունների, որտեղ կա գործոնի և արդյունքի բնութագրերի միջև լիակատար համապատասխանություն, հարաբերակցության հարաբերություններում այդպիսի ամբողջական համապատասխանություն չկա:

հարաբերակցությունը- սա հարաբերություն է, որտեղ առանձին գործոնների ազդեցությունը հայտնվում է միայն որպես միտում (միջին հաշվով) փաստացի տվյալների զանգվածային դիտարկմամբ: Հարաբերական կախվածության օրինակներ կարող են լինել կախվածությունը բանկի ակտիվների չափի և բանկի շահույթի մեծության, աշխատանքի արտադրողականության աճի և աշխատողների ստաժի միջև:

Հարաբերակցության կախվածության ամենապարզ տարբերակը զույգ հարաբերակցությունն է, այսինքն. կախվածություն երկու նշանների միջև (արդյունավետ և գործոնային կամ երկու գործոնային նշանների միջև): Մաթեմատիկորեն այս կախվածությունը կարող է արտահայտվել որպես y արդյունավետ ցուցիչի կախվածություն x գործոնի ցուցիչից: Միացումները կարող են լինել ուղղակի և հակադարձ: Առաջին դեպքում x հատկանիշի աճով մեծանում է նաև y հատկանիշը, հետադարձ կապի դեպքում x հատկանիշի ավելացման դեպքում y հատկանիշը նվազում է։

Ամենակարևոր խնդիրն է որոշել կապի ձևը հավասարման պարամետրերի հետագա հաշվարկով, կամ, այլ կերպ ասած, գտնել կապի հավասարումը ( ռեգրեսիայի հավասարումներ).

Կարող են լինել տարբեր կոնտակտային ձևեր:

ուղղագիծ

կորագիծձևով՝ երկրորդ կարգի պարաբոլներ (կամ ավելի բարձր կարգեր)

հիպերբոլիա

էքսպոնենցիալ ֆունկցիա և այլն:

Այս բոլոր միացման հավասարումների պարամետրերը սովորաբար որոշվում են նորմալ հավասարումների համակարգեր, որը պետք է համապատասխանի նվազագույն քառակուսիների մեթոդի (LSM) պահանջին.

Եթե ​​հարաբերություններն արտահայտվում են երկրորդ կարգի պարաբոլայով ( ), այնուհետև a0, a1, a2 պարամետրերը գտնելու նորմալ հավասարումների համակարգը (նման կապը կոչվում է բազմակի, քանի որ այն ենթադրում է ավելի քան երկու գործոնի կախվածություն) կարող է ներկայացվել որպես.

Մեկ այլ կարևոր խնդիր է կախվածության խստության չափում- կապի բոլոր ձևերի համար կարելի է լուծել՝ հաշվարկելով էմպիրիկ հարաբերակցության հարաբերակցությունը.

որտեղ - արդյունավետ ցուցիչի մի շարք հավասարեցված արժեքների շեղում.

Ցրվածությունը փաստացի արժեքների շարքում y.

Զույգ գծային կախվածության խստության աստիճանը որոշելու համար, գծային հարաբերակցության գործակից r, որը կարելի է հաշվարկել՝ օգտագործելով, օրինակ, հետևյալ երկու բանաձևերը.

Գծային հարաբերակցության գործակիցը կարող է ընդունել -1-ից +1 արժեքներ կամ մոդուլներ 0-ից 1: Որքան մոտ է այն 1-ին բացարձակ արժեքով, այնքան ավելի մոտ է հարաբերությունը: Նշանը ցույց է տալիս կապի ուղղությունը՝ «+»՝ ուղղակի կախվածություն, «-»-ը տեղի է ունենում հակադարձ կախվածությամբ։

Վիճակագրական պրակտիկայում կարող են լինել դեպքեր, երբ գործոնի և արդյունքի հատկանիշների որակները չեն կարող թվային արտահայտվել։ Հետեւաբար, կախվածության սերտությունը չափելու համար անհրաժեշտ է օգտագործել այլ ցուցանիշներ: Այդ նպատակով այսպես կոչված ոչ պարամետրիկ մեթոդներ.

Առավել տարածված են աստիճանի հարաբերակցության գործակիցները, որոնք հիմնված են վիճակագրական շարքի արժեքների համարակալման սկզբունքի վրա։ Շարքերի հարաբերակցության գործակիցներն օգտագործելիս փոխկապակցված են ոչ թե x և y ցուցանիշների արժեքները, այլ միայն դրանց տեղերի համարները, որոնք նրանք զբաղեցնում են արժեքների յուրաքանչյուր շարքում: Այս դեպքում յուրաքանչյուր առանձին միավորի համարը կլինի նրա աստիճանը:

Հարաբերակցության գործակիցները, որոնք հիմնված են վարկանիշային մեթոդի կիրառման վրա, առաջարկել են Կ. Սփիրմանը և Մ. Քենդալը:

Սփիրմանի աստիճանի հարաբերակցության գործակիցը(ժ) հիմնված է արդյունքի և գործոնային բնութագրերի արժեքների շարքերի տարբերությունը հաշվի առնելով և կարող է հաշվարկվել բանաձևով.

որտեղ d = Nx - Ny, այսինքն. x և y արժեքների յուրաքանչյուր զույգի շարքերի տարբերությունը. n-ը դիտարկումների թիվն է:

Քենդալի աստիճանի հարաբերակցության գործակիցը() կարող է որոշվել բանաձևով

որտեղ S = P + Q:

Ոչ պարամետրիկ հետազոտության մեթոդները ներառում են ասոցիացիայի գործակիցըԿուս և պատահականության գործոնԿկոն, որոնք օգտագործվում են, եթե, օրինակ, անհրաժեշտ է ուսումնասիրել որակական հատկանիշների միջև փոխհարաբերությունների սերտությունը, որոնցից յուրաքանչյուրը ներկայացված է այլընտրանքային հատկանիշների տեսքով։

Այս գործակիցները որոշելու համար ստեղծվում է հաշվարկային աղյուսակ («չորս դաշտ» աղյուսակ), որտեղ վիճակագրական պրեդիկատը սխեմատիկորեն ներկայացված է հետևյալ ձևով.

նշաններ

Այստեղ a, b, c, d երկու այլընտրանքային նշանների փոխադարձ համակցության (համակցության) հաճախականություններն են. n- ընդհանուր գումարըհաճախականություններ.

Արտադրանքի տեղաբաշխման գործակիցը հաշվարկվում է բանաձևով

Պետք է նկատի ունենալ, որ նույն տվյալների դեպքում պատահականության գործակիցը (տատանվում է -1-ից մինչև +1) միշտ պակաս է ասոցիացիայի գործակիցից:

Եթե ​​անհրաժեշտ է գնահատել այլընտրանքային հատկանիշների միջև փոխհարաբերությունների սերտությունը, որոնք կարող են ընդունել ցանկացած արժեքային տարբերակներ, կիրառեք Պիրսոնի փոխադարձ խոնարհման գործակիցը(KP):

Այս տեսակի հարաբերություններն ուսումնասիրելու համար առաջնային վիճակագրական տեղեկատվությունը տեղադրվում է աղյուսակի տեսքով.

նշաններ

Այստեղ mij են երկու վերագրվող հատկանիշների փոխադարձ համակցության հաճախականությունները. P-ն դիտարկումների զույգերի թիվն է:

Պիրսոնի փոխադարձ պատահականության գործակիցըորոշվում է բանաձևով

որտեղ է միջին քառակուսի խոնարհության ինդեքսը.

Փոխադարձ պատահականության գործակիցը տատանվում է 0-ից 1:

Ի վերջո, պետք է նշել Ֆեխների գործակիցը, որը բնութագրում է կապի խստության տարրական աստիճանը, որը նպատակահարմար է օգտագործել կապի առկայության փաստը հաստատելու համար, երբ առկա է նախնական տեղեկատվության փոքր քանակություն։ Այս գործակիցը որոշվում է բանաձևով

որտեղ na-ն անհատական ​​արժեքների շեղումների նշանների համընկնումների թիվն է նրանց թվաբանական միջինից. nb - համապատասխանաբար, անհամապատասխանությունների քանակը:

Ֆեխների գործակիցը կարող է տատանվել -1,0 Kf +1,0 սահմաններում:

Հարաբերակցության գործակցի բանաձևը

Ընթացքում տնտեսական գործունեությունմարդը աստիճանաբար ձևավորվեց ամբողջ դասարանառաջադրանքներ՝ բացահայտելու տարբեր վիճակագրական օրինաչափություններ:

Անհրաժեշտ էր գնահատել որոշ գործընթացների դետերմինիզմի աստիճանը մյուսների կողմից, անհրաժեշտ էր հաստատել տարբեր գործընթացների և փոփոխականների միջև փոխկախվածության խստությունը:
Հարաբերակցությունը փոփոխականների փոխհարաբերությունն է միմյանցից:

Կախվածության խստությունը գնահատելու համար ներդրվել է հարաբերակցության գործակից:

Հարաբերակցության գործակցի ֆիզիկական նշանակությունը

փխրուն ֆիզիկական իմաստհարաբերակցության գործակիցն ունի, եթե անկախ փոփոխականների վիճակագրական պարամետրերը ենթակա են նորմալ բաշխման, ապա այդպիսի բաշխումը գրաֆիկորեն ներկայացնում է Գաուսի կորը: Իսկ հարաբերությունները գծային են։

Հարաբերակցության գործակիցը ցույց է տալիս, թե ինչպես է մի գործընթաց որոշվում մյուսի կողմից: Նրանք. երբ մեկ գործընթաց փոխվում է, որքան հաճախ է փոխվում նաև կախված գործընթացը: Ընդհանրապես չի փոխվում՝ կախվածություն չկա, ամեն անգամ անմիջապես փոխվում է՝ լիակատար կախվածություն։

Հարաբերակցության գործակիցը կարող է արժեքներ ընդունել [-1:1] միջակայքում:

Գործակիցի զրոյական արժեքը նշանակում է, որ դիտարկվող փոփոխականների միջև կապ չկա:
Շրջանի ծայրահեղ արժեքները նշանակում են ամբողջական կախվածություն փոփոխականների միջև:

Եթե ​​գործակցի արժեքը դրական է, ապա կախվածությունն ուղղակի է։

Բացասական գործակցով - հակառակը: Նրանք. առաջին դեպքում, երբ արգումենտը փոխվում է, ֆունկցիան փոխվում է համաչափ, երկրորդ դեպքում՝ հակադարձ։
Երբ հարաբերակցության գործակիցի արժեքը գտնվում է միջակայքի միջին մասում, այսինքն. 0-ից 1-ը կամ -1-ից 0-ը ցույց են տալիս թերի ֆունկցիոնալ հարաբերություն:
Որքան մոտ է գործակցի արժեքը ծայրահեղ ցուցանիշներին, այնքան մեծ է փոխհարաբերությունը փոփոխականների կամ պատահական փոփոխականներ. Որքան արժեքը մոտ է 0-ին, այնքան փոքր է փոխկախվածությունը:
Սովորաբար հարաբերակցության գործակիցը միջանկյալ արժեքներ է ընդունում։

Հարաբերակցության գործակիցը անչափելի մեծություն է

Հարաբերակցության գործակիցը օգտագործվում է վիճակագրության մեջ, հարաբերակցության վերլուծության մեջ՝ վիճակագրական վարկածները ստուգելու համար։

Մի պատահական փոփոխականի մյուսից կախվածության վիճակագրական որոշ վարկած առաջ քաշելով՝ հաշվարկվում է հարաբերակցության գործակիցը։ Ըստ դրա՝ կարելի է դատողություն անել՝ կապ կա՞ քանակությունների միջև և որքանով է այն խիտ։

Բանն այն է, որ դուք միշտ չէ, որ կարող եք տեսնել կապը: Հաճախ արժեքները ուղղակիորեն կապված չեն միմյանց հետ, բայց կախված են բազմաթիվ գործոններից: Այնուամենայնիվ, կարող է պարզվել, որ պատահական փոփոխականները փոխկապակցված են մի շարք միջնորդավորված կապերի միջոցով: Իհարկե, դա չի կարող նշանակել նրանց անմիջական կապը, ուստի, օրինակ, միջնորդի անհետացման հետ կարող է վերանալ նաեւ կախվածությունը։

Հարաբերակցության վերլուծության նպատակըպատահական փոփոխականների (հատկանիշների) միջև կապի ուժի գնահատումն է, որը բնութագրում է որոշ իրական գործընթաց:
Հարաբերակցության վերլուծության խնդիրներ:
ա) երկու կամ ավելի երևույթների կապակցման աստիճանի (ամուր, ուժ, խստություն, ինտենսիվություն) չափում.
բ) Ստացված հատկանիշի վրա առավել նշանակալի ազդեցություն ունեցող գործոնների ընտրություն՝ հիմնված երևույթների միջև կապակցվածության աստիճանի չափման վրա: Այս առումով նշանակալի գործոնները հետագայում օգտագործվում են ռեգրեսիոն վերլուծության մեջ:
գ) Անհայտ պատճառահետևանքային կապերի հայտնաբերում.

Շատ բազմազան են փոխհարաբերությունների դրսևորման ձևերը։ Որպես դրանց ամենատարածված տեսակները՝ ֆունկցիոնալ (ամբողջական) և հարաբերական (թերի) կապ.
հարաբերակցությունըդրսևորվում է միջինում զանգվածային դիտարկումների համար, երբ կախված փոփոխականի տվյալ արժեքները համապատասխանում են անկախ փոփոխականի հավանականական արժեքների որոշակի քանակին: Կապը կոչվում է հարաբերակցություն, եթե գործոնի հատկանիշի յուրաքանչյուր արժեք համապատասխանում է արդյունքի հատկանիշի լավ սահմանված ոչ պատահական արժեքին։
Հարաբերակցության դաշտը ծառայում է որպես հարաբերակցության աղյուսակի տեսողական ներկայացում: Դա գրաֆիկ է, որտեղ X արժեքները գծագրված են աբսցիսայի առանցքի վրա, Y արժեքները գծագրված են օրդինատների առանցքի երկայնքով, իսկ X և Y համակցությունները ցուցադրվում են կետերով: Կապի առկայությունը կարելի է դատել ըստ գտնվելու վայրի: կետերը.
Խստության ցուցանիշներհնարավորություն են տալիս բնութագրել ստացված հատկանիշի տատանումների կախվածությունը հատկանիշ-գործոնի տատանումներից:
Խստության աստիճանի ավելի լավ ցուցանիշ հարաբերակցությունըէ գծային հարաբերակցության գործակից. Այս ցուցանիշը հաշվարկելիս հաշվի են առնվում ոչ միայն շեղումները անհատական ​​արժեքներնշանը միջինից, բայց նաև այդ շեղումների մեծությունը:

Այս թեմայի առանցքային խնդիրներն են ստացված հատկանիշի և բացատրական փոփոխականի ռեգրեսիոն հարաբերությունների հավասարումները, պարամետրերի գնահատման նվազագույն քառակուսիների մեթոդը։ ռեգրեսիոն մոդել, ստացված ռեգրեսիոն հավասարման որակի վերլուծություն, ռեգրեսիոն հավասարման համաձայն ստացված հատկանիշի արժեքների կանխատեսման համար վստահության միջակայքերի կառուցում։

Օրինակ 2


Նորմալ հավասարումների համակարգ.
a n + b∑x = ∑y
a∑x + b∑x 2 = ∑y x
Մեր տվյալների համար հավասարումների համակարգն ունի ձև
30a + 5763 բ = 21460
5763 a + 1200261 b = 3800360
Առաջին հավասարումից մենք արտահայտում ենք աև փոխարինել երկրորդ հավասարման մեջ.
Մենք ստանում ենք b = -3.46, a = 1379.33
Ռեգրեսիայի հավասարում.
y = -3,46 x + 1379,33

2. Ռեգրեսիայի հավասարման պարամետրերի հաշվարկ.
Նմուշային միջոցներ.



Նմուշի տարբերություններ.


ստանդարտ շեղում


1.1. Հարաբերակցության գործակից
կովարիանս.

Մենք հաշվարկում ենք հաղորդակցության սերտության ցուցանիշը: Նման ցուցանիշը ընտրովի գծային հարաբերակցության գործակիցն է, որը հաշվարկվում է բանաձևով.

Գծային հարաբերակցության գործակիցը արժեքներ է ընդունում –1-ից մինչև +1:
Հատկանիշների միջև փոխհարաբերությունները կարող են լինել թույլ կամ ուժեղ (մոտ): Նրանց չափանիշները գնահատվում են Chaddock սանդղակով.
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
Մեր օրինակում Y հատկանիշի և X գործոնի միջև կապը բարձր է և հակադարձ:
Բացի այդ, գծային զույգերի հարաբերակցության գործակիցը կարող է որոշվել ռեգրեսիայի գործակցի բ.

1.2. Ռեգրեսիայի հավասարում(ռեգեսիոն հավասարման գնահատում):

Գծային ռեգրեսիայի հավասարումը y = -3,46 x + 1379,33 է

b = -3,46 գործակիցը ցույց է տալիս արդյունավետ ցուցիչի միջին փոփոխությունը (y-ի միավորներով)՝ x գործոնի արժեքի աճով կամ նվազմամբ դրա չափման միավորի վրա։ Այս օրինակում 1 միավորի ավելացման դեպքում y-ը նվազում է միջինը -3,46-ով։
a = 1379.33 գործակիցը պաշտոնապես ցույց է տալիս y-ի կանխատեսված մակարդակը, բայց միայն այն դեպքում, եթե x=0 մոտ է ընտրանքի արժեքներին:
Բայց եթե x=0-ը հեռու է x նմուշի արժեքներից, ապա բառացի մեկնաբանությունը կարող է հանգեցնել սխալ արդյունքների, և նույնիսկ եթե ռեգրեսիոն գիծը ճշգրիտ նկարագրում է դիտարկված նմուշի արժեքները, երաշխիք չկա, որ դա նույնպես կլինի: դեպք, երբ էքստրապոլյացիա է արվում դեպի ձախ կամ աջ:
Փոխարինելով x-ի համապատասխան արժեքները ռեգրեսիոն հավասարման մեջ՝ հնարավոր է որոշել y(x) արդյունավետ ցուցիչի հավասարեցված (կանխատեսված) արժեքները յուրաքանչյուր դիտարկման համար:
y-ի և x-ի միջև կապը որոշում է ռեգրեսիայի b գործակցի նշանը (եթե > 0 - ուղղակի հարաբերություն, հակառակ դեպքում՝ հակադարձ): Մեր օրինակում հարաբերությունները հակառակ են:
1.3. առաձգականության գործակիցը.
Անցանկալի է օգտագործել ռեգրեսիոն գործակիցները (օրինակ բ) արդյունավետ հատկանիշի վրա գործոնների ազդեցության ուղղակի գնահատման համար, եթե տարբերություն կա արդյունավետ ցուցանիշի y և x գործոնի հատկանիշի չափման միավորներում:
Այս նպատակների համար հաշվարկվում են առաձգականության գործակիցները և բետա գործակիցները:
Էլաստիկության E միջին գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով կփոխվի արդյունքը ժամըգործակիցը փոխելիս իր միջին արժեքից xնրա միջին արժեքի 1%-ը։
Առաձգականության գործակիցը հայտնաբերվում է բանաձևով.


Էլաստիկության գործակիցը 1-ից փոքր է: Հետևաբար, եթե X-ը փոխվի 1%-ով, Y-ը կփոխվի 1%-ից պակաս: Այսինքն՝ X-ի ազդեցությունը Y-ի վրա էական չէ։
Բետա գործակիցցույց է տալիս, թե իր ստանդարտ շեղման արժեքի որ մասով էֆեկտիվ հատկանիշի արժեքը կփոխվի միջինում, երբ գործոնի հատկանիշը փոխվում է իր ստանդարտ շեղման արժեքով մնացած անկախ փոփոխականների արժեքով՝ հաստատուն մակարդակով.

Նրանք. x-ի աճը S x ստանդարտ շեղման արժեքով կհանգեցնի Y-ի միջին արժեքի նվազմանը 0,74 ստանդարտ շեղման S y-ով:
1.4. Մոտավորության սխալ.
Եկեք գնահատենք ռեգրեսիոն հավասարման որակը՝ օգտագործելով բացարձակ մոտարկման սխալը: Միջին մոտավոր սխալը հաշվարկված արժեքների միջին շեղումն է իրական արժեքներից.


Քանի որ սխալը 15%-ից պակաս է, այս հավասարումը կարող է օգտագործվել որպես ռեգրեսիա:
Դիսպերսիայի վերլուծություն.
Տարբերակման վերլուծության խնդիրն է վերլուծել կախված փոփոխականի շեղումը.
∑(y i - y cp) 2 = ∑(y(x) - y cp) 2 + ∑(y - y(x)) 2
որտեղ
∑(y i - y cp) 2 - քառակուսի շեղումների ընդհանուր գումարը;
∑(y(x) - y cp) 2 - ռեգրեսիայի պատճառով քառակուսի շեղումների գումարը («բացատրված» կամ «գործոնային»);
∑(y - y(x)) 2 - քառակուսի շեղումների մնացորդային գումար:
Տեսական հարաբերակցության հարաբերակցությունըքանի որ գծային հարաբերությունը հավասար է r xy հարաբերակցության գործակցին:
Կախվածության ցանկացած ձևի դեպքում կապի խստությունը որոշվում է օգտագործելով բազմակի հարաբերակցության գործակից:

Այս գործակիցը ունիվերսալ է, քանի որ այն արտացոլում է կապի խստությունը և մոդելի ճշգրտությունը, ինչպես նաև կարող է օգտագործվել փոփոխականների միջև կապի ցանկացած ձևի համար: Մեկ գործոնով հարաբերակցության մոդել կառուցելիս բազմակի հարաբերակցության գործակիցը հավասար է r xy զույգ հարաբերակցության գործակցին:
1.6. Որոշման գործակից.
(բազմակի) հարաբերակցության գործակցի քառակուսին կոչվում է որոշման գործակից, որը ցույց է տալիս արդյունքի հատկանիշի տատանումների հարաբերակցությունը, որը բացատրվում է գործոն հատկանիշի փոփոխությամբ։
Ամենից հաճախ, տալով որոշման գործակիցի մեկնաբանություն, այն արտահայտվում է որպես տոկոս։
R 2 \u003d -0.74 2 \u003d 0.5413
դրանք. 54,13% դեպքերում x-ի փոփոխությունները հանգեցնում են y-ի փոփոխության: Այսինքն՝ ռեգրեսիոն հավասարման ընտրության ճշգրտությունը միջին է։ Y-ի փոփոխության մնացած 45,87%-ը պայմանավորված է մոդելում չհաշվառված գործոններով:

Մատենագիտություն

  1. Տնտեսագիտություն. Դասագիրք / Էդ. Ի.Ի. Էլիզեևա. - Մ.: Ֆինանսներ և վիճակագրություն, 2001, էջ. 34..89.
  2. Մագնուս Յա.Ռ., Կատիշև Պ.Կ., Պերեսեցկի Ա.Ա. Էկոնոմետրիկա. Մեկնարկային դասընթաց. Ուսուցողական. - 2-րդ հրատ., Վեր. – Մ.: Դելո, 1998, էջ. 17..42.
  3. Էկոնոմետրիկայի սեմինար. Պրոց. նպաստ / I.I. Էլիզեևա, Ս.Վ. Կուրիշևա, Ն.Մ. Գորդենկոն և ուրիշներ; Էդ. Ի.Ի. Էլիզեևա. - Մ.: Ֆինանսներ և վիճակագրություն, 2001, էջ. 5..48.