Որոնք են պահանջները ռեգրեսիոն վերլուծության մոդելում: Գծային ռեգրեսիայի հիմունքները. Հարաբերակցություն բազմակի ռեգրեսիայի համար

Ռեգրեսիոն վերլուծությունը ամենատարածված մեթոդներից մեկն է վիճակագրական ուսումնասիրություն. Այն կարող է օգտագործվել կախված փոփոխականի վրա անկախ փոփոխականների ազդեցության աստիճանը որոշելու համար։ Microsoft Excel-ի ֆունկցիոնալությունն ունի այս տեսակի վերլուծություն իրականացնելու համար նախատեսված գործիքներ: Եկեք նայենք, թե ինչ են դրանք և ինչպես օգտագործել դրանք:

Բայց, որպեսզի օգտագործեք այն ֆունկցիան, որը թույլ է տալիս իրականացնել ռեգրեսիոն վերլուծություն, նախ և առաջ պետք է ակտիվացնել Անալիզի փաթեթը։ Միայն դրանից հետո այս ընթացակարգի համար անհրաժեշտ գործիքները կհայտնվեն Excel ժապավենի վրա:


Այժմ, երբ մենք գնում ենք ներդիր «Տվյալներ», գործիքի տուփի ժապավենի վրա «Վերլուծություն»մենք կտեսնենք նոր կոճակ - "Տվյալների վերլուծություն".

Ռեգրեսիոն վերլուծության տեսակները

Կան ռեգրեսիայի մի քանի տեսակներ.

  • պարաբոլիկ;
  • ուժ;
  • լոգարիթմական;
  • էքսպոնենցիալ;
  • ցուցադրություն;
  • հիպերբոլիկ;
  • գծային ռեգրեսիա.

Վերջին տեսակետի կատարման մասին ռեգրեսիոն վերլուծություն Excel-ի մասին ավելի ուշ կխոսենք:

Գծային ռեգրեսիա Excel-ում

Ստորև, որպես օրինակ, ներկայացված է աղյուսակ, որը ցույց է տալիս փողոցում օդի միջին օրական ջերմաստիճանը և խանութի հաճախորդների թիվը համապատասխան աշխատանքային օրվա համար: Եկեք պարզենք ռեգրեսիոն վերլուծության օգնությամբ, թե կոնկրետ ինչպես եղանակօդի ջերմաստիճանի տեսքով կարող է ազդել առևտրային հաստատություն հաճախելու վրա:

Ընդհանուր գծային ռեգրեսիայի հավասարումն ունի հետևյալ տեսքը՝ Y = a0 + a1x1 + ... + axk: Այս բանաձեւում Յնշանակում է այն փոփոխականը, որի ազդեցությունը մենք փորձում ենք ուսումնասիրել: Մեր դեպքում սա գնորդների թիվն է։ Իմաստը x- սա տարբեր գործոններորոնք ազդում են փոփոխականի վրա: Ընտրանքներ առեգրեսիայի գործակիցներն են։ Այսինքն՝ նրանք որոշում են կոնկրետ գործոնի նշանակությունը։ Ցուցանիշ կհանդես է գալիս ընդհանուրայս նույն գործոնները:


Վերլուծության արդյունքների վերլուծություն

Ռեգրեսիոն վերլուծության արդյունքները ցուցադրվում են աղյուսակի տեսքով՝ պարամետրերում նշված տեղում:

Հիմնական ցուցանիշներից մեկն է R-քառակուսի. Դա ցույց է տալիս մոդելի որակը: Մեր դեպքում այդ գործակիցը կազմում է 0,705 կամ մոտ 70,5%։ Սա որակի ընդունելի մակարդակ է։ 0,5-ից ցածր հարաբերությունները վատ են:

Մեկ այլ կարևոր ցուցանիշ է գտնվում գծի խաչմերուկում գտնվող խցում «Y-հատում»և սյունակ «Գործակիցներ». Այստեղ նշվում է, թե ինչ արժեք կունենա Y-ն, իսկ մեր դեպքում սա գնորդների թիվն է՝ մնացած բոլոր գործոններով։ զրո. Այս աղյուսակում այս արժեքը 58.04 է:

Արժեքը գրաֆիկի հատման կետում «Փոփոխական X1»և «Գործակիցներ»ցույց է տալիս Y-ի կախվածության մակարդակը X-ից: Մեր դեպքում սա խանութի հաճախորդների թվի կախվածության մակարդակն է ջերմաստիճանից: Ազդեցության բավականին բարձր ցուցանիշ է համարվում 1,31 գործակիցը։

Ինչպես տեսնում եք, Microsoft Excel-ի միջոցով ռեգրեսիայի վերլուծության աղյուսակ ստեղծելը բավականին հեշտ է: Բայց միայն պատրաստված անձը կարող է աշխատել ելքի արդյունքում ստացված տվյալների հետ և հասկանալ դրանց էությունը:

ԱՐԴՅՈՒՆՔՆԵՐ

Աղյուսակ 8.3 ա. Ռեգրեսիայի վիճակագրություն
Ռեգրեսիայի վիճակագրություն
Բազմաթիվ Ռ 0,998364
R-քառակուսի 0,99673
Նորմալացված R-քառակուսի 0,996321
ստանդարտ սխալ 0,42405
Դիտարկումներ 10

Նախ դիտարկենք 8.3ա աղյուսակում ներկայացված հաշվարկների վերին մասը՝ ռեգրեսիոն վիճակագրությունը։

R-քառակուսի արժեքը, որը նաև կոչվում է որոշակիության չափանիշ, բնութագրում է ստացված ռեգրեսիոն գծի որակը: Այս որակն արտահայտվում է սկզբնական տվյալների և ռեգրեսիոն մոդելի (հաշվարկված տվյալների) միջև համապատասխանության աստիճանով։ Հստակության չափը միշտ միջակայքում է:

Շատ դեպքերում R-քառակուսի արժեքը գտնվում է այս արժեքների միջև, որոնք կոչվում են ծայրահեղություններ, այսինքն. զրոյի և մեկի միջև:

Եթե ​​R-քառակուսու արժեքը մոտ է մեկին, դա նշանակում է, որ կառուցված մոդելը բացատրում է համապատասխան փոփոխականների գրեթե ողջ փոփոխականությունը։ Ընդհակառակը, զրոյին մոտ R-քառակուսի արժեքը նշանակում է կառուցված մոդելի վատ որակ:

Մեր օրինակում որոշակիության չափը 0,99673 է, ինչը ցույց է տալիս ռեգրեսիոն գծի շատ լավ համապատասխանությունը սկզբնական տվյալներին:

Բազմաթիվ Ռ- բազմակի հարաբերակցության գործակից R - արտահայտում է անկախ փոփոխականների (X) և կախյալ փոփոխականների (Y) կախվածության աստիճանը:

Բազմակի R հավասար է քառակուսի արմատորոշման գործակիցից այս արժեքը վերցնում է արժեքներ զրոյից մինչև մեկ միջակայքում:

Պարզ գծային ռեգրեսիոն վերլուծության ժամանակ բազմակի R-ը հավասար է Պիրսոնի հարաբերակցության գործակցին: Իրոք, R-ի բազմապատիկը մեր դեպքում հավասար է նախորդ օրինակի Պիրսոնի հարաբերակցության գործակցին (0,998364):

Աղյուսակ 8.3բ. Ռեգրեսիայի գործակիցներ
Հնարավորություններ ստանդարտ սխալ t-վիճակագրություն
Y-հատում 2,694545455 0,33176878 8,121757129
Փոփոխական X 1 2,305454545 0,04668634 49,38177965
* Տրված է հաշվարկների կտրված տարբերակը

Այժմ դիտարկենք աղյուսակ 8.3b-ում ներկայացված հաշվարկների միջին մասը: Այստեղ տրված է ռեգրեսիայի գործակիցը b (2.305454545) և y առանցքի երկայնքով օֆսեթը, այսինքն. հաստատուն a (2.694545455):

Հաշվարկների հիման վրա մենք կարող ենք գրել ռեգրեսիայի հավասարումը հետևյալ կերպ.

Y= x*2.305454545+2.694545455

Փոփոխականների միջև կապի ուղղությունը որոշվում է նշանների հիման վրա (բացասական կամ դրական) ռեգրեսիայի գործակիցները(գործակից բ).

Եթե ​​նշանը ժամը ռեգրեսիայի գործակիցը- դրական, կախված փոփոխականի կապը անկախի հետ դրական կլինի: Մեր դեպքում ռեգրեսիայի գործակցի նշանը դրական է, հետեւաբար՝ դրական է նաեւ հարաբերությունը։

Եթե ​​նշանը ժամը ռեգրեսիայի գործակիցը- բացասական, կախված փոփոխականի և անկախ փոփոխականի միջև կապը բացասական է (հակադարձ):

Աղյուսակ 8.3c-ում: ներկայացված են մնացորդների թողարկման արդյունքները։ Որպեսզի այս արդյունքները հայտնվեն հաշվետվության մեջ, անհրաժեշտ է ակտիվացնել «Resduals» վանդակը «Regression» գործիքը գործարկելիս։

ՄՆԱՑՎԱԾ ՀԱՆՁՆՈՒՄԸ

Աղյուսակ 8.3c. Մնում է
Դիտարկում Կանխատեսեց Յ Մնում է Ստանդարտ մնացորդներ
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

Օգտագործելով հաշվետվության այս հատվածը, մենք կարող ենք տեսնել յուրաքանչյուր կետի շեղումները կառուցված ռեգրեսիոն գծից: Մեծագույն բացարձակ արժեք

4-րդ գլխի նյութի ուսումնասիրության արդյունքում ուսանողը պետք է.

իմանալ

  • ռեգրեսիոն վերլուծության հիմնական հասկացությունները;
  • Նվազագույն քառակուսիների մեթոդի գնահատման մեթոդները և գնահատման հատկությունները.
  • նշանակության ստուգման և հավասարումների և ռեգրեսիայի գործակիցների ինտերվալային գնահատման հիմնական կանոնները.

ունակ լինել

  • նմուշի տվյալներից գտնել ռեգրեսիոն հավասարումների երկչափ և բազմակի մոդելների պարամետրերի գնահատականները, վերլուծել դրանց հատկությունները.
  • ստուգել հավասարումների և ռեգրեսիայի գործակիցների նշանակությունը.
  • գտնել նշանակալի պարամետրերի միջակայքային գնահատականները.

սեփական

  • երկչափ և բազմակի ռեգրեսիոն հավասարումների պարամետրերի վիճակագրական գնահատման հմտություններ. ռեգրեսիոն մոդելների համապատասխանությունը ստուգելու հմտություններ;
  • վերլուծական ծրագրերի միջոցով բոլոր նշանակալի գործակիցներով ռեգրեսիոն հավասարման ստացման հմտություններ:

Հիմնական հասկացություններ

Այն բանից հետո, երբ հարաբերակցության վերլուծություն, երբ փոփոխականների միջև վիճակագրորեն նշանակալի կապերի առկայությունը բացահայտվել է և գնահատվել է դրանց խստության աստիճանը, նրանք սովորաբար անցնում են կախվածությունների տեսակի մաթեմատիկական նկարագրությանը՝ օգտագործելով ռեգրեսիոն վերլուծության մեթոդները: Այդ նպատակով ընտրվում է գործառույթների դաս, որը կապում է արդյունավետ ցուցանիշը ժամըև փաստարկները« հաշվարկել սահմանափակման հավասարման պարամետրերի գնահատումները և վերլուծել ստացված հավասարման ճշգրտությունը:

Ֆունկցիա| նկարագրում է արդյունավետ հատկանիշի պայմանական միջին արժեքի կախվածությունը ժամըարգումենտների տրված արժեքներից կոչվում է ռեգրեսիայի հավասարումը.

«Ռեգեսիա» տերմինը (լատ. ռեգրեսիա-նահանջ, վերադարձ դեպի ինչ-որ բան) ներկայացվել է անգլիացի հոգեբան և մարդաբան Ֆ. հայրերը շեղվում են բոլոր հայրերի միջին հասակից Xդյույմներով, ապա նրանց որդիների հասակը շեղվում է բոլոր որդիների միջին հասակից ավելի քիչ, քան xդյույմ Հայտնաբերված միտումը կոչվում էր հետընթաց դեպի միջին:

«Ռեգեսիա» տերմինը լայնորեն կիրառվում է վիճակագրական գրականության մեջ, թեև շատ դեպքերում այն ​​ճշգրիտ չի բնութագրում վիճակագրական կախվածությունը։

Ռեգրեսիոն հավասարման ճշգրիտ նկարագրության համար անհրաժեշտ է իմանալ արդյունավետ ցուցիչի բաշխման պայմանական օրենքը. y.Վիճակագրական պրակտիկայում նման տեղեկատվություն ստանալը սովորաբար անհնար է, հետևաբար, դրանք սահմանափակվում են ֆունկցիայի համար համապատասխան մոտարկումներ գտնելով. f(x u X 2, .... լ *), երևույթի նախնական իմաստալից վերլուծության կամ նախնական վիճակագրական տվյալների հիման վրա:

Ցուցանիշների վեկտորի բաշխման տեսակի վերաբերյալ անհատական ​​մոդելային ենթադրությունների շրջանակներում<) может быть получен общий вид ռեգրեսիայի հավասարումներ, որտեղ. Օրինակ՝ ենթադրելով, որ ցուցիչների ուսումնասիրված բազմությունը ենթարկվում է մաթեմատիկական ակնկալիքների վեկտորի ()-չափային նորմալ բաշխման օրենքին.

Որտեղ և ըստ կովարիանսի մատրիցով,

որտեղ է տարբերությունը y,

Ռեգրեսիոն հավասարումը (պայմանական ակնկալիք) ունի ձևը

Այսպիսով, եթե բազմաչափ պատահական փոփոխական է ()

ենթարկվում է ()-չափային նորմալ բաշխման օրենքին, այնուհետև արդյունավետ ցուցիչի ռեգրեսիայի հավասարմանը ժամըբացատրական փոփոխականներում ունի գծային in Xդիտել.

Այնուամենայնիվ, վիճակագրական պրակտիկայում մարդը սովորաբար պետք է սահմանափակվի անհայտ ճշմարիտ ռեգրեսիոն ֆունկցիայի համար հարմար մոտարկումներ գտնելով։ f(x),քանի որ հետազոտողը ճշգրիտ գիտելիքներ չունի վերլուծված կատարողականի ցուցանիշի հավանականության բաշխման պայմանական օրենքի մասին ժամըփաստարկների տրված արժեքների համար X.

Դիտարկենք ճշմարիտ, մոդելային և ռեգրեսիոն գնահատումների միջև կապը: Թող կատարողականի ցուցանիշը ժամըկապված վեճի հետ Xհարաբերակցությունը

որտեղ է պատահական փոփոխականը նորմալ բաշխման օրենքով, ընդ որում: Ճշմարիտ ռեգրեսիայի ֆունկցիան այս դեպքում է

Ենթադրենք, որ մենք չգիտենք ճշմարիտ ռեգրեսիոն հավասարման ձևը, բայց մենք ունենք ինը դիտարկում երկչափ պատահական փոփոխականի վրա, որը կապված է Նկ. 4.1.

Բրինձ. 4.1. Ճշմարիտի հարաբերական դիրքըf(x) և տեսականվայռեգրեսիայի մոդելներ

Կետերի գտնվելու վայրը նկ. 4.1-ը թույլ է տալիս մեզ սահմանափակվել ձևի գծային կախվածությունների դասով

Օգտագործելով նվազագույն քառակուսիների մեթոդը, մենք գտնում ենք ռեգրեսիայի հավասարման գնահատականը:

Համեմատության համար Նկ. 4.1-ը ցույց է տալիս իրական ռեգրեսիոն ֆունկցիայի և տեսական մոտավոր ռեգրեսիոն ֆունկցիայի գրաֆիկները: Ռեգրեսիոն հավասարման գնահատականը հավանականությամբ համընկնում է վերջինիս հետ վայընտրանքի չափի անսահմանափակ աճով ():

Քանի որ մենք սխալմամբ ընտրել ենք գծային ռեգրեսիոն ֆունկցիա իրական ռեգրեսիայի ֆունկցիայի փոխարեն, որը, ցավոք, բավականին տարածված է վիճակագրական հետազոտության պրակտիկայում, մեր վիճակագրական եզրակացությունները և գնահատումները չեն ունենա համապատասխանության հատկություն, այսինքն. որքան էլ մեծացնենք դիտարկումների ծավալը, մեր ընտրանքային գնահատականը չի համընկնի իրական ռեգրեսիայի ֆունկցիայի հետ

Եթե ​​մենք ճիշտ էինք ընտրել ռեգրեսիոն ֆունկցիաների դասը, ապա նկարագրության անճշտությունը օգտագործելով վայկբացատրվեր միայն նմուշի սահմանափակությամբ և, հետևաբար, այն կարող էր կամայականորեն փոքրանալ

Նախնական վիճակագրական տվյալներից արդյունավետ ցուցիչի պայմանական արժեքը և անհայտ ռեգրեսիոն ֆունկցիան լավագույնս վերականգնելու համար առավել հաճախ օգտագործվում են հետևյալը. համապատասխանության չափանիշներկորստի գործառույթներ.

1. Նվազագույն քառակուսի մեթոդ,ըստ որի արդյունավետ ցուցիչի դիտարկված արժեքների քառակուսի շեղումը մոդելային արժեքներից նվազագույնի է հասցվում, որտեղ ռեգրեսիոն հավասարման գործակիցները արգումենտների վեկտորի արժեքներն են «-M» դիտարկման մեջ. :

Լուծվում է վեկտորի գնահատական ​​գտնելու խնդիրը։ Ստացված ռեգրեսիան կոչվում է միջին քառակուսի.

2. Նվազագույն մոդուլների մեթոդ, ըստ որի մոդուլային արժեքներից արդյունավետ ցուցիչի դիտարկվող արժեքների բացարձակ շեղումների գումարը նվազագույնի է հասցվում, այսինքն.

Ստացված ռեգրեսիան կոչվում է նշանակում է բացարձակ(միջին):

3. մինիմաքս մեթոդնվազեցվում է արդյունավետ ցուցիչի դիտարկվող արժեքի առավելագույն շեղման մոդուլը նվազագույնի հասցնելու համար y,մոդելի արժեքից, այսինքն.

Ստացված ռեգրեսիան կոչվում է նվազագույն.

Գործնական կիրառություններում հաճախ հանդիպում են խնդիրներ, որոնցում ուսումնասիրվում է պատահական փոփոխականը y,կախված փոփոխականների մի շարքից և անհայտ պարամետրերից: Մենք կդիտարկենք () որպես (k + 1) - ծավալային ընդհանուր բնակչություն, որից պատահական նմուշ է ծավալում Պ,որտեղ ()-ը /-րդ դիտարկման արդյունքն է,. Դիտարկումների արդյունքների հիման վրա պահանջվում է գնահատել անհայտ պարամետրերը: Վերը նկարագրված առաջադրանքը վերաբերում է ռեգրեսիոն վերլուծության խնդիրներին:

ռեգրեսիոն վերլուծություն անվանել պատահական փոփոխականի կախվածության վիճակագրական վերլուծության մեթոդը ժամըռեգրեսիոն վերլուծության մեջ դիտարկվող փոփոխականների վրա որպես ոչ պատահական փոփոխականներ՝ անկախ բաշխման իրական օրենքից

Ուսման ընթացքում ուսանողները շատ հաճախ հանդիպում են տարբեր հավասարումների։ Դրանցից մեկը՝ ռեգրեսիայի հավասարումը, քննարկվում է այս հոդվածում։ Այս տեսակի հավասարումը հատուկ օգտագործվում է մաթեմատիկական պարամետրերի միջև փոխհարաբերությունների բնութագրերը նկարագրելու համար: Հավասարության այս տեսակն օգտագործվում է վիճակագրության և էկոնոմետրիկայի մեջ:

Ռեգրեսիայի սահմանում

Մաթեմատիկայի մեջ ռեգրեսիան հասկացվում է որպես որոշակի մեծություն, որը նկարագրում է տվյալների հավաքածուի միջին արժեքի կախվածությունը մեկ այլ մեծության արժեքներից: Ռեգրեսիայի հավասարումը ցույց է տալիս, որպես որոշակի հատկանիշի ֆունկցիա, մեկ այլ հատկանիշի միջին արժեքը: Ռեգրեսիոն ֆունկցիան ունի պարզ y \u003d x հավասարման ձև, որում y-ն գործում է որպես կախված փոփոխական, իսկ x-ը անկախ փոփոխական է (հատկանիշի գործոն): Փաստորեն, ռեգրեսիան արտահայտվում է որպես y = f (x):

Որո՞նք են փոփոխականների միջև փոխհարաբերությունների տեսակները

Ընդհանուր առմամբ, առանձնանում են հարաբերությունների երկու հակադիր տեսակ՝ հարաբերակցություն և ռեգրեսիա։

Առաջինը բնութագրվում է պայմանական փոփոխականների հավասարությամբ։ Այս դեպքում հստակ հայտնի չէ, թե որ փոփոխականն է կախված մյուսից։

Եթե ​​փոփոխականների միջև հավասարություն չկա, և պայմաններն ասում են, թե որ փոփոխականն է բացատրական և որը կախված, ապա կարելի է խոսել երկրորդ տիպի կապի առկայության մասին։ Գծային ռեգրեսիոն հավասարում կառուցելու համար անհրաժեշտ կլինի պարզել, թե ինչ տեսակի հարաբերություն է նկատվում։

Ռեգրեսիաների տեսակները

Մինչ օրս ռեգրեսիայի 7 տարբեր տեսակ կա՝ հիպերբոլիկ, գծային, բազմակի, ոչ գծային, զույգական, հակադարձ, լոգարիթմականորեն գծային։

Հիպերբոլիկ, գծային և լոգարիթմական

Գծային ռեգրեսիայի հավասարումը օգտագործվում է վիճակագրության մեջ՝ հստակ բացատրելու հավասարման պարամետրերը։ Կարծես y = c + m * x + E: Հիպերբոլիկ հավասարումն ունի կանոնավոր հիպերբոլայի ձև y \u003d c + m / x + E: Լոգարիթմորեն գծային հավասարումն արտահայտում է հարաբերությունները՝ օգտագործելով լոգարիթմական ֆունկցիան. In y \u003d In c + m * In x + In E:

Բազմակի և ոչ գծային

Ռեգրեսիայի երկու ավելի բարդ տեսակները բազմակի և ոչ գծային են: Բազմակի ռեգրեսիայի հավասարումն արտահայտվում է y \u003d f (x 1, x 2 ... x c) + E ֆունկցիայով: Այս իրավիճակում y-ը կախված փոփոխականն է, իսկ x-ը՝ բացատրական: E փոփոխականը ստոխաստիկ է և ներառում է այլ գործոնների ազդեցությունը հավասարման մեջ։ Ոչ գծային ռեգրեսիայի հավասարումը մի փոքր անհամապատասխան է: Մի կողմից հաշվի առնված ցուցանիշների առումով այն գծային չէ, իսկ մյուս կողմից՝ ցուցանիշների գնահատման դերում՝ գծային։

Հակադարձ և զույգային ռեգրեսիաներ

Հակադարձը ֆունկցիայի մի տեսակ է, որը պետք է փոխարկվի գծային ձևի: Առավել ավանդական կիրառական ծրագրերում այն ​​ունի y \u003d 1 / c + m * x + E ֆունկցիայի ձև: Զույգ ռեգրեսիոն հավասարումը ցույց է տալիս տվյալների միջև կապը որպես y = f(x) + E ֆունկցիա: Ճիշտ ինչպես մյուս հավասարումները, y-ը կախված է x-ից, իսկ E-ն ստոխաստիկ պարամետր է:

Հարաբերակցության հայեցակարգը

Սա ցուցիչ է, որը ցույց է տալիս երկու երևույթների կամ գործընթացների միջև հարաբերությունների առկայությունը։ Հարաբերությունների ուժն արտահայտվում է որպես հարաբերակցության գործակից: Դրա արժեքը տատանվում է [-1;+1] միջակայքում: Բացասական ցուցանիշը ցույց է տալիս հետադարձ կապի առկայությունը, դրականը ցույց է տալիս ուղղակի: Եթե ​​գործակիցը վերցնում է 0-ի արժեք, ապա հարաբերություն չկա: Որքան մոտ է արժեքը 1-ին, այնքան ուժեղ է հարաբերությունները պարամետրերի միջև, այնքան մոտ է 0-ին, այնքան թույլ է:

Մեթոդներ

Հարաբերակցության պարամետրային մեթոդները կարող են գնահատել հարաբերությունների խստությունը: Դրանք օգտագործվում են բաշխման գնահատումների հիման վրա՝ ուսումնասիրելու այն պարամետրերը, որոնք ենթարկվում են նորմալ բաշխման օրենքին:

Գծային ռեգրեսիայի հավասարման պարամետրերը անհրաժեշտ են կախվածության տեսակը, ռեգրեսիոն հավասարման գործառույթը պարզելու և ընտրված հարաբերությունների բանաձևի ցուցանիշները գնահատելու համար: Հարաբերակցության դաշտը օգտագործվում է որպես հարաբերությունների նույնականացման մեթոդ: Դա անելու համար բոլոր գոյություն ունեցող տվյալները պետք է ներկայացվեն գրաֆիկորեն: Ուղղանկյուն երկչափ կոորդինատային համակարգում բոլոր հայտնի տվյալները պետք է գծագրվեն: Այսպես է ձևավորվում հարաբերակցության դաշտը։ Նկարագրող գործոնի արժեքը նշվում է աբսցիսայի երկայնքով, իսկ կախյալ գործոնի արժեքները նշվում են օրդինատի երկայնքով: Եթե ​​պարամետրերի միջև ֆունկցիոնալ հարաբերություն կա, դրանք շարվում են գծի տեսքով:

Եթե ​​նման տվյալների հարաբերակցության գործակիցը 30%-ից պակաս է, կարելի է խոսել կապի գրեթե լիակատար բացակայության մասին։ Եթե ​​այն գտնվում է 30%-ից 70%-ի սահմաններում, ապա դա ցույց է տալիս միջին խստության օղակների առկայությունը: 100% ցուցանիշը ֆունկցիոնալ կապի վկայություն է:

Ոչ գծային ռեգրեսիոն հավասարումը, ինչպես գծայինը, պետք է լրացվի հարաբերակցության ինդեքսով (R):

Հարաբերակցություն բազմակի ռեգրեսիայի համար

Որոշման գործակիցը բազմակի հարաբերակցության քառակուսու ցուցիչ է։ Նա խոսում է ուսումնասիրվող հատկանիշի հետ ներկայացված ցուցանիշների բազմության փոխհարաբերության խստության մասին։ Այն կարող է խոսել նաև արդյունքի վրա պարամետրերի ազդեցության բնույթի մասին: Բազմակի ռեգրեսիայի հավասարումը գնահատվում է՝ օգտագործելով այս ցուցանիշը:

Բազմակի հարաբերակցության ինդեքսը հաշվարկելու համար անհրաժեշտ է հաշվարկել դրա ինդեքսը։

Նվազագույն քառակուսի մեթոդ

Այս մեթոդը ռեգրեսիոն գործոնների գնահատման միջոց է։ Դրա էությունը կայանում է նրանում, որ նվազագույնի հասցվի քառակուսի շեղումների գումարը, որը ստացվում է ֆունկցիայից գործոնի կախվածության պատճառով։

Նման մեթոդով կարելի է գնահատել զուգակցված գծային ռեգրեսիայի հավասարումը: Հավասարումների այս տեսակն օգտագործվում է զուգակցված գծային հարաբերությունների ցուցիչների միջև հայտնաբերման դեպքում։

Հավասարումների ընտրանքներ

Գծային ռեգրեսիայի ֆունկցիայի յուրաքանչյուր պարամետր ունի որոշակի նշանակություն: Զույգ գծային ռեգրեսիոն հավասարումը պարունակում է երկու պարամետր՝ c և m։ t պարամետրը ցույց է տալիս y ֆունկցիայի վերջնական ցուցիչի միջին փոփոխությունը՝ x փոփոխականի մեկ պայմանական միավորով նվազման (աճի) ենթակա։ Եթե ​​x փոփոխականը զրո է, ապա ֆունկցիան հավասար է c պարամետրին։ Եթե ​​x փոփոխականը զրո չէ, ապա c գործոնը տնտեսական իմաստ չունի։ Ֆունկցիայի վրա միակ ազդեցությունը c գործոնի դիմաց գտնվող նշանն է: Եթե ​​կա մինուս, ապա կարելի է ասել գործոնի համեմատ արդյունքի դանդաղ փոփոխության մասին։ Եթե ​​կա գումարած, ապա սա ցույց է տալիս արդյունքի արագացված փոփոխություն:

Յուրաքանչյուր պարամետր, որը փոխում է ռեգրեսիոն հավասարման արժեքը, կարող է արտահայտվել հավասարման տեսքով: Օրինակ, c գործոնն ունի c = y - mx ձևը:

Խմբավորված տվյալներ

Կան առաջադրանքի այնպիսի պայմաններ, որոնցում ամբողջ տեղեկատվությունը խմբավորվում է ըստ x հատկանիշի, բայց միևնույն ժամանակ, որոշակի խմբի համար նշվում են կախված ցուցիչի համապատասխան միջին արժեքները: Այս դեպքում միջին արժեքները բնութագրում են, թե ինչպես է ցուցանիշը կախված x-ից: Այսպիսով, խմբավորված տեղեկատվությունը օգնում է գտնել ռեգրեսիայի հավասարումը: Այն օգտագործվում է որպես հարաբերությունների վերլուծություն: Այնուամենայնիվ, այս մեթոդն ունի իր թերությունները. Ցավոք սրտի, միջին ցուցանիշները հաճախ ենթարկվում են արտաքին տատանումների: Այս տատանումները հարաբերությունների օրինաչափությունների արտացոլումը չեն, դրանք պարզապես քողարկում են դրա «աղմուկը»։ Միջինները ցույց են տալիս հարաբերությունների օրինաչափություններ, որոնք շատ ավելի վատն են, քան գծային ռեգրեսիոն հավասարումը: Այնուամենայնիվ, դրանք կարող են օգտագործվել որպես հավասարում գտնելու հիմք: Բազմապատկելով որոշակի բնակչության չափը համապատասխան միջինով, կարող եք ստանալ y-ի գումարը խմբի ներսում: Հաջորդը, դուք պետք է նոկաուտի ենթարկեք ստացված բոլոր գումարները և գտնեք վերջնական ցուցանիշը y: Մի փոքր ավելի դժվար է հաշվարկներ կատարել xy գումարի ցուցիչով։ Այն դեպքում, երբ միջակայքերը փոքր են, մենք կարող ենք պայմանականորեն ընդունել x ցուցանիշը բոլոր միավորների համար (խմբի ներսում): Բազմապատկեք այն y-ի գումարով, որպեսզի գտնեք x-ի և y-ի արտադրյալների գումարը: Այնուհետև, բոլոր գումարները բախվում են իրար և ստացվում է xy ընդհանուր գումարը:

Բազմակի զույգ հավասարումների ռեգրեսիա. հարաբերությունների կարևորության գնահատում

Ինչպես արդեն քննարկվեց, բազմակի ռեգրեսիան ունի y \u003d f (x 1, x 2, ..., x m) + E ձևի ֆունկցիա: Ամենից հաճախ նման հավասարումը օգտագործվում է ապրանքի առաջարկի և պահանջարկի խնդիրը լուծելու, հետգնված բաժնետոմսերի տոկոսային եկամուտների, արտադրության արժեքի ֆունկցիայի պատճառներն ու տեսակը ուսումնասիրելու համար: Այն նաև ակտիվորեն օգտագործվում է մակրոտնտեսական ուսումնասիրությունների և հաշվարկների լայն տեսականիում, բայց միկրոտնտեսության մակարդակում նման հավասարումը մի փոքր ավելի հազվադեպ է օգտագործվում:

Բազմաթիվ ռեգրեսիայի հիմնական խնդիրն է ստեղծել տվյալների մոդել, որը պարունակում է հսկայական քանակությամբ տեղեկատվություն, որպեսզի հետագայում որոշվի, թե ինչ ազդեցություն է թողնում գործոններից յուրաքանչյուրն առանձին-առանձին և ամբողջությամբ՝ մոդելավորվող ցուցանիշի և դրա գործակիցների վրա: Ռեգրեսիայի հավասարումը կարող է ընդունել տարբեր արժեքներ: Այս դեպքում հարաբերությունները գնահատելու համար սովորաբար օգտագործվում են երկու տեսակի ֆունկցիաներ՝ գծային և ոչ գծային։

Գծային ֆունկցիան պատկերված է նման հարաբերությունների տեսքով՝ y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m: Այս դեպքում a2, a m-ը համարվում են «մաքուր» ռեգրեսիայի գործակիցներ։ Դրանք անհրաժեշտ են y պարամետրի միջին փոփոխությունը յուրաքանչյուր համապատասխան x պարամետրի փոփոխությամբ (նվազում կամ աճ) մեկ միավորով բնութագրելու համար՝ այլ ցուցանիշների կայուն արժեքի պայմանով։

Ոչ գծային հավասարումներն ունեն, օրինակ, ուժային ֆունկցիայի y=ax 1 b1 x 2 b2 ...x m bm . Այս դեպքում ցուցանիշները b 1, b 2 ..... b m - կոչվում են առաձգականության գործակիցներ, դրանք ցույց են տալիս, թե ինչպես է արդյունքը փոխվելու (քանո՞վ) համապատասխան x ցուցանիշի 1%-ով աճով (նվազմամբ): եւ այլ գործոնների կայուն ցուցանիշով։

Ինչ գործոններ պետք է հաշվի առնել բազմակի ռեգրեսիա կառուցելիս

Բազմակի ռեգրեսիա ճիշտ կառուցելու համար անհրաժեշտ է պարզել, թե որ գործոններին պետք է հատուկ ուշադրություն դարձնել։

Անհրաժեշտ է որոշակի պատկերացում ունենալ տնտեսական գործոնների և մոդելավորված գործոնների միջև փոխհարաբերությունների բնույթի մասին: Ներառվող գործոնները պետք է համապատասխանեն հետևյալ չափանիշներին.

  • Պետք է չափելի լինի: Օբյեկտի որակը բնութագրող գործոն օգտագործելու համար, ամեն դեպքում, նրան պետք է քանակական ձև տալ։
  • Գործոնային փոխկապակցվածություն կամ ֆունկցիոնալ հարաբերություն չպետք է լինի: Նման գործողությունները առավել հաճախ հանգեցնում են անդառնալի հետևանքների. սովորական հավասարումների համակարգը դառնում է անվերապահ, և դա ենթադրում է դրա անվստահելիությունը և անորոշ գնահատականները:
  • Հսկայական հարաբերակցության ցուցանիշի դեպքում հնարավոր չէ պարզել գործոնների մեկուսացված ազդեցությունը ցուցանիշի վերջնական արդյունքի վրա, հետևաբար գործակիցները դառնում են անմեկնելի։

Շինարարության մեթոդներ

Գոյություն ունեն հսկայական թվով մեթոդներ և եղանակներ բացատրելու, թե ինչպես կարող եք ընտրել հավասարման գործոնները: Այնուամենայնիվ, այս բոլոր մեթոդները հիմնված են հարաբերակցության ինդեքսով գործակիցների ընտրության վրա: Դրանց թվում են.

  • Բացառման մեթոդ.
  • Միացնել մեթոդը:
  • Փուլային ռեգրեսիոն վերլուծություն.

Առաջին մեթոդը ներառում է համախառն հավաքածուից բոլոր գործակիցների մաղումը: Երկրորդ մեթոդը ներառում է բազմաթիվ լրացուցիչ գործոնների ներդրում: Դե, երրորդը այն գործոնների վերացումն է, որոնք նախկինում կիրառվում էին հավասարման վրա: Այս մեթոդներից յուրաքանչյուրն իրավունք ունի գոյություն ունենալ: Նրանք ունեն իրենց դրական և բացասական կողմերը, բայց կարող են յուրովի լուծել ավելորդ ցուցանիշների վերացման հարցը։ Որպես կանոն, յուրաքանչյուր առանձին մեթոդով ստացված արդյունքները բավականին մոտ են։

Բազմաչափ վերլուծության մեթոդներ

Գործոնների որոշման նման մեթոդները հիմնված են փոխկապակցված հատկանիշների առանձին համակցությունների դիտարկման վրա: Դրանք ներառում են տարբերակիչ վերլուծություն, օրինաչափությունների ճանաչում, հիմնական բաղադրիչի վերլուծություն և կլաստերային վերլուծություն: Բացի այդ, կա նաև գործոնային վերլուծություն, սակայն այն առաջացել է բաղադրիչ մեթոդի մշակման արդյունքում։ Դրանք բոլորն էլ կիրառվում են որոշակի հանգամանքներում, որոշակի պայմաններում ու գործոններով։

Ժամանակակից քաղաքագիտությունը բխում է հասարակության բոլոր երևույթների և գործընթացների փոխհարաբերությունների դիրքից։ Անհնար է հասկանալ իրադարձություններն ու գործընթացները, կանխատեսել և կառավարել քաղաքական կյանքի երևույթները՝ առանց ուսումնասիրելու հասարակության քաղաքական ոլորտում առկա կապերն ու կախվածությունները։ Քաղաքականության հետազոտության ամենատարածված խնդիրներից մեկը որոշ դիտարկելի փոփոխականների միջև կապի ուսումնասիրությունն է: Վերլուծության վիճակագրական մեթոդների մի ամբողջ դաս, որը միավորված է «ռեգեսիոն վերլուծություն» (կամ, ինչպես այն նաև կոչվում է, «հարաբերակցություն-ռեգեսիոն վերլուծություն») ընդհանուր անվանումով, օգնում է լուծել այս խնդիրը։ Այնուամենայնիվ, եթե հարաբերակցության վերլուծությունը հնարավորություն է տալիս գնահատել երկու փոփոխականների միջև կապի ուժը, ապա ռեգրեսիոն վերլուծության միջոցով հնարավոր է որոշել այս հարաբերության տեսակը, կանխատեսել ցանկացած փոփոխականի արժեքի կախվածությունը մեկ այլ փոփոխականի արժեքից: .

Նախ, եկեք հիշենք, թե ինչ է հարաբերակցությունը: Հարաբերականկոչվում է վիճակագրական հարաբերությունների ամենակարևոր հատուկ դեպք, որը բաղկացած է նրանից, որ մեկ փոփոխականի հավասար արժեքները համապատասխանում են տարբեր միջին արժեքներուրիշ. x հատկանիշի արժեքի փոփոխության դեպքում y հատկանիշի միջին արժեքը բնականաբար փոխվում է, մինչդեռ յուրաքանչյուր առանձին դեպքում հատկանիշի արժեքը. ժամը(տարբեր հավանականություններով) կարող է ընդունել բազմաթիվ տարբեր արժեքներ:

«Կոռելացիա» տերմինի հայտնվելը վիճակագրության մեջ (և քաղաքագիտությունը գրավում է վիճակագրության ձեռքբերումը իր խնդիրների լուծման համար, որը, հետևաբար, քաղաքագիտության հետ կապված առարկա է) կապված է անգլիացի կենսաբան և վիճակագիր Ֆրենսիս Գալթոնի անվան հետ, ով առաջարկել է 19-րդ դ. հարաբերակցության-ռեգեսիոն վերլուծության տեսական հիմունքները. Գիտության մեջ «կոռելացիա» տերմինը նախկինում հայտնի էր։ Մասնավորապես, պալեոնտոլոգիայում դեռեւս 18-րդ դ. այն կիրառել է ֆրանսիացի գիտնական Ժորժ Կյուվիեն։ Նա ներմուծեց այսպես կոչված հարաբերակցության օրենքը, որի օգնությամբ, ըստ պեղումների ժամանակ հայտնաբերված կենդանիների մնացորդների, հնարավոր եղավ վերականգնել նրանց տեսքը։

Այս գիտնականի անվան և նրա հարաբերակցության օրենքի հետ կապված հայտնի պատմություն կա. Այսպիսով, համալսարանական արձակուրդի օրերին ուսանողները, ովքեր որոշել էին խաբել հայտնի պրոֆեսորին, եղջյուրներով և սմբակներով այծի կաշվից քաշեցին մեկ ուսանողի վրա: Նա բարձրացավ Կյուվիեի ննջասենյակի պատուհանի մեջ և բղավեց. «Ես քեզ կուտեմ»։ Պրոֆեսորն արթնացավ, նայեց ուրվագիծին և պատասխանեց. «Եթե եղջյուրներ ու սմբակներ ունես, ուրեմն խոտակեր ես և ինձ չես կարող ուտել: Եվ հարաբերակցության օրենքի անտեղյակության համար դուք կստանաք դյուցազմ: Նա շուռ եկավ ու քնեց։ Կատակը կատակ է, բայց այս օրինակում մենք տեսնում ենք բազմակի հարաբերակցության-ռեգեսիոն վերլուծության կիրառման հատուկ դեպք: Այստեղ պրոֆեսորը, հիմնվելով երկու դիտարկվող հատկանիշների արժեքների իմացության վրա (եղջյուրների և սմբակների առկայություն), հիմնվելով հարաբերակցության օրենքի վրա, ստացավ երրորդ հատկանիշի միջին արժեքը (դասը, որին պատկանում է այս կենդանին. խոտակեր է): Այս դեպքում մենք չենք խոսում այս փոփոխականի հատուկ արժեքի մասին (այսինքն, այս կենդանին կարող է անվանական մասշտաբով տարբեր արժեքներ վերցնել. դա կարող է լինել այծ, խոյ կամ ցուլ ...):

Այժմ անցնենք «հետընթաց» եզրույթին։ Խիստ ասած, դա կապված չէ վիճակագրական այն խնդիրների իմաստի հետ, որոնք լուծվում են այս մեթոդի օգնությամբ։ Տերմինի բացատրությունը կարող է տրվել միայն հատկանիշների միջև փոխհարաբերությունների ուսումնասիրման մեթոդների մշակման պատմության իմացության հիման վրա: Այս տեսակի ուսումնասիրությունների առաջին օրինակներից մեկը վիճակագիրներ Ֆ. Գալթոնի և Ք. X-հոր հասակը և U-երեխաների աճը): Իրենց ուսումնասիրության ընթացքում նրանք հաստատել են նախնական վարկածը, որ միջինում բարձրահասակ հայրերը միջին բարձրահասակ երեխաներ են մեծացնում: Նույն սկզբունքը վերաբերում է ցածր հայրերին և երեխաներին: Սակայն, եթե գիտնականները կանգ առնեին այնտեղ, նրանց աշխատանքները երբեք չէին նշվի վիճակագրության դասագրքերում։ Հետազոտողները գտել են մեկ այլ օրինաչափություն արդեն նշված հաստատված վարկածի շրջանակներում։ Նրանք ապացուցեցին, որ շատ բարձրահասակ հայրերը միջինում բարձրահասակ երեխաներ են տալիս, բայց հասակով շատ չեն տարբերվում այն ​​երեխաներից, որոնց հայրերը, թեև միջինից բարձր, բայց շատ չեն տարբերվում միջին հասակից: Նույնը վերաբերում է շատ փոքր հասակ ունեցող հայրերին (շեղվելով ցածրահասակ խմբի միջինից) - նրանց երեխաները միջինում հասակով չէին տարբերվում հասակակիցներից, որոնց հայրերը պարզապես ցածրահասակ էին: Նրանք անվանել են գործառույթը, որը նկարագրում է այս օրինաչափությունը ռեգրեսիոն ֆունկցիա.Այս ուսումնասիրությունից հետո բոլոր հավասարումները, որոնք նկարագրում են նմանատիպ գործառույթներ և կառուցված են նման ձևով, սկսեցին կոչվել ռեգրեսիոն հավասարումներ:

Ռեգրեսիոն վերլուծությունը բազմաչափ վիճակագրական տվյալների վերլուծության մեթոդներից մեկն է, որը համատեղում է վիճակագրական տեխնիկայի մի շարք, որոնք նախատեսված են մեկ կախյալ և մի քանի (կամ մեկ) անկախ փոփոխականների միջև հարաբերությունները ուսումնասիրելու կամ մոդելավորելու համար: Կախված փոփոխականը, ըստ վիճակագրության մեջ ընդունված ավանդույթի, կոչվում է պատասխան և նշվում է որպես ՎԱնկախ փոփոխականները կոչվում են կանխատեսողներ և նշվում են որպես x.Վերլուծության ընթացքում որոշ փոփոխականներ թույլ կապ կունենան պատասխանի հետ և ի վերջո դուրս կմնան վերլուծությունից: Կախյալի հետ կապված մնացած փոփոխականները կարող են նաև կոչվել գործոններ:

Ռեգրեսիոն վերլուծությունը հնարավորություն է տալիս կանխատեսել մեկ կամ մի քանի փոփոխականների արժեքները՝ կախված մեկ այլ փոփոխականից (օրինակ՝ ոչ ավանդական քաղաքական վարքագծի հակումը՝ կախված կրթության մակարդակից) կամ մի քանի փոփոխականներից։ Այն հաշվարկվում է համակարգչի վրա: Ռեգրեսիոն հավասարում կազմելու համար, որը թույլ է տալիս չափել վերահսկվող հատկանիշի կախվածության աստիճանը գործոնայիններից, անհրաժեշտ է ներգրավել պրոֆեսիոնալ մաթեմատիկոս-ծրագրավորողների։ Ռեգրեսիոն վերլուծությունը կարող է անգնահատելի ծառայություն մատուցել քաղաքական իրավիճակի զարգացման կանխատեսող մոդելների ստեղծման, սոցիալական լարվածության պատճառների գնահատման և տեսական փորձարկումների իրականացման գործում: Ռեգրեսիոն վերլուծությունը ակտիվորեն օգտագործվում է քաղաքացիների ընտրական վարքագծի վրա մի շարք սոցիալ-ժողովրդագրական պարամետրերի ազդեցությունն ուսումնասիրելու համար՝ սեռ, տարիք, մասնագիտություն, բնակության վայր, ազգություն, եկամտի մակարդակ և բնույթ:

Ռեգրեսիոն վերլուծության առնչությամբ հասկացությունները անկախև կախյալփոփոխականներ. Անկախ փոփոխականը փոփոխական է, որը բացատրում կամ առաջացնում է մեկ այլ փոփոխականի փոփոխություն: Կախյալ փոփոխականը փոփոխական է, որի արժեքը բացատրվում է առաջին փոփոխականի ազդեցությամբ: Օրինակ՝ 2004 թվականի նախագահական ընտրություններում որոշիչ գործոնները, այսինքն. անկախ փոփոխականներ էին այնպիսի ցուցանիշներ, ինչպիսիք են երկրի բնակչության ֆինանսական վիճակի կայունացումը, թեկնածուների հանրաճանաչության մակարդակը և գործոնը. պաշտոնավարումը.Այս դեպքում թեկնածուներին տրված ձայների տոկոսը կարող է դիտարկվել որպես կախյալ փոփոխական։ Նմանապես, «ընտրողի տարիք» և «ընտրական ակտիվության մակարդակ» փոփոխականների զույգում առաջինն անկախ է, երկրորդը՝ կախված։

Ռեգրեսիոն վերլուծությունը թույլ է տալիս լուծել հետևյալ խնդիրները.

  • 1) հաստատել Ci-ի միջև վիճակագրորեն նշանակալի կապի առկայության կամ բացակայության փաստը x;
  • 2) կառուցել ռեգրեսիոն ֆունկցիայի լավագույն (վիճակագրական իմաստով) գնահատականները.
  • 3) ըստ տրված արժեքների Xանհայտի համար կանխատեսում կառուցել ժամը
  • 4) գնահատել յուրաքանչյուր գործոնի ազդեցության տեսակարար կշիռը Xվրա ժամըև, համապատասխանաբար, մոդելից բացառել աննշան հատկանիշները.
  • 5) փոփոխականների միջև պատճառահետևանքային կապեր հայտնաբերելով, մասամբ կառավարել P-ի արժեքները՝ կարգավորելով բացատրական փոփոխականների արժեքները. x.

Ռեգրեսիոն վերլուծությունը կապված է փոխադարձ անկախ փոփոխականների ընտրության անհրաժեշտության հետ, որոնք ազդում են ուսումնասիրվող ցուցանիշի արժեքի վրա, որոշում են ռեգրեսիոն հավասարման ձևը և գնահատում են պարամետրերը՝ օգտագործելով առաջնային սոցիոլոգիական տվյալների մշակման վիճակագրական մեթոդները: Այս տեսակի վերլուծությունը հիմնված է հարաբերությունների ձևի, ուղղության և սերտության (խտության) գաղափարի վրա: Տարբերել գոլորշու սենյակև բազմակի ռեգրեսիակախված ուսումնասիրված հատկանիշների քանակից. Գործնականում ռեգրեսիոն վերլուծությունը սովորաբար կատարվում է հարաբերակցության վերլուծության հետ համատեղ: Ռեգրեսիայի հավասարումնկարագրում է քանակությունների միջև թվային կապը, որն արտահայտվում է որպես մի փոփոխականի աճի կամ նվազման միտում, մինչդեռ մյուսը մեծանում կամ նվազում է: Միաժամանակ րազլ եւ հ ա յութ լ սառնամանիքև ոչ գծային ռեգրեսիա.Քաղաքական գործընթացները նկարագրելիս հավասարապես հանդիպում են հետընթացի երկու տարբերակները։

Scatterplot քաղաքական հոդվածների մեջ շահերի փոխկախվածության բաշխման համար ( U)և հարցվածների կրթությունը (X)գծային ռեգրեսիա է (նկ. 30):

Բրինձ. երեսուն.

Ընտրական ակտիվության մակարդակի բաշխման սխեման ( U)իսկ պատասխանողի տարիքը (Ա) (պայմանական օրինակ) ոչ գծային ռեգրեսիա է (նկ. 31):


Բրինձ. 31.

Զույգ ռեգրեսիոն մոդելում երկու հատկանիշների (A «և Y») փոխհարաբերությունները նկարագրելու համար օգտագործվում է գծային հավասարում.

որտեղ a-ն հավասարման սխալի պատահական արժեքն է հատկանիշների տատանումներով, այսինքն. հավասարման շեղում «գծայինությունից».

Գործակիցները գնահատելու համար աև բօգտագործել նվազագույն քառակուսիների մեթոդը, որը ենթադրում է, որ ցրման գծապատկերի յուրաքանչյուր կետի քառակուսի շեղումների գումարը ռեգրեսիայի գծից պետք է լինի նվազագույն: Հնարավորություններ ա հ բկարելի է հաշվարկել՝ օգտագործելով հավասարումների համակարգը.

Նվազագույն քառակուսիների գնահատման մեթոդը տալիս է գործակիցների նման գնահատականներ աև բ,որի համար ուղիղն անցնում է կոորդինատներով կետով Xև y,դրանք. հարաբերակցություն կա ժամը = կացին + բ.Ռեգրեսիայի հավասարման գրաֆիկական պատկերը կոչվում է տեսական ռեգրեսիայի գիծ.Գծային կախվածությամբ ռեգրեսիայի գործակիցը գրաֆիկի վրա ներկայացնում է տեսական ռեգրեսիոն գծի թեքության շոշափումը դեպի x առանցքը: Գործակիցի նշանը ցույց է տալիս կապի ուղղությունը: Եթե ​​այն զրոյից մեծ է, ապա հարաբերությունն ուղիղ է, եթե փոքր է՝ հակադարձ։

Հետևյալ օրինակը «Քաղաքական Պետերբուրգ-2006» ուսումնասիրությունից (Աղյուսակ 56) ցույց է տալիս գծային հարաբերություններ քաղաքացիների կողմից ներկայում իրենց կյանքից բավարարվածության աստիճանի և ապագայում կյանքի որակի փոփոխության ակնկալիքների միջև: Միացումը ուղիղ է, գծային (ստանդարտացված ռեգրեսիոն գործակիցը 0,233 է, նշանակության մակարդակը՝ 0,000)։ Տվյալ դեպքում ռեգրեսիայի գործակիցը բարձր չէ, սակայն այն գերազանցում է վիճակագրական նշանակալի ցուցանիշի ստորին սահմանը (Պիրսոնի գործակցի վիճակագրական նշանակալի ցուցանիշի քառակուսու ստորին սահմանը)։

Աղյուսակ 56

Ներկայիս քաղաքացիների կյանքի որակի ազդեցությունը ակնկալիքների վրա

(Սանկտ Պետերբուրգ, 2006 թ.)

* Կախված փոփոխական. «Ինչպե՞ս եք կարծում, որ ձեր կյանքը կփոխվի առաջիկա 2-3 տարում»:

Քաղաքական կյանքում ուսումնասիրվող փոփոխականի արժեքը ամենից հաճախ միաժամանակ կախված է մի քանի հատկանիշներից։ Օրինակ, քաղաքական գործունեության մակարդակի և բնույթի վրա միաժամանակ ազդում են պետության քաղաքական ռեժիմը, քաղաքական ավանդույթները, տվյալ տարածքում մարդկանց քաղաքական վարքագծի առանձնահատկությունները և պատասխանողի սոցիալական միկրոխմբը, նրա տարիքը, կրթությունը, եկամուտը: մակարդակ, քաղաքական ուղղվածություն և այլն։ Այս դեպքում դուք պետք է օգտագործեք հավասարումը բազմակի ռեգրեսիա, որն ունի հետևյալ ձևը.

որտեղ գործակիցը բ.- մասնակի ռեգրեսիայի գործակիցը. Այն ցույց է տալիս յուրաքանչյուր անկախ փոփոխականի ներդրումը անկախ (արդյունք) փոփոխականի արժեքները որոշելու գործում: Եթե ​​մասնակի ռեգրեսիայի գործակիցը մոտ է 0-ին, ապա կարող ենք եզրակացնել, որ անկախ և կախյալ փոփոխականների միջև ուղղակի կապ չկա:

Նման մոդելի հաշվարկը կարող է իրականացվել համակարգչի վրա՝ օգտագործելով մատրիցային հանրահաշիվ: Բազմակի ռեգրեսիան թույլ է տալիս արտացոլել սոցիալական կապերի բազմագործոն բնույթը և պարզաբանել յուրաքանչյուր գործոնի ազդեցության չափը առանձին-առանձին և բոլորը միասին՝ ստացված հատկանիշի վրա:

Նշված է գործակիցը բ,կոչվում է գծային ռեգրեսիայի գործակից և ցույց է տալիս գործակցի հատկանիշի տատանումների միջև կապի ուժը Xև արդյունավետ հատկանիշի տատանումները ՅԱյս գործակիցը չափում է հարաբերությունների ուժը հատկանիշների չափման բացարձակ միավորներով։ Այնուամենայնիվ, հատկանիշների հարաբերակցության սերտությունը կարող է արտահայտվել նաև ստացված հատկանիշի ստանդարտ շեղումով (այդպիսի գործակիցը կոչվում է հարաբերակցության գործակից): Ի տարբերություն ռեգրեսիայի գործակցի բհարաբերակցության գործակիցը կախված չէ հատկանիշների չափման ընդունված միավորներից, և, հետևաբար, այն համեմատելի է ցանկացած հատկանիշների համար: Սովորաբար, կապը համարվում է ուժեղ, եթե /> 0.7, միջին խստությունը - 0.5 գ 0.5-ում:

Ինչպես գիտեք, ամենամոտ կապը ֆունկցիոնալ կապն է, երբ յուրաքանչյուրը անհատական ​​արժեք Յկարող է եզակի կերպով վերագրվել արժեքին x.Այսպիսով, որքան հարաբերակցության գործակիցը մոտ է 1-ին, այնքան հարաբերությունը մոտ է ֆունկցիոնալին: Ռեգրեսիոն վերլուծության համար նշանակալի մակարդակը չպետք է գերազանցի 0,001-ը:

Հարաբերակցության գործակիցը վաղուց համարվել է որպես հատկանիշների փոխհարաբերությունների սերտության հիմնական ցուցիչ։ Սակայն հետագայում նման ցուցանիշ դարձավ որոշման գործակիցը։ Այս գործակցի իմաստը հետևյալն է. այն արտացոլում է ստացված հատկանիշի ընդհանուր շեղման բաժինը ժամը, բացատրվում է հատկանիշի շեղումով x.Այն հայտնաբերվում է ուղղակի հարաբերակցության գործակիցը քառակուսու միջոցով (0-ից 1-ի փոխվելով) և, իր հերթին, գծային հարաբերությունների համար արտացոլում է 0-ից (0%) բաժինը: 1 (100%) բնորոշ արժեքներ Y,որոշվում է հատկանիշի արժեքներով x.Այն արձանագրված է որպես Ես 2,իսկ արդյունքում ստացված ռեգրեսիոն վերլուծության աղյուսակներում SPSS փաթեթում՝ առանց քառակուսու:

Նշենք բազմակի ռեգրեսիոն հավասարման կառուցման հիմնական խնդիրները:

  • 1. Ռեգրեսիայի հավասարման մեջ ներառված գործոնների ընտրություն:Այս փուլում հետազոտողը նախ կազմում է այն հիմնական պատճառների ընդհանուր ցանկը, որոնք, ըստ տեսության, առաջացնում են ուսումնասիրվող երեւույթը։ Այնուհետև նա պետք է ընտրի ռեգրեսիայի հավասարման հատկանիշները: Ընտրության հիմնական կանոնն այն է, որ վերլուծության մեջ ներառված գործոնները պետք է հնարավորինս քիչ փոխկապակցվեն միմյանց հետ. միայն այս դեպքում է հնարավոր որոշակի գործոն-ատրիբուտին վերագրել ազդեցության քանակական չափանիշ։
  • 2. Ընտրելով բազմակի ռեգրեսիայի հավասարման ձևը(գործնականում ավելի հաճախ օգտագործվում է գծային կամ գծային-լոգարիթմական)։ Այսպիսով, բազմակի ռեգրեսիա օգտագործելու համար հետազոտողը նախ պետք է կառուցի ստացվածի վրա մի քանի անկախ փոփոխականների ազդեցության հիպոթետիկ մոդել: Որպեսզի ստացված արդյունքները հուսալի լինեն, անհրաժեշտ է, որ մոդելը ճշգրտորեն համապատասխանի իրական գործընթացին, այսինքն. Փոփոխականների միջև կապը պետք է լինի գծային, ոչ մի էական անկախ փոփոխական չի կարող անտեսվել, ինչպես որ ոչ մի փոփոխական, որն անմիջականորեն կապված չէ ուսումնասիրվող գործընթացի հետ, չի կարող ներառվել վերլուծության մեջ: Բացի այդ, փոփոխականների բոլոր չափումները պետք է չափազանց ճշգրիտ լինեն:

Վերոնշյալ նկարագրությունից բխում են այս մեթոդի կիրառման մի շարք պայմաններ, առանց որոնց անհնար է անցնել բազմակի ռեգրեսիոն վերլուծության (MRA) ընթացակարգին: Միայն ստորև նշված բոլոր կետերին համապատասխանելը թույլ է տալիս ճիշտ իրականացնել ռեգրեսիոն վերլուծություն: