Պարզ ռեգրեսիոն վերլուծություն. Ռեգրեսիոն վերլուծությունը վիճակագրական մեթոդ է՝ ուսումնասիրելու պատահական փոփոխականի կախվածությունը փոփոխականներից։ Վերլուծության արդյունքների վերլուծություն

Ուսման ընթացքում ուսանողները շատ հաճախ հանդիպում են տարբեր հավասարումների։ Դրանցից մեկը՝ ռեգրեսիայի հավասարումը, քննարկվում է այս հոդվածում։ Այս տեսակի հավասարումը հատուկ օգտագործվում է մաթեմատիկական պարամետրերի միջև փոխհարաբերությունների բնութագրերը նկարագրելու համար: Այս տեսակըհավասարություններն օգտագործվում են վիճակագրության և էկոնոմետրիկայի մեջ։

Ռեգրեսիայի սահմանում

Մաթեմատիկայի մեջ ռեգրեսիան հասկացվում է որպես որոշակի մեծություն, որը նկարագրում է տվյալների հավաքածուի միջին արժեքի կախվածությունը մեկ այլ մեծության արժեքներից: Ռեգրեսիոն հավասարումը ցույց է տալիս, որպես որոշակի հատկանիշի ֆունկցիա, մեկ այլ հատկանիշի միջին արժեքը: Ռեգրեսիոն ֆունկցիան ունի պարզ y \u003d x հավասարման ձև, որում y-ն գործում է որպես կախյալ փոփոխական, իսկ x-ը անկախ է (հատկանիշի գործոն): Փաստորեն, ռեգրեսիան արտահայտվում է որպես y = f (x):

Որո՞նք են փոփոխականների միջև փոխհարաբերությունների տեսակները

Ընդհանուր առմամբ, առանձնանում են հարաբերությունների երկու հակադիր տեսակ՝ հարաբերակցություն և ռեգրեսիա։

Առաջինը բնութագրվում է պայմանական փոփոխականների հավասարությամբ։ AT այս դեպքըհստակ հայտնի չէ, թե որ փոփոխականն է կախված մյուսից:

Եթե ​​փոփոխականների միջև հավասարություն չկա, և պայմաններն ասում են, թե որ փոփոխականն է բացատրական և որը կախված, ապա կարելի է խոսել երկրորդ տիպի կապի առկայության մասին։ Գծային ռեգրեսիոն հավասարում կառուցելու համար անհրաժեշտ կլինի պարզել, թե ինչ տեսակի հարաբերություն է նկատվում։

Ռեգրեսիաների տեսակները

Մինչ օրս ռեգրեսիայի 7 տարբեր տեսակ կա՝ հիպերբոլիկ, գծային, բազմակի, ոչ գծային, զույգական, հակադարձ, լոգարիթմականորեն գծային։

Հիպերբոլիկ, գծային և լոգարիթմական

Գծային ռեգրեսիայի հավասարումը օգտագործվում է վիճակագրության մեջ՝ հստակ բացատրելու հավասարման պարամետրերը։ Կարծես y = c + m * x + E: Հիպերբոլիկ հավասարումն ունի կանոնավոր հիպերբոլայի ձև y \u003d c + m / x + E: Լոգարիթմորեն գծային հավասարումն արտահայտում է հարաբերությունները՝ օգտագործելով լոգարիթմական ֆունկցիան. In y \u003d In c + m * In x + In E:

Բազմակի և ոչ գծային

ևս երկուսը բարդ տեսակներռեգրեսիաները բազմակի են և ոչ գծային: Բազմակի ռեգրեսիայի հավասարումն արտահայտվում է y \u003d f (x 1, x 2 ... x c) + E ֆունկցիայով: Այս իրավիճակում y-ը կախված փոփոխականն է, իսկ x-ը՝ բացատրական: E փոփոխականը ստոխաստիկ է և ներառում է այլ գործոնների ազդեցությունը հավասարման մեջ։ Ոչ գծային ռեգրեսիայի հավասարումը մի փոքր անհամապատասխան է: Մի կողմից հաշվի առնված ցուցանիշների առումով այն գծային չէ, իսկ մյուս կողմից՝ ցուցանիշների գնահատման դերում՝ գծային։

Հակադարձ և զույգ ռեգրեսիաներ

Հակադարձը ֆունկցիայի մի տեսակ է, որը պետք է փոխարկվի գծային ձևի: Առավել ավանդական կիրառական ծրագրերում այն ​​ունի y \u003d 1 / c + m * x + E ֆունկցիայի ձև: Զույգ ռեգրեսիոն հավասարումը ցույց է տալիս տվյալների միջև կապը որպես y = f(x) + E ֆունկցիա: Ճիշտ ինչպես մյուս հավասարումները, y-ն կախված է x-ից, իսկ E-ն ստոխաստիկ պարամետր է:

Հարաբերակցության հայեցակարգը

Սա ցուցիչ է, որը ցույց է տալիս երկու երևույթների կամ գործընթացների միջև հարաբերությունների առկայությունը։ Հարաբերությունների ուժն արտահայտվում է որպես հարաբերակցության գործակից: Դրա արժեքը տատանվում է [-1;+1] միջակայքում: Բացասական ցուցանիշը ցույց է տալիս ներկայությունը հետադարձ կապ, դրական՝ ուղիղ գծի մասին։ Եթե ​​գործակիցը վերցնում է 0-ի արժեք, ապա հարաբերություն չկա: Որքան մոտ է արժեքը 1-ին, այնքան ուժեղ է հարաբերությունները պարամետրերի միջև, որքան մոտ է 0-ին, այնքան թույլ է:

Մեթոդներ

Հարաբերակցության պարամետրային մեթոդները կարող են գնահատել հարաբերությունների խստությունը: Դրանք օգտագործվում են բաշխման գնահատումների հիման վրա՝ ուսումնասիրելու այն պարամետրերը, որոնք ենթարկվում են նորմալ բաշխման օրենքին:

Գծային ռեգրեսիայի հավասարման պարամետրերը անհրաժեշտ են կախվածության տեսակը, ռեգրեսիոն հավասարման գործառույթը պարզելու և ընտրված հարաբերությունների բանաձևի ցուցանիշները գնահատելու համար: Հարաբերակցության դաշտը օգտագործվում է որպես հարաբերությունների նույնականացման մեթոդ: Դա անելու համար բոլոր գոյություն ունեցող տվյալները պետք է ներկայացվեն գրաֆիկորեն: Ուղղանկյուն երկչափ կոորդինատային համակարգում բոլոր հայտնի տվյալները պետք է գծագրվեն: Այսպես է ձևավորվում հարաբերակցության դաշտը։ Նկարագրող գործոնի արժեքը նշվում է աբսցիսայի երկայնքով, իսկ կախյալ գործոնի արժեքները նշվում են օրդինատի երկայնքով: Եթե ​​պարամետրերի միջև ֆունկցիոնալ հարաբերություն կա, ապա դրանք շարվում են գծի տեսքով:

Եթե ​​նման տվյալների հարաբերակցության գործակիցը 30%-ից պակաս է, կարելի է խոսել կապի գրեթե լիակատար բացակայության մասին։ Եթե ​​այն գտնվում է 30% -ից 70% -ի սահմաններում, ապա դա ցույց է տալիս միջին խստության օղակների առկայությունը: 100% ցուցանիշը ֆունկցիոնալ կապի վկայություն է:

Ոչ գծային ռեգրեսիոն հավասարումը, ինչպես գծայինը, պետք է լրացվի հարաբերակցության ինդեքսով (R):

Հարաբերակցություն բազմակի ռեգրեսիայի համար

Որոշման գործակիցը բազմակի հարաբերակցության քառակուսու ցուցիչ է։ Նա խոսում է ուսումնասիրվող հատկանիշի հետ ներկայացված ցուցանիշների փաթեթի փոխհարաբերության խստության մասին։ Այն կարող է խոսել նաև արդյունքի վրա պարամետրերի ազդեցության բնույթի մասին: Բազմակի ռեգրեսիայի հավասարումը գնահատվում է այս ցուցանիշի միջոցով:

Բազմակի հարաբերակցության ինդեքսը հաշվարկելու համար անհրաժեշտ է հաշվարկել դրա ինդեքսը։

Նվազագույն քառակուսի մեթոդ

Այս մեթոդը ռեգրեսիոն գործոնների գնահատման միջոց է։ Դրա էությունը կայանում է նրանում, որ գործակիցը ֆունկցիայից կախվածության պատճառով ստացված քառակուսի շեղումների գումարը նվազագույնի հասցնի։

Նման մեթոդով կարելի է գնահատել զուգակցված գծային ռեգրեսիայի հավասարումը: Հավասարումների այս տեսակն օգտագործվում է զուգակցված գծային հարաբերությունների ցուցիչների միջև հայտնաբերման դեպքում։

Հավասարումների ընտրանքներ

Գծային ռեգրեսիայի ֆունկցիայի յուրաքանչյուր պարամետր ունի որոշակի նշանակություն: Զուգակցված գծային ռեգրեսիոն հավասարումը պարունակում է երկու պարամետր՝ c և m։ t պարամետրը ցույց է տալիս y ֆունկցիայի վերջնական ցուցիչի միջին փոփոխությունը՝ x փոփոխականի մեկով նվազման (աճի) ենթակա։ պայմանական միավոր. Եթե ​​x փոփոխականը զրո է, ապա ֆունկցիան հավասար է c պարամետրին։ Եթե ​​x փոփոխականը զրո չէ, ապա c գործոնը տնտեսական իմաստ չունի։ Ֆունկցիայի վրա միակ ազդեցությունը c գործոնի դիմաց գտնվող նշանն է: Եթե ​​կա մինուս, ապա կարելի է ասել գործոնի համեմատ արդյունքի դանդաղ փոփոխության մասին։ Եթե ​​կա գումարած, ապա սա ցույց է տալիս արդյունքի արագացված փոփոխություն:

Յուրաքանչյուր պարամետր, որը փոխում է ռեգրեսիոն հավասարման արժեքը, կարող է արտահայտվել հավասարման տեսքով: Օրինակ, c գործոնն ունի c = y - mx ձևը:

Խմբավորված տվյալներ

Կան առաջադրանքի այնպիսի պայմաններ, որոնցում ամբողջ տեղեկատվությունը խմբավորվում է ըստ x հատկանիշի, բայց միևնույն ժամանակ, որոշակի խմբի համար նշվում են կախված ցուցիչի համապատասխան միջին արժեքները: Այս դեպքում միջին արժեքները բնութագրում են, թե ինչպես է ցուցանիշը կախված x-ից: Այսպիսով, խմբավորված տեղեկատվությունը օգնում է գտնել ռեգրեսիայի հավասարումը: Այն օգտագործվում է որպես հարաբերությունների վերլուծություն: Այնուամենայնիվ, այս մեթոդն ունի իր թերությունները. Ցավոք սրտի, միջին ցուցանիշները հաճախ ենթարկվում են արտաքին տատանումների: Այս տատանումները հարաբերությունների օրինաչափությունների արտացոլումը չեն, դրանք պարզապես քողարկում են դրա «աղմուկը»։ Միջինները ցույց են տալիս հարաբերությունների օրինաչափություններ, որոնք շատ ավելի վատն են, քան գծային ռեգրեսիայի հավասարումը: Այնուամենայնիվ, դրանք կարող են օգտագործվել որպես հավասարում գտնելու հիմք: Բազմապատկելով որոշակի բնակչության չափը համապատասխան միջինով, կարող եք ստանալ y-ի գումարը խմբի ներսում: Հաջորդը, դուք պետք է նոկաուտի ենթարկեք ստացված բոլոր գումարները և գտնեք վերջնական ցուցանիշը y: Գումարի xy ցուցիչով հաշվարկներ կատարելը մի փոքր ավելի դժվար է։ Այն դեպքում, երբ միջակայքերը փոքր են, մենք կարող ենք պայմանականորեն ընդունել x ցուցանիշը բոլոր միավորների համար (խմբի ներսում): Բազմապատկեք այն y-ի գումարով, որպեսզի գտնեք x-ի և y-ի արտադրյալների գումարը: Այնուհետև, բոլոր գումարները միաձուլվում են, և ստացվում է ընդհանուր գումարըհու.

Բազմակի զույգ հավասարումների ռեգրեսիա. հարաբերությունների կարևորության գնահատում

Ինչպես արդեն քննարկվեց, բազմակի ռեգրեսիան ունի y \u003d f (x 1, x 2, ..., x m) + E ձևի ֆունկցիա: Ամենից հաճախ նման հավասարումն օգտագործվում է ապրանքի առաջարկի և պահանջարկի խնդիրը լուծելու, հետգնված բաժնետոմսերի տոկոսային եկամուտների, արտադրության արժեքի ֆունկցիայի պատճառներն ու տեսակը ուսումնասիրելու համար: Այն նաև ակտիվորեն օգտագործվում է մակրոտնտեսական ուսումնասիրությունների և հաշվարկների լայն տեսականիում, բայց միկրոտնտեսության մակարդակում նման հավասարումը մի փոքր ավելի հազվադեպ է օգտագործվում:

Բազմաթիվ ռեգրեսիայի հիմնական խնդիրն է ստեղծել տվյալների մոդել, որը պարունակում է հսկայական քանակությամբ տեղեկատվություն, որպեսզի հետագայում որոշվի, թե ինչ ազդեցություն ունի գործոններից յուրաքանչյուրն առանձին-առանձին և ընդհանուր առմամբ մոդելավորվող ցուցանիշի և դրա գործակիցների վրա: Ռեգրեսիայի հավասարումը կարող է ընդունել տարբեր արժեքներ: Այս դեպքում հարաբերությունները գնահատելու համար սովորաբար օգտագործվում են երկու տեսակի ֆունկցիաներ՝ գծային և ոչ գծային։

Գծային ֆունկցիան պատկերված է նման հարաբերությունների տեսքով. y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m: Այս դեպքում a2, a m-ը համարվում են «մաքուր» ռեգրեսիայի գործակիցներ։ Դրանք անհրաժեշտ են y պարամետրի միջին փոփոխությունը յուրաքանչյուր համապատասխան x պարամետրի փոփոխությամբ (նվազում կամ աճ) մեկ միավորով բնութագրելու համար՝ այլ ցուցանիշների կայուն արժեքի պայմանով։

Ոչ գծային հավասարումներն ունեն, օրինակ, ձևը հզորության գործառույթ y=ax 1 b1 x 2 b2 ...x m bm . Այս դեպքում ցուցանիշները b 1, b 2 ..... b m - կոչվում են առաձգականության գործակիցներ, դրանք ցույց են տալիս, թե ինչպես կփոխվի արդյունքը (որքանով%) համապատասխան x ցուցանիշի աճով (նվազմամբ) 1% -ով: եւ այլ գործոնների կայուն ցուցանիշով։

Ինչ գործոններ պետք է հաշվի առնել բազմակի ռեգրեսիա կառուցելիս

Բազմակի ռեգրեսիա ճիշտ կառուցելու համար անհրաժեշտ է պարզել, թե որ գործոններին պետք է հատուկ ուշադրություն դարձնել։

Անհրաժեշտ է որոշակի պատկերացում ունենալ տնտեսական գործոնների և մոդելավորված գործոնների միջև փոխհարաբերությունների բնույթի մասին: Ներառվող գործոնները պետք է համապատասխանեն հետևյալ չափանիշներին.

  • Պետք է չափելի լինի: Օբյեկտի որակը բնութագրող գործոն օգտագործելու համար, ամեն դեպքում, նրան պետք է քանակական ձև տալ։
  • Գործոնային փոխկապակցվածություն կամ ֆունկցիոնալ հարաբերություն չպետք է լինի: Նման գործողությունները ամենից հաճախ հանգեցնում են անդառնալի հետեւանքների՝ համակարգի սովորական հավասարումներդառնում է անվերապահ, և դա ենթադրում է դրա անարժանահավատությունն ու մշուշոտ գնահատականները։
  • Հսկայական հարաբերակցության ցուցանիշի դեպքում հնարավոր չէ պարզել գործոնների մեկուսացված ազդեցությունը ցուցանիշի վերջնական արդյունքի վրա, հետևաբար գործակիցները դառնում են անմեկնելի։

Շինարարության մեթոդներ

Գոյություն ունեն հսկայական թվով մեթոդներ և եղանակներ բացատրելու, թե ինչպես կարող եք ընտրել հավասարման գործոնները: Այնուամենայնիվ, այս բոլոր մեթոդները հիմնված են հարաբերակցության ինդեքսով գործակիցների ընտրության վրա: Դրանց թվում են.

  • Բացառման մեթոդ.
  • Միացնել մեթոդը:
  • Փուլային ռեգրեսիոն վերլուծություն.

Առաջին մեթոդը ներառում է բոլոր գործակիցների մաղումը ագրեգատային հավաքածուից: Երկրորդ մեթոդը ներառում է բազմաթիվ լրացուցիչ գործոնների ներդրում: Դե, երրորդը այն գործոնների վերացումն է, որոնք նախկինում կիրառվում էին հավասարման վրա: Այս մեթոդներից յուրաքանչյուրն իրավունք ունի գոյություն ունենալ: Նրանք ունեն իրենց դրական և բացասական կողմերը, բայց կարող են յուրովի լուծել ավելորդ ցուցանիշների վերացման հարցը։ Որպես կանոն, յուրաքանչյուր առանձին մեթոդով ստացված արդյունքները բավականին մոտ են։

Բազմաչափ վերլուծության մեթոդներ

Գործոնների որոշման նման մեթոդները հիմնված են փոխկապակցված հատկանիշների առանձին համակցությունների դիտարկման վրա: Դրանք ներառում են տարբերակիչ վերլուծություն, օրինաչափությունների ճանաչում, հիմնական բաղադրիչի վերլուծություն և կլաստերային վերլուծություն: Բացի այդ, կա նաև գործոնային վերլուծություն, սակայն այն առաջացել է բաղադրիչի մեթոդի մշակման արդյունքում։ Դրանք բոլորն էլ կիրառվում են որոշակի հանգամանքներում, որոշակի պայմաններում ու գործոններով։

Ի՞նչ է ռեգրեսիան:

Դիտարկենք երկու շարունակական փոփոխականներ x=(x 1, x 2, .., x n), y=(y 1, y 2, ..., y n):

Եկեք կետերը տեղադրենք 2D ցրման գծապատկերի վրա և ասենք, որ ունենք գծային հարաբերությունեթե տվյալները մոտավոր են ուղիղ գծով.

Եթե ​​ենթադրենք, որ yկախված x, և փոփոխությունները yփոփոխություններով պայմանավորված x, մենք կարող ենք սահմանել ռեգրեսիոն գիծ (հետընթաց yվրա x), որը լավագույնս նկարագրում է այս երկու փոփոխականների միջև ուղիղ գծային կապը:

«Ռեգեսիա» բառի վիճակագրական օգտագործումը գալիս է մի երևույթից, որը հայտնի է որպես ռեգրեսիա դեպի միջին, որը վերագրվում է սըր Ֆրենսիս Գալթոնին (1889):

Նա ցույց տվեց, որ թեև բարձրահասակ հայրերը հակված են բարձրահասակ տղաներ ունենալ, որդիների միջին հասակը ավելի փոքր է, քան իրենց բարձրահասակ հայրերը: Որդիների միջին հասակը «հետ է գնացել» և «հետ է շարժվել» մինչև բնակչության բոլոր հայրերի միջին հասակը։ Այսպիսով, միջինում բարձրահասակ հայրերն ունենում են ավելի ցածր (բայց դեռ բարձրահասակ) որդիներ, իսկ ցածրահասակ հայրերը՝ ավելի բարձրահասակ (բայց դեռ բավականին ցածրահասակ) որդիներ։

ռեգրեսիայի գիծ

Մաթեմատիկական հավասարում, որը գնահատում է պարզ (զույգ) գծային ռեգրեսիոն գիծ.

xկոչվում է անկախ փոփոխական կամ կանխատեսող։

Յկախված կամ պատասխան փոփոխականն է: Սա այն արժեքն է, որը մենք ակնկալում ենք y(միջին հաշվով), եթե մենք գիտենք արժեքը x, այսինքն. կանխատեսված արժեքն է y»

  • ա- գնահատման գծի անվճար անդամ (հատում); այս արժեքը Յ, երբ x=0(նկ.1):
  • բ- գնահատված գծի թեքություն կամ գրադիենտ; դա այն գումարն է, որով Յմիջինում ավելանում է, եթե ավելացնենք xմեկ միավորի համար.
  • աև բկոչվում են գնահատված գծի ռեգրեսիայի գործակիցներ, թեև այս տերմինը հաճախ օգտագործվում է միայն բ.

Զույգ գծային ռեգրեսիան կարող է ընդլայնվել՝ ներառելով մեկից ավելի անկախ փոփոխականներ. այս դեպքում այն ​​հայտնի է որպես բազմակի ռեգրեսիա.

Նկ.1. Գծային ռեգրեսիոն գիծ, ​​որը ցույց է տալիս a-ի և b թեքության հատումը (Y-ի աճի չափը, երբ x-ը մեծանում է մեկ միավորով)

Նվազագույն քառակուսի մեթոդ

Մենք կատարում ենք ռեգրեսիոն վերլուծություն՝ օգտագործելով դիտարկումների նմուշը, որտեղ աև բ- ճշմարիտ (ընդհանուր) պարամետրերի ընտրանքային գնահատականներ, α և β, որոնք որոշում են պոպուլյացիայի (ընդհանուր բնակչության) գծային ռեգրեսիայի գիծը:

Մեծ մասը պարզ մեթոդգործակիցների որոշում աև բէ նվազագույն քառակուսի մեթոդ(MNK):

Համապատասխանությունը գնահատվում է՝ հաշվի առնելով մնացորդները (գծից յուրաքանչյուր կետի ուղղահայաց հեռավորությունը, օրինակ՝ մնացորդային = դիտելի y- կանխատեսել է y, բրինձ. 2).

Լավագույն համապատասխանության գիծն ընտրված է այնպես, որ մնացորդների քառակուսիների գումարը նվազագույն լինի:

Բրինձ. 2. Գծային ռեգրեսիոն գիծ՝ պատկերված մնացորդներով (ուղղահայաց կետագծեր) յուրաքանչյուր կետի համար:

Գծային ռեգրեսիայի ենթադրություններ

Այսպիսով, յուրաքանչյուր դիտարկվող արժեքի համար մնացորդը հավասար է տարբերությանը և համապատասխան կանխատեսվածին, յուրաքանչյուր մնացորդ կարող է լինել դրական կամ բացասական:

Դուք կարող եք օգտագործել մնացորդները՝ գծային ռեգրեսիայի հետևում գտնվող հետևյալ ենթադրությունները ստուգելու համար.

  • Մնացորդները սովորաբար բաշխվում են զրոյական միջինով.

Եթե ​​գծայինության, նորմալության և/կամ հաստատուն շեղումների ենթադրությունները կասկածելի են, մենք կարող ենք փոխակերպել կամ և հաշվարկել նոր գիծռեգրեսիա, որի համար այս ենթադրությունները բավարարված են (օրինակ՝ օգտագործում լոգարիթմական փոխակերպումկամ ուրիշներ):

Աննորմալ արժեքներ (օտարներ) և ազդեցության կետեր

«Ազդեցիկ» դիտարկումը, եթե բաց թողնվի, փոխում է մեկ կամ մի քանի մոդելի պարամետրերի գնահատականներ (այսինքն՝ թեքություն կամ հատում):

Օտարը (դիտարկում, որը հակասում է տվյալների հավաքածուի արժեքների մեծ մասին) կարող է լինել «ազդեցիկ» դիտարկում և կարող է լավ հայտնաբերվել տեսողականորեն, երբ դիտում եք 2D ցրված գծապատկեր կամ մնացորդային գծապատկեր:

Ե՛վ արտանետումների, և՛ «ազդեցիկ» դիտարկումների (կետերի) համար օգտագործվում են մոդելներ և՛ դրանց ներառմամբ, և՛ առանց դրանց, ուշադրություն դարձրեք գնահատման փոփոխությանը (ռեգեսիոն գործակիցներ):

Վերլուծություն կատարելիս ինքնաբերաբար մի հրաժարվեք արտաքուստ կամ ազդեցության կետերից, քանի որ դրանք պարզապես անտեսելը կարող է ազդել արդյունքների վրա: Միշտ ուսումնասիրեք այս արտանետումների պատճառները և վերլուծեք դրանք:

Գծային ռեգրեսիայի վարկած

Գծային ռեգրեսիա կառուցելիս զրոյական վարկածը ստուգվում է, որ β ռեգրեսիոն գծի ընդհանուր թեքությունը. զրո.

Եթե ​​գծի թեքությունը զրոյական է, ապա և-ի միջև գծային հարաբերություն չկա՝ փոփոխությունը չի ազդում

Զրոյական վարկածը ստուգելու համար, որ իրական թեքությունը զրոյական է, կարող եք օգտագործել հետևյալ ալգորիթմը.

Հաշվարկեք թեստի վիճակագրությունը հավասար հարաբերակցությանը, որը ենթարկվում է ազատության աստիճաններով բաշխմանը, որտեղ գործակցի ստանդարտ սխալը


,

- մնացորդների շեղումների գնահատում.

Սովորաբար, եթե նշանակալիության մակարդակը հասել է, ապա զրոյական վարկածը մերժվում է:


որտեղ է ազատության աստիճաններով բաշխվածության տոկոսային կետը, որը տալիս է երկկողմանի թեստի հավանականությունը

Սա այն ընդմիջումն է, որը պարունակում է ընդհանուր թեքություն 95% հավանականությամբ:

Մեծ նմուշների համար, ենթադրենք, մենք կարող ենք մոտավորել 1,96 արժեքով (այսինքն, թեստի վիճակագրությունը հակված կլինի նորմալ բաշխվելու)

Գծային ռեգրեսիայի որակի գնահատում՝ որոշման գործակից R 2

Գծային հարաբերությունների պատճառով և մենք ակնկալում ենք, որ փոփոխությունները փոփոխվում են , և մենք սա անվանում ենք փոփոխություն, որը պայմանավորված է կամ բացատրվում է ռեգրեսիայով: Մնացորդային տատանումները պետք է հնարավորինս փոքր լինեն:

Եթե ​​այո, ապա տատանումների մեծ մասը կբացատրվի ռեգրեսիայով, և կետերը մոտ կլինեն ռեգրեսիոն գծին, այսինքն. տողը լավ է համապատասխանում տվյալներին:

Ընդհանուր շեղումների համամասնությունը, որը բացատրվում է ռեգրեսիայով, կոչվում է որոշման գործակիցը, սովորաբար արտահայտվում է որպես տոկոս և նշվում R2(զույգված գծային ռեգրեսիայում սա արժեք է r2, հարաբերակցության գործակցի քառակուսին), թույլ է տալիս սուբյեկտիվորեն գնահատել ռեգրեսիայի հավասարման որակը։

Տարբերությունը շեղման տոկոսն է, որը հնարավոր չէ բացատրել ռեգրեսիայով:

Չունենալով գնահատելու պաշտոնական թեստ, մենք ստիպված ենք հիմնվել սուբյեկտիվ դատողության վրա՝ որոշելու ռեգրեսիայի գծի համապատասխանության որակը:

Կանխատեսման համար ռեգրեսիայի գիծ կիրառելը

Դիտարկվող տիրույթում գտնվող արժեքից արժեքը կանխատեսելու համար կարող եք օգտագործել ռեգրեսիոն գիծ (երբեք մի արտահանեք այս սահմաններից այն կողմ):

Մենք կանխատեսում ենք որոշակի արժեք ունեցող դիտելիների միջինը՝ փոխարինելով այդ արժեքը ռեգրեսիոն գծի հավասարման մեջ:

Այսպիսով, եթե կանխատեսում ենք, քանի որ մենք օգտագործում ենք այս կանխատեսված արժեքը և դրա ստանդարտ սխալը իրական պոպուլյացիայի միջին վստահության միջակայքը գնահատելու համար:

Այս ընթացակարգի կրկնումը տարբեր արժեքների համար թույլ է տալիս ստեղծել վստահության սահմաններ այս գծի համար: Սա գոտի կամ տարածք է, որը պարունակում է իրական գիծ, ​​օրինակ, 95% վստահության մակարդակով:

Պարզ ռեգրեսիայի պլաններ

Պարզ ռեգրեսիոն նմուշները պարունակում են մեկ շարունակական կանխատեսող: Եթե ​​կան 3 դեպքեր P կանխագուշակող արժեքներով, ինչպիսիք են 7, 4 և 9, և դիզայնը ներառում է առաջին կարգի էֆեկտ P, ապա դիզայնի մատրիցը կլինի X.

ա ռեգրեսիայի հավասարումըօգտագործելով P-ը X1-ի համար, կարծես

Y = b0 + b1 P

Եթե ​​պարզ ռեգրեսիոն դիզայնը պարունակում է ավելի բարձր կարգի էֆեկտ P-ի վրա, ինչպիսին է քառակուսային էֆեկտը, ապա դիզայնի մատրիցայի X1 սյունակի արժեքները կբարձրացվեն երկրորդ հզորության.

և հավասարումը կընդունի ձևը

Y = b0 + b1 P2

Սիգմա-սահմանափակված և գերպարամետրիզացված կոդավորման մեթոդները չեն կիրառվում պարզ ռեգրեսիոն նախագծման և միայն շարունակական կանխատեսողներ պարունակող այլ նմուշների համար (քանի որ պարզապես չկան կատեգորիկ կանխատեսողներ): Անկախ ընտրված կոդավորման մեթոդից, շարունակական փոփոխականների արժեքներն ավելանում են համապատասխան հզորությամբ և օգտագործվում են որպես X փոփոխականների արժեքներ: Այս դեպքում փոխակերպում չի կատարվում: Բացի այդ, ռեգրեսիոն պլանները նկարագրելիս կարող եք բաց թողնել X պլանի մատրիցայի դիտարկումը և աշխատել միայն ռեգրեսիոն հավասարման հետ:

Օրինակ՝ Պարզ ռեգրեսիոն վերլուծություն

Այս օրինակը օգտագործում է աղյուսակում ներկայացված տվյալները.

Բրինձ. 3. Սկզբնական տվյալների աղյուսակ.

Տվյալները հիմնված են պատահականության սկզբունքով ընտրված 30 շրջաններում 1960 և 1970 թվականների մարդահամարների համեմատության վրա: Շրջանների անունները ներկայացված են որպես դիտորդական անուններ: Յուրաքանչյուր փոփոխականի վերաբերյալ տեղեկատվությունը ներկայացված է ստորև.

Բրինձ. 4. Փոփոխական բնութագրերի աղյուսակ:

Հետազոտության նպատակը

Այս օրինակի համար կվերլուծվի աղքատության մակարդակի և այն հզորության միջև հարաբերակցությունը, որը կանխատեսում է աղքատության գծից ցածր գտնվող ընտանիքների տոկոսը: Հետևաբար, մենք կվերաբերվենք 3 փոփոխականին (Pt_Poor ) որպես կախյալ փոփոխականի:

Կարելի է վարկած առաջ քաշել՝ ազգաբնակչության փոփոխությունը և աղքատության շեմից ցածր գտնվող ընտանիքների տոկոսը կապված են։ Թվում է, թե խելամիտ է ակնկալել, որ աղքատությունը հանգեցնում է բնակչության արտահոսքի, հետևաբար, բացասական հարաբերակցություն կլինի աղքատության շեմից ցածր գտնվող մարդկանց տոկոսի և բնակչության փոփոխության միջև: Հետևաբար, մենք կվերաբերվենք 1 փոփոխականին (Pop_Chng ) որպես կանխատեսող փոփոխականի:

Դիտել արդյունքները

Ռեգրեսիայի գործակիցներ

Բրինձ. 5. Ռեգրեսիայի գործակիցները Pt_Poor Pop_Chng-ի վրա:

Pop_Chng շարքի և Param-ի խաչմերուկում: Pop_Chng-ում Pt_Poor-ի ռեգրեսիայի ոչ ստանդարտացված գործակիցը -0,40374 է: Սա նշանակում է, որ բնակչության յուրաքանչյուր միավոր նվազման դեպքում կա աղքատության մակարդակի աճ .40374: Այս ոչ ստանդարտացված գործակցի վերին և ստորին (կանխադրված) 95% վստահության սահմանները չեն ներառում զրո, ուստի ռեգրեսիայի գործակիցը նշանակալի է p մակարդակում:<.05 . Обратите внимание на не стандартизованный коэффициент, который также является коэффициентом корреляции Пирсона для простых регрессионных планов, равен -.65, который означает, что для каждого уменьшения стандартного отклонения численности населения происходит увеличение стандартного отклонения уровня бедности на.65.

Փոփոխականների բաշխում

Հարաբերակցության գործակիցները կարող են զգալիորեն գերագնահատվել կամ թերագնահատվել, եթե տվյալների մեջ կան մեծ արտանետումներ: Եկեք քննենք Pt_Poor կախված փոփոխականի բաշխումն ըստ շրջանների: Դա անելու համար մենք կկառուցենք Pt_Poor փոփոխականի հիստոգրամա։

Բրինձ. 6. Pt_Poor փոփոխականի հիստոգրամ:

Ինչպես տեսնում եք, այս փոփոխականի բաշխումը զգալիորեն տարբերվում է նորմալ բաշխումից: Այնուամենայնիվ, թեև նույնիսկ երկու շրջաններ (աջ երկու սյունակներում) ունեն աղքատության գծից ցածր գտնվող ընտանիքների ավելի բարձր տոկոս, քան սպասվում էր նորմալ բաշխման դեպքում, նրանք կարծես թե գտնվում են «միջակայքի ներսում»:

Բրինձ. 7. Pt_Poor փոփոխականի հիստոգրամ։

Այս դատողությունը որոշ չափով սուբյեկտիվ է։ Հիմնական կանոնն այն է, որ արտանետումները պետք է հաշվառվեն, եթե դիտարկումը (կամ դիտարկումը) չի ընկնում միջակայքում (միջին ± 3 անգամ ստանդարտ շեղում): Տվյալ դեպքում արժե կրկնել վերլուծությունը՝ ելքերով և առանց դրանց՝ համոզվելու համար, որ դրանք լուրջ ազդեցություն չունեն բնակչության անդամների միջև փոխկապակցվածության վրա:

Scatterplot

Եթե ​​վարկածներից մեկն ապրիորի է տվյալ փոփոխականների փոխհարաբերությունների մասին, ապա օգտակար է այն ստուգել համապատասխան ցրման սյուժեի վրա։

Բրինձ. 8. Ցրված սյուժե:

Scatterplot-ը ցույց է տալիս հստակ բացասական հարաբերակցություն (-.65) երկու փոփոխականների միջև: Այն նաև ցույց է տալիս ռեգրեսիոն գծի 95% վստահության միջակայքը, այսինքն՝ 95% հավանականությամբ ռեգրեսիոն գիծն անցնում է երկու գծված կորերի միջև:

Նշանակության չափանիշներ

Բրինձ. 9. Նշանակության չափանիշները պարունակող աղյուսակ.

Pop_Chng ռեգրեսիայի գործակցի թեստը հաստատում է, որ Pop_Chng-ը խիստ կապված է Pt_Poor, p.<.001 .

Արդյունք

Այս օրինակը ցույց տվեց, թե ինչպես վերլուծել պարզ ռեգրեսիոն պլանը: Ներկայացվել է նաև ոչ ստանդարտացված և ստանդարտացված ռեգրեսիոն գործակիցների մեկնաբանություն: Քննարկվում է կախված փոփոխականի պատասխանների բաշխման ուսումնասիրության կարևորությունը և ցուցադրվում է կանխատեսողի և կախյալ փոփոխականի միջև հարաբերությունների ուղղությունն ու ուժը որոշելու տեխնիկա:

Գործոնի և արդյունքում առաջացող նշանների միջև հարաբերակցության առկայության դեպքում բժիշկները հաճախ պետք է որոշեն, թե ինչ չափով կարող է փոխվել մեկ նշանի արժեքը, երբ մյուսը փոխվում է չափման միավորով, որն ընդհանուր առմամբ ընդունված կամ հաստատված է հենց հետազոտողի կողմից:

Օրինակ՝ ինչպե՞ս կփոխվի 1-ին դասարանի դպրոցականների (աղջիկների կամ տղաների) մարմնի քաշը, եթե նրանց հասակը բարձրանա 1 սմ-ով։Այդ նպատակների համար օգտագործվում է ռեգրեսիոն վերլուծության մեթոդը։

Ամենից հաճախ ռեգրեսիոն վերլուծության մեթոդը օգտագործվում է ֆիզիկական զարգացման նորմատիվ սանդղակների և ստանդարտների մշակման համար:

  1. Ռեգրեսիայի սահմանում. Ռեգրեսիան գործառույթ է, որը թույլ է տալիս, հիմնվելով մեկ հատկանիշի միջին արժեքի վրա, որոշել մեկ այլ հատկանիշի միջին արժեքը, որը փոխկապակցված է առաջինի հետ:

    Այդ նպատակով օգտագործվում է ռեգրեսիայի գործակիցը և մի շարք այլ պարամետրեր։ Օրինակ, դուք կարող եք միջին հաշվով հաշվարկել մրսածության քանակը աշուն-ձմեռ ժամանակահատվածում օդի միջին ամսական ջերմաստիճանի որոշակի արժեքներով:

  2. Ռեգրեսիայի գործակցի սահմանում. Ռեգրեսիայի գործակիցը բացարձակ արժեք է, որով մեկ հատկանիշի արժեքը փոխվում է միջինում, երբ դրա հետ կապված մեկ այլ հատկանիշ փոխվում է չափման որոշակի միավորով:
  3. Ռեգրեսիայի գործակցի բանաձևը. R y / x \u003d r xy x (σ y / σ x)
    որտեղ R y / x - ռեգրեսիայի գործակիցը;
    r xy - հարաբերակցության գործակից x և y հատկանիշների միջև;
    (σ y և σ x) - x և y հատկանիշների ստանդարտ շեղումներ:

    Մեր օրինակում;
    σ x = 4.6 (օդի ջերմաստիճանի ստանդարտ շեղում աշուն-ձմեռ ժամանակահատվածում;
    σ y = 8,65 (վարակիչ մրսածության թվի ստանդարտ շեղում):
    Այսպիսով, R y/x-ը ռեգրեսիայի գործակիցն է:
    R y / x \u003d -0.96 x (4.6 / 8.65) \u003d 1.8, այսինքն. օդի միջին ամսական ջերմաստիճանի (x) 1 աստիճանով նվազման դեպքում աշուն-ձմեռ ժամանակահատվածում ինֆեկցիոն մրսածությունների միջին թիվը (y) կփոխվի 1,8 դեպքով։

  4. Ռեգրեսիայի հավասարում. y \u003d M y + R y / x (x - M x)
    որտեղ y-ը հատկանիշի միջին արժեքն է, որը պետք է որոշվի, երբ փոխվում է մեկ այլ հատկանիշի (x) միջին արժեքը.
    x - մեկ այլ հատկանիշի հայտնի միջին արժեքը.
    R y / x - ռեգրեսիայի գործակից;
    M x, M y - x և y հատկանիշների հայտնի միջին արժեքները:

    Օրինակ, վարակիչ մրսածության միջին թիվը (y) կարելի է որոշել առանց հատուկ չափումների օդի միջին ամսական ջերմաստիճանի ցանկացած միջին արժեքով (x): Այսպիսով, եթե x \u003d - 9 °, R y / x \u003d 1,8 հիվանդություններ, M x \u003d -7 °, M y \u003d 20 հիվանդություններ, ապա y \u003d 20 + 1,8 x (9-7) \u003d 20 + 3 .6 = 23.6 հիվանդություններ:
    Այս հավասարումն օգտագործվում է երկու հատկանիշների (x և y) միջև ուղիղ գծային հարաբերությունների դեպքում։

  5. Ռեգրեսիայի հավասարման նպատակը. Ռեգրեսիայի հավասարումն օգտագործվում է ռեգրեսիոն գիծը գծելու համար: Վերջինս թույլ է տալիս առանց հատուկ չափումների որոշել մեկ հատկանիշի ցանկացած միջին արժեքը (y), եթե փոխվում է մեկ այլ հատկանիշի արժեքը (x): Այս տվյալների հիման վրա կառուցվում է գրաֆիկ. ռեգրեսիայի գիծ, որը կարող է օգտագործվել մրսածության միջին թիվը որոշելու համար միջին ամսական ջերմաստիճանի ցանկացած արժեքով մրսածության թվի հաշվարկված արժեքների միջակայքում:
  6. Ռեգրեսիայի սիգմա (բանաձև).
    որտեղ σ Ru/x - ռեգրեսիայի սիգմա (ստանդարտ շեղում);
    σ y-ը y հատկանիշի ստանդարտ շեղումն է;
    r xy - հարաբերակցության գործակից x և y հատկանիշների միջև:

    Այսպիսով, եթե σ y-ը մրսածության թվի ստանդարտ շեղումն է = 8,65; r xy - հարաբերակցության գործակիցը մրսածության թվի (y) և օդի միջին ամսական ջերմաստիճանի միջև աշուն-ձմեռ (x) ժամանակահատվածում կազմում է - 0.96, ապա.

  7. Սիգմա ռեգրեսիայի նպատակը. Տալիս է ստացված հատկանիշի (y) բազմազանության չափման բնութագիրը։

    Օրինակ, այն բնութագրում է մրսածության քանակի բազմազանությունը աշուն-ձմեռ ժամանակահատվածում օդի միջին ամսական ջերմաստիճանի որոշակի արժեքով։ Այսպիսով, օդի ջերմաստիճանում x 1 \u003d -6 ° մրսածության միջին թիվը կարող է տատանվել 15,78 հիվանդությունից մինչև 20,62 հիվանդություն:
    x 2 = -9°-ի դեպքում մրսածության միջին թիվը կարող է տատանվել 21,18 հիվանդությունից մինչև 26,02 հիվանդություն և այլն:

    Ռեգրեսիոն սիգմա օգտագործվում է ռեգրեսիոն սանդղակի կառուցման մեջ, որն արտացոլում է արդյունավետ հատկանիշի արժեքների շեղումը ռեգրեսիոն գծի վրա գծագրված միջին արժեքից:

  8. Ռեգրեսիայի սանդղակը հաշվարկելու և գծագրելու համար անհրաժեշտ տվյալներ
    • ռեգրեսիայի գործակից - Ry/x;
    • ռեգրեսիայի հավասարում - y \u003d M y + R y / x (x-M x);
    • ռեգրեսիոն սիգմա - σ Rx/y
  9. Հաշվարկների հաջորդականությունը և ռեգրեսիայի սանդղակի գրաֆիկական ներկայացումը.
    • որոշեք ռեգրեսիայի գործակիցը բանաձևով (տես պարբերություն 3): Օրինակ, պետք է որոշել, թե միջինում որքան կփոխվի մարմնի քաշը (որոշակի տարիքում՝ կախված սեռից), եթե միջին հասակը փոխվի 1 սմ-ով։
    • ըստ ռեգրեսիայի հավասարման բանաձևի (տես պարբերություն 4), որոշեք, թե ինչ կլինի միջինը, օրինակ, մարմնի քաշը (y, y 2, y 3 ...) * որոշակի աճի արժեքի համար (x, x 2, x 3 ...):
      ________________
      * «y»-ի արժեքը պետք է հաշվարկվի առնվազն երեքի համար հայտնի արժեքներ«X».

      Միևնույն ժամանակ, հայտնի են մարմնի քաշի և հասակի միջին արժեքները (M x և M y) որոշակի տարիքի և սեռի համար.

    • հաշվարկեք ռեգրեսիայի սիգմա՝ իմանալով σ y և r xy-ի համապատասխան արժեքները և դրանց արժեքները փոխարինելով բանաձևով (տես պարբերություն 6):
    • հիմնված x 1, x 2, x 3 հայտնի արժեքների և դրանց համապատասխան միջին արժեքների վրա y 1, y 2 y 3, ինչպես նաև ամենափոքր (y - σ ru / x) և ամենամեծ (y + σ ru) / x) արժեքները (y) կառուցում են ռեգրեսիայի սանդղակ:

      Ռեգրեսիայի սանդղակի գրաֆիկական ներկայացման համար գծապատկերում նախ նշվում են x, x 2, x 3 (y առանցք) արժեքները, այսինքն. կառուցված է ռեգրեսիայի գիծ, ​​օրինակ՝ մարմնի քաշի (y) կախվածությունը բարձրությունից (x):

      Այնուհետև y 1, y 2, y 3 համապատասխան կետերում նշվում են ռեգրեսիոն սիգմայի թվային արժեքները, այսինքն. Գրաֆիկի վրա գտեք y 1, y 2, y 3 ամենափոքր և ամենամեծ արժեքները:

  10. Ռեգրեսիայի սանդղակի գործնական կիրառում. Մշակվում են նորմատիվ սանդղակներ և չափորոշիչներ, մասնավորապես ֆիզիկական զարգացման համար։ Ստանդարտ սանդղակի համաձայն՝ հնարավոր է անհատական ​​գնահատական ​​տալ երեխաների զարգացմանը։ Միևնույն ժամանակ, ֆիզիկական զարգացումը գնահատվում է որպես ներդաշնակ, եթե, օրինակ, որոշակի բարձրության վրա երեխայի մարմնի քաշը գտնվում է մեկ ռեգրեսիոն սիգմայի սահմաններում մարմնի քաշի միջին հաշվարկված միավորի նկատմամբ՝ (y) տվյալ հասակի համար (x) ( y ± 1 σ Ry / x):

    Ֆիզիկական զարգացումը համարվում է աններդաշնակ մարմնի քաշի առումով, եթե երեխայի մարմնի քաշը որոշակի հասակի համար գտնվում է երկրորդ ռեգրեսիոն սիգմայի սահմաններում. (y ± 2 σ Ry/x)

    Ֆիզիկական զարգացումը կտրուկ աններդաշնակ կլինի ինչպես ավելորդ, այնպես էլ անբավարար մարմնի քաշի պատճառով, եթե որոշակի հասակի համար մարմնի քաշը գտնվում է ռեգրեսիայի երրորդ սիգմայի սահմաններում (y ± 3 σ Ry/x):

5 տարեկան տղաների ֆիզիկական զարգացման վիճակագրական ուսումնասիրության արդյունքների համաձայն՝ հայտնի է, որ նրանց միջին հասակը (x) 109 սմ է, իսկ մարմնի միջին քաշը (y)՝ 19 կգ։ Հասակի և մարմնի քաշի հարաբերակցության գործակիցը +0,9 է, ստանդարտ շեղումները ներկայացված են աղյուսակում։

Պահանջվում է:

  • հաշվարկել ռեգրեսիայի գործակիցը;
  • օգտագործելով ռեգրեսիայի հավասարումը, որոշեք, թե ինչպիսին կլինի 5 տարեկան տղաների մարմնի ակնկալվող քաշը x1 = 100 սմ, x2 = 110 սմ, x3 = 120 սմ բարձրությամբ;
  • հաշվարկել ռեգրեսիոն սիգմա, կառուցել ռեգրեսիայի սանդղակ, ներկայացնել դրա լուծման արդյունքները գրաֆիկորեն.
  • համապատասխան եզրակացություններ անել.

Խնդրի վիճակը և դրա լուծման արդյունքները ներկայացված են ամփոփ աղյուսակում։

Աղյուսակ 1

Խնդրի պայմանները Խնդրի լուծման արդյունքները
ռեգրեսիայի հավասարումը սիգմա ռեգրեսիա ռեգրեսիոն սանդղակ (մարմնի ակնկալվող քաշը (կգ-ով))
Մ σ r xy R y/x X ժամը σRx/y y - ս Rу/х y + ս Rу/х
1 2 3 4 5 6 7 8 9 10
Բարձրություն (x) 109 սմ ± 4,4 սմ +0,9 0,16 100 սմ 17,56 կգ ± 0,35 կգ 17,21 կգ 17,91 կգ
Մարմնի քաշը (y) 19 կգ ± 0,8 կգ 110 սմ 19,16 կգ 18,81 կգ 19,51 կգ
120 սմ 20,76 կգ 20,41 կգ 21,11 կգ

Լուծում.

Եզրակացություն.Այսպիսով, ռեգրեսիայի սանդղակը մարմնի քաշի հաշվարկված արժեքների սահմաններում թույլ է տալիս որոշել այն աճի ցանկացած այլ արժեքի համար կամ գնահատել երեխայի անհատական ​​զարգացումը: Դա անելու համար վերականգնեք ռեգրեսիայի գծին ուղղահայացը:

  1. Վլասով Վ.Վ. Համաճարակաբանություն. - M.: GEOTAR-MED, 2004. - 464 p.
  2. Լիսիցին Յու.Պ. Հանրային առողջություն և առողջապահություն. Դասագիրք ավագ դպրոցների համար. - M.: GEOTAR-MED, 2007. - 512 p.
  3. Մեդիկ Վ.Ա., Յուրիև Վ.Կ. Դասախոսությունների դասընթաց հանրային առողջության և առողջության պահպանման վերաբերյալ. Մաս 1. Հանրային առողջություն. - Մ.: Բժշկություն, 2003. - 368 էջ.
  4. Մինյաև Վ.Ա., Վիշնյակով Ն.Ի. Սոցիալական բժշկության և առողջապահության կազմակերպություն (Ուղեցույց 2 հատորով): - Սանկտ Պետերբուրգ, 1998. -528 էջ.
  5. Կուչերենկո Վ.Զ., Ագարկով Ն.Մ. և ուրիշներ Սոցիալական հիգիենա և առողջապահության կազմակերպում (Ուսուցում) - Մոսկվա, 2000 թ. - 432 էջ.
  6. Ս.Գլանց. Բժշկակենսաբանական վիճակագրություն. Per անգլերենից. - Մ., Պրակտիկա, 1998. - 459 էջ.

Ռեգրեսիոն վերլուծությունը ուսումնասիրում է որոշակի քանակի կախվածությունը մեկ այլ մեծությունից կամ մի քանի այլ մեծություններից: Ռեգրեսիոն վերլուծությունը հիմնականում օգտագործվում է միջնաժամկետ կանխատեսումների, ինչպես նաև երկարաժամկետ կանխատեսումների ժամանակ։ Միջնաժամկետ և երկարաժամկետ ժամանակահատվածները հնարավորություն են տալիս փոփոխություններ հաստատել բիզնես միջավայրում և հաշվի առնել այդ փոփոխությունների ազդեցությունը ուսումնասիրվող ցուցանիշի վրա:

Ռեգրեսիոն վերլուծություն իրականացնելու համար անհրաժեշտ է.

    ուսումնասիրված ցուցանիշների վերաբերյալ տարեկան տվյալների առկայությունը,

    միանգամյա կանխատեսումների առկայությունը, այսինքն. կանխատեսումներ, որոնք չեն բարելավվում նոր տվյալներով։

Ռեգրեսիոն վերլուծությունը սովորաբար իրականացվում է այնպիսի օբյեկտների համար, որոնք ունեն բարդ, բազմագործոն բնույթ, ինչպիսիք են ներդրումների ծավալը, շահույթը, վաճառքի ծավալը և այլն։

ժամը կանխատեսման նորմատիվ մեթոդորոշվում են որպես նպատակ ընդունված երեւույթի հնարավոր վիճակներին հասնելու ուղիներն ու ժամկետները։ Խոսքը կանխորոշված ​​նորմերի, իդեալների, խթանների և նպատակների հիման վրա երևույթի ցանկալի վիճակների ձեռքբերումը կանխատեսելու մասին է։ Նման կանխատեսումը պատասխանում է հարցին՝ ի՞նչ ճանապարհներով կարելի է հասնել ցանկալիին։ Նորմատիվ մեթոդն ավելի հաճախ օգտագործվում է ծրագրային կամ նպատակային կանխատեսումների համար։ Օգտագործվում է և՛ ստանդարտի քանակական արտահայտությունը, և՛ գնահատման գործառույթի հնարավորությունների որոշակի սանդղակը։

Բնակչության տարբեր խմբերի համար մասնագետների կողմից մշակված որոշակի պարենային և ոչ պարենային ապրանքների սպառման ֆիզիոլոգիական և ռացիոնալ նորմեր օգտագործելու դեպքում, հնարավոր է որոշել այդ ապրանքների սպառման մակարդակը: նշված նորմի ձեռքբերմանը նախորդող տարիները. Նման հաշվարկները կոչվում են ինտերպոլացիա։ Ինտերպոլացիան երևույթի ժամանակային շարքում բացակայող ցուցանիշների հաշվարկման միջոց է՝ հիմնված հաստատված հարաբերությունների վրա։ Հաշվի առնելով ցուցիչի իրական արժեքը և դրա ստանդարտների արժեքը որպես դինամիկ շարքի ծայրահեղ անդամներ, հնարավոր է որոշել այս շարքի արժեքների մեծությունը: Հետեւաբար, ինտերպոլացիան համարվում է նորմատիվ մեթոդ: Նախկինում տրված բանաձևը (4), որն օգտագործվում է էքստրապոլացիայի մեջ, կարող է օգտագործվել ինտերպոլացիայի մեջ, որտեղ y n-ն այլևս չի բնութագրի իրական տվյալները, այլ ցուցիչի ստանդարտը:

Եթե ​​նորմատիվ մեթոդում օգտագործվում է գնահատման ֆունկցիայի հնարավորությունների սանդղակը (դաշտը, սպեկտրը), այսինքն՝ նախապատվությունների բաշխման ֆունկցիան, նշվում է մոտավորապես հետևյալ աստիճանավորումը՝ անցանկալի - պակաս ցանկալի - ավելի ցանկալի - ամենացանկալի - օպտիմալ ( նորմատիվ):

Կանխատեսման նորմատիվ մեթոդը օգնում է մշակել առաջարկություններ՝ բարձրացնելու օբյեկտիվության մակարդակը, հետևաբար՝ որոշումների արդյունավետությունը:

Մոդելավորում, թերեւս ամենադժվար կանխատեսման մեթոդը։ Մաթեմատիկական մոդելավորում նշանակում է տնտեսական երևույթի նկարագրություն մաթեմատիկական բանաձևերի, հավասարումների և անհավասարությունների միջոցով։ Մաթեմատիկական ապարատը պետք է ճշգրիտ արտացոլի կանխատեսման ֆոնը, թեև բավականին դժվար է ամբողջությամբ արտացոլել կանխատեսվող օբյեկտի ամբողջ խորությունն ու բարդությունը: «Մոդել» տերմինը առաջացել է լատիներեն modelus բառից, որը նշանակում է «չափել»։ Ուստի ավելի ճիշտ կլինի մոդելավորումը դիտարկել ոչ թե որպես կանխատեսման մեթոդ, այլ որպես մոդելի վրա նմանատիպ երեւույթի ուսումնասիրման մեթոդ։

Լայն իմաստով մոդելները կոչվում են ուսումնասիրության առարկայի փոխարինողներ, որոնք այնպիսի նմանության մեջ են նրա հետ, որ թույլ են տալիս նոր գիտելիքներ ստանալ օբյեկտի մասին։ Մոդելը պետք է դիտարկել որպես օբյեկտի մաթեմատիկական նկարագրություն: Այս դեպքում մոդելը սահմանվում է որպես երևույթ (օբյեկտ, տեղադրում), որը որոշակի համապատասխանության մեջ է ուսումնասիրվող օբյեկտի հետ և կարող է փոխարինել այն հետազոտության գործընթացում՝ ներկայացնելով տվյալ օբյեկտի մասին տեղեկատվություն։

Մոդելի ավելի նեղ ընկալմամբ այն համարվում է որպես կանխատեսման օբյեկտ, դրա ուսումնասիրությունը թույլ է տալիս տեղեկատվություն ստանալ ապագայում օբյեկտի հնարավոր վիճակների և այդ վիճակներին հասնելու ուղիների մասին: Այս դեպքում կանխատեսող մոդելի նպատակն է տեղեկատվություն ստանալ ոչ թե օբյեկտի մասին ընդհանրապես, այլ միայն նրա ապագա վիճակների մասին։ Այնուհետև մոդել կառուցելիս անհնար է ուղղակիորեն ստուգել դրա համապատասխանությունը օբյեկտին, քանի որ մոդելը ներկայացնում է միայն իր ապագա վիճակը, իսկ օբյեկտն ինքը ներկայումս կարող է բացակայել կամ այլ գոյություն ունենալ:

Մոդելները կարող են լինել նյութական և իդեալական:

Տնտեսագիտության մեջ օգտագործվում են իդեալական մոդելներ։ Սոցիալ-տնտեսական (տնտեսական) երևույթի քանակական նկարագրության ամենակատարյալ իդեալական մոդելը մաթեմատիկական մոդելն է, որն օգտագործում է թվեր, բանաձևեր, հավասարումներ, ալգորիթմներ կամ գրաֆիկական պատկեր: Տնտեսական մոդելների օգնությամբ որոշեք.

    տարբեր տնտեսական ցուցանիշների փոխհարաբերությունները.

    ցուցանիշների վրա դրված տարբեր տեսակի սահմանափակումներ.

    գործընթացի օպտիմալացման չափանիշներ:

Օբյեկտի իմաստալից նկարագրությունը կարող է ներկայացվել նրա պաշտոնականացված սխեմայի տեսքով, որը ցույց է տալիս, թե որ պարամետրերն ու նախնական տեղեկատվությունը պետք է հավաքվեն պահանջվող արժեքները հաշվարկելու համար: Մաթեմատիկական մոդելը, ի տարբերություն պաշտոնական սխեմայի, պարունակում է օբյեկտը բնութագրող կոնկրետ թվային տվյալներ: Մաթեմատիկական մոդելի զարգացումը մեծապես կախված է մոդելավորվող գործընթացի էության մասին կանխատեսողի պատկերացումներից: Հիմնվելով իր պատկերացումների վրա՝ նա առաջ է քաշում աշխատանքային վարկած, որի օգնությամբ ստեղծվում է մոդելի վերլուծական գրառում՝ բանաձևերի, հավասարումների և անհավասարությունների տեսքով։ Հավասարումների համակարգի լուծման արդյունքում ստացվում են ֆունկցիայի կոնկրետ պարամետրեր, որոնք նկարագրում են ժամանակի ընթացքում ցանկալի փոփոխականների փոփոխությունը։

Աշխատանքի կարգը և հաջորդականությունը, որպես կանխատեսման կազմակերպման տարր, որոշվում է կախված կիրառվող կանխատեսման մեթոդից: Սովորաբար այս աշխատանքն իրականացվում է մի քանի փուլով.

Փուլ 1 - կանխատեսող հետահայացություն, այսինքն՝ կանխատեսման օբյեկտի և կանխատեսման ֆոնի ստեղծում: Առաջին փուլում աշխատանքը կատարվում է հետևյալ հաջորդականությամբ.

    անցյալում օբյեկտի նկարագրության ձևավորում, որը ներառում է օբյեկտի նախնական կանխատեսման վերլուծություն, դրա պարամետրերի գնահատում, դրանց նշանակությունը և փոխհարաբերությունները,

    տեղեկատվության աղբյուրների նույնականացում և գնահատում, դրանց հետ աշխատանքի կարգը և կազմակերպումը, հետադարձ տեղեկատվության հավաքագրումն ու տեղադրումը.

    հետազոտության նպատակների սահմանում.

Կատարելով կանխատեսող հետահայաց առաջադրանքները՝ կանխատեսողները ուսումնասիրում են օբյեկտի զարգացման պատմությունը և կանխատեսման նախապատմությունը՝ դրանց համակարգված նկարագրությունը ստանալու համար։

2-րդ փուլ - կանխատեսող ախտորոշում, որի ընթացքում ուսումնասիրվում է կանխատեսման օբյեկտի և կանխատեսման նախապատմության համակարգված նկարագրությունը՝ դրանց զարգացման միտումները բացահայտելու և կանխատեսման մոդելներն ու մեթոդները ընտրելու համար: Աշխատանքը կատարվում է հետևյալ հաջորդականությամբ.

    կանխատեսվող օբյեկտի մոդելի մշակում, ներառյալ օբյեկտի պաշտոնական նկարագրությունը, ստուգելով մոդելի համապատասխանության աստիճանը օբյեկտին.

    կանխատեսման մեթոդների ընտրություն (հիմնական և օժանդակ), ալգորիթմի և աշխատանքային ծրագրերի մշակում։

3-րդ փուլ՝ հովանավորչություն, այսինքն՝ կանխատեսման լայնածավալ մշակման գործընթացը, ներառյալ՝ 1) կանխատեսվող պարամետրերի հաշվարկը տվյալ առաջատար ժամանակահատվածի համար. 2) կանխատեսման առանձին բաղադրիչների սինթեզ.

4-րդ փուլ՝ կանխատեսման գնահատում, ներառյալ դրա ստուգումը, այսինքն՝ հավաստիության, ճշգրտության և վավերականության աստիճանի որոշումը:

Հետախուզման և գնահատման ընթացքում կանխատեսման խնդիրները և դրա գնահատումը լուծվում են նախորդ փուլերի հիման վրա:

Նշված փուլավորումը մոտավոր է և կախված է հիմնական կանխատեսման մեթոդից:

Կանխատեսման արդյունքները կազմվում են վկայագրի, հաշվետվության կամ այլ նյութի տեսքով և ներկայացվում հաճախորդին:

Կանխատեսման ժամանակ կարելի է նշել կանխատեսման շեղումը օբյեկտի իրական վիճակից, որը կոչվում է կանխատեսման սխալ, որը հաշվարկվում է բանաձևով.

;
;
. (9.3)

Կանխատեսման սխալների աղբյուրները

Հիմնական աղբյուրները կարող են լինել.

1. Անցյալից տվյալների պարզ փոխանցում (էքստրապոլացիա) ապագա (օրինակ՝ ընկերությունը չունի կանխատեսման այլ տարբերակներ, բացառությամբ վաճառքի 10% աճի)։

2. Իրադարձության հավանականությունը և ուսումնասիրվող օբյեկտի վրա դրա ազդեցությունը ճշգրիտ որոշելու անկարողությունը:

3. Պլանի իրականացման վրա ազդող չնախատեսված դժվարություններ (խաթարող իրադարձություններ), օրինակ՝ վաճառքի բաժնի ղեկավարի հանկարծակի հեռացումը:

Ընդհանուր առմամբ, կանխատեսման ճշգրտությունը մեծանում է կանխատեսման փորձի կուտակման և դրա մեթոդների մշակման հետ:

Ռեգրեսիոն վերլուծությունը ընկած է էկոնոմետրիկ մոդելների մեծ մասի ստեղծման հիմքում, որոնց թվում պետք է ներառվեն ծախսերի գնահատման մոդելները: Գնահատման մոդելներ կառուցելու համար այս մեթոդը կարող է օգտագործվել, եթե անալոգների (համեմատելի օբյեկտների) և ծախսերի գործոնների քանակը (համեմատման տարրեր) փոխկապակցված են հետևյալ կերպ. Պ> (5 -g-10) x դեպի,դրանք. պետք է լինի 5-10 անգամ ավելի շատ անալոգներ, քան ծախսերի գործոնները: Տվյալների քանակի և գործոնների քանակի հարաբերակցության նույն պահանջը կիրառվում է այլ խնդիրների դեպքում. ուղղիչ ինդեքսների հաշվարկման կարգի հիմնավորում; գների միտումների պարզաբանում; մաշվածության և ազդող գործոնների փոփոխությունների միջև կապ հաստատելը. ծախսերի ստանդարտների հաշվարկման համար կախվածության ձեռքբերում և այլն: Այս պահանջի կատարումն անհրաժեշտ է, որպեսզի նվազեցվի պատահական փոփոխականների նորմալ բաշխման պահանջը չբավարարող տվյալների ընտրանքի հետ աշխատելու հավանականությունը:

Հետադարձ կապը արտացոլում է միայն ստացված փոփոխականի միջին միտումը, ինչպիսին է ծախսերը, մեկ կամ մի քանի գործոն փոփոխականների փոփոխություններից, ինչպիսիք են գտնվելու վայրը, սենյակների քանակը, տարածքը, հատակը և այլն: Սա ռեգրեսիայի և ֆունկցիոնալ հարաբերությունների միջև տարբերությունն է, որի արդյունքում ստացված փոփոխականի արժեքը խստորեն սահմանված է գործոնային փոփոխականների տվյալ արժեքի համար:

Հետընթաց կապի առկայություն / ստացվածի միջև ժամըև գործոնային փոփոխականներ x p ..., x k(գործոնները) ցույց է տալիս, որ այս հարաբերությունը որոշվում է ոչ միայն ընտրված գործոնի փոփոխականների ազդեցությամբ, այլև փոփոխականների ազդեցությամբ, որոնցից մի քանիսն ընդհանուր առմամբ անհայտ են, մյուսները չեն կարող գնահատվել և հաշվի առնել.

Չհաշվառված փոփոխականների ազդեցությունը նշվում է այս հավասարման երկրորդ անդամով ?, որը կոչվում է մոտավոր սխալ:

Կան ռեգրեսիայի կախվածության հետևյալ տեսակները.

  • ? զուգակցված ռեգրեսիա - երկու փոփոխականների (արդյունք և գործոնային) հարաբերություններ.
  • ? բազմակի ռեգրեսիա - կախվածությունը մեկ արդյունքի փոփոխականից և երկու կամ ավելի գործոն փոփոխականներից, որոնք ներառված են ուսումնասիրության մեջ:

Ռեգրեսիոն վերլուծության հիմնական խնդիրն է փոփոխականների (զույգ ռեգրեսիայի) և բազմակի փոփոխականների (բազմակի ռեգրեսիայի դեպքում) հարաբերությունների սերտությունը քանակականացնելը: Հարաբերությունների խստությունը քանակականացվում է հարաբերակցության գործակիցով:

Ռեգրեսիոն վերլուծության օգտագործումը թույլ է տալիս սահմանել հիմնական գործոնների (հեդոնիկ բնութագրերի) ազդեցության օրինակը հետազոտվող ցուցիչի վրա, ինչպես դրանց ամբողջականության, այնպես էլ նրանցից յուրաքանչյուրի առանձին: Ռեգրեսիոն վերլուծության օգնությամբ, որպես մաթեմատիկական վիճակագրության մեթոդ, հնարավոր է նախ գտնել և նկարագրել ստացված (ցանկալի) փոփոխականի վերլուծական կախվածության ձևը գործոնայինից և, երկրորդ, գնահատել սերտությունը. այս կախվածությունը.

Առաջին խնդիրը լուծելով ստացվում է մաթեմատիկական ռեգրեսիոն մոդել, որի օգնությամբ այնուհետև հաշվարկվում է ցանկալի ցուցանիշը տվյալ գործոնի արժեքների համար։ Երկրորդ խնդրի լուծումը հնարավորություն է տալիս հաստատել հաշվարկված արդյունքի հավաստիությունը։

Այսպիսով, ռեգրեսիոն վերլուծությունը կարող է սահմանվել որպես ֆորմալ (մաթեմատիկական) ընթացակարգերի մի շարք, որոնք նախատեսված են արդյունքի և գործոնային փոփոխականների միջև կապի ձևի խստությունը, ուղղությունը և վերլուծական արտահայտությունը չափելու համար, այսինքն. Նման վերլուծության արդյունքը պետք է լինի կառուցվածքային և քանակապես սահմանված ձևի վիճակագրական մոդել.

որտեղ y -ստացված փոփոխականի միջին արժեքը (ցանկալի ցուցանիշի, օրինակ՝ ինքնարժեք, վարձավճար, կապիտալիզացիայի դրույքաչափ) ավելի. Պնրա դիտարկումները; x-ը գործոնի փոփոխականի արժեքն է (/-րդ ծախսերի գործակիցը); դեպի -գործոնային փոփոխականների քանակը.

Գործառույթ f (x l,...,x lc),Ստացված փոփոխականի կախվածությունը գործոնայիններից նկարագրելը կոչվում է ռեգրեսիոն հավասարում (ֆունկցիա): «Ռեգեսիա» տերմինը (հետադարձ (լատ.) - նահանջ, վերադարձ ինչ-որ բանի) կապված է մեթոդի ձևավորման փուլում լուծված կոնկրետ առաջադրանքներից մեկի առանձնահատկությունների հետ և ներկայումս չի արտացոլում մեթոդի ողջ էությունը: , բայց շարունակում է կիրառվել։

Ռեգրեսիոն վերլուծությունը սովորաբար ներառում է հետևյալ քայլերը.

  • ? միատարր առարկաների նմուշի ձևավորում և այդ օբյեկտների մասին նախնական տեղեկատվության հավաքում.
  • ? ստացված փոփոխականի վրա ազդող հիմնական գործոնների ընտրություն.
  • ? Օգտագործման նմուշի նորմալության ստուգում X 2 կամ երկանուն չափանիշ;
  • ? հաղորդակցության ձևի մասին վարկածի ընդունում.
  • ? մաթեմատիկական տվյալների մշակում;
  • ? ռեգրեսիայի մոդելի ձեռքբերում;
  • ? իր վիճակագրական ցուցանիշների գնահատում.
  • ? ստուգման հաշվարկներ՝ օգտագործելով ռեգրեսիոն մոդել;
  • ? արդյունքների վերլուծություն։

Գործողությունների նշված հաջորդականությունը տեղի է ունենում ինչպես գործակցային փոփոխականի և մեկ արդյունքի փոփոխականի միջև զույգ հարաբերությունների, այնպես էլ ստացված փոփոխականի և մի քանի գործոն փոփոխականների միջև բազմակի հարաբերությունների ուսումնասիրության ժամանակ:

Ռեգրեսիոն վերլուծության օգտագործումը որոշակի պահանջներ է դնում նախնական տեղեկատվության վրա.

  • ? Օբյեկտների վիճակագրական նմուշը պետք է լինի միատարր ֆունկցիոնալ և կառուցողական-տեխնոլոգիական առումով.
  • ? բավականին շատ;
  • ? ուսումնասիրվող ծախսերի ցուցիչը՝ ստացված փոփոխականը (գինը, ծախսերը, ծախսերը) - պետք է իջեցվի նույն պայմաններին՝ նմուշի բոլոր օբյեկտների համար դրա հաշվարկման համար.
  • ? գործոնային փոփոխականները պետք է չափվեն բավականաչափ ճշգրիտ.
  • ? գործոնային փոփոխականները պետք է լինեն անկախ կամ նվազագույն կախված:

Նմուշի միատարրության և ամբողջականության պահանջները հակասում են. որքան ավելի խստորեն է կատարվում առարկաների ընտրությունը՝ ըստ դրանց միատարրության, այնքան փոքր է նմուշը, և, ընդհակառակը, նմուշը մեծացնելու համար անհրաժեշտ է ներառել առարկաներ, որոնք. իրար շատ նման չեն.

Այն բանից հետո, երբ տվյալները հավաքագրվում են միատարր օբյեկտների խմբի համար, դրանք վերլուծվում են՝ տեսական ռեգրեսիոն գծի տեսքով ստացված և գործոնային փոփոխականների միջև փոխհարաբերությունների ձևը հաստատելու համար: Տեսական ռեգրեսիոն գիծ գտնելու գործընթացը բաղկացած է մոտավոր կորի ողջամիտ ընտրությունից և դրա հավասարման գործակիցների հաշվարկից: Ռեգրեսիոն գիծը հարթ կոր է (առանձին դեպքում՝ ուղիղ գիծ), որը մաթեմատիկական ֆունկցիայի միջոցով նկարագրում է ուսումնասիրվող կախվածության ընդհանուր միտումը և հարթեցնում է անկանոն, պատահական արտանետումները կողմնակի գործոնների ազդեցությունից:

Գնահատման առաջադրանքներում զուգակցված ռեգրեսիայի կախվածությունները ցուցադրելու համար առավել հաճախ օգտագործվում են հետևյալ գործառույթները. y - a 0 + արս + սուժ - յ - աջ&ի + գցուցադրական - y -գծային էքսպոնենցիալ - y - ա 0 + ար * + ս.Այստեղ - եմոտարկման սխալ՝ չհաշվառված պատահական գործոնների գործողության պատճառով:

Այս ֆունկցիաներում y-ը ստացված փոփոխականն է. x - գործոն փոփոխական (գործոն); ա 0 , a r a 2 -ռեգրեսիոն մոդելի պարամետրեր, ռեգրեսիոն գործակիցներ.

Գծային էքսպոնենցիալ մոդելը պատկանում է այսպես կոչված հիբրիդային մոդելների դասին.

որտեղ

որտեղ x (i = 1, /) - գործոնների արժեքներ;

b t (i = 0, /) ռեգրեսիայի հավասարման գործակիցներն են։

Այս հավասարման մեջ բաղադրիչները Ա, Բև Զհամապատասխանում են գնահատվող ակտիվի առանձին բաղադրիչների արժեքին, օրինակ՝ հողամասի արժեքին և բարելավման արժեքին և պարամետրին. Քտարածված է. Այն նախատեսված է գնահատվող ակտիվի բոլոր բաղադրիչների արժեքը կարգավորելու ընդհանուր ազդեցության գործոնի համար, ինչպիսին է գտնվելու վայրը:

Գործակիցների արժեքները, որոնք գտնվում են համապատասխան գործակիցների աստիճանում, երկուական փոփոխականներ են (0 կամ 1): Գործոնները, որոնք գտնվում են աստիճանի հիմքում, դիսկրետ կամ շարունակական փոփոխականներ են:

Բազմապատկման նշանի գործակիցների հետ կապված գործոնները նույնպես շարունակական կամ դիսկրետ են:

Հստակեցումն իրականացվում է, որպես կանոն, օգտագործելով էմպիրիկ մոտեցում և ներառում է երկու փուլ.

  • ? գրաֆիկի վրա ռեգրեսիոն դաշտի կետերի գծագրում;
  • ? հնարավոր մոտավոր կորի տեսակի գրաֆիկական (տեսողական) վերլուծություն:

Ռեգրեսիայի կորի տեսակը միշտ չէ, որ անմիջապես ընտրվում է: Այն որոշելու համար ռեգրեսիոն դաշտի կետերը նախ գծագրվում են գրաֆիկի վրա՝ ըստ նախնական տվյալների։ Այնուհետև կետերի դիրքի երկայնքով տեսողականորեն գծվում է գիծ՝ փորձելով պարզել կապի որակական օրինաչափությունը՝ միատեսակ աճ կամ միատեսակ նվազում, աճ (նվազում) դինամիկայի արագության աճով (նվազում), սահուն մոտեցում։ որոշակի մակարդակ:

Այս էմպիրիկ մոտեցումը լրացվում է տրամաբանական վերլուծությամբ՝ ելնելով ուսումնասիրված գործոնների տնտեսական և ֆիզիկական բնույթի և նրանց փոխադարձ ազդեցության մասին արդեն հայտնի պատկերացումներից։

Օրինակ՝ հայտնի է, որ ստացվող փոփոխականների՝ տնտեսական ցուցանիշների (գներ, վարձավճար) կախվածությունը մի շարք գործոնային փոփոխականներից՝ գնագոյացնող գործոններից (բնակավայրի կենտրոնից հեռավորությունը, տարածքը և այլն) ոչ գծային են։ , և դրանք կարելի է բավականին խիստ նկարագրել ուժային, էքսպոնենցիալ կամ քառակուսային ֆունկցիայով։ Բայց գործոնների փոքր միջակայքերով ընդունելի արդյունքներ կարելի է ստանալ՝ օգտագործելով գծային ֆունկցիան:

Եթե ​​դեռ անհնար է անմիջապես որևէ մեկ ֆունկցիայի վստահ ընտրություն կատարել, ապա ընտրվում են երկու կամ երեք գործառույթ, հաշվարկվում են դրանց պարամետրերը, այնուհետև, օգտագործելով կապի խստության համապատասխան չափանիշները, վերջապես ընտրվում է գործառույթը:

Տեսականորեն կորի ձևը գտնելու հետընթացը կոչվում է ճշգրտումմոդելը և դրա գործակիցները. calibrationմոդելներ.

Եթե ​​պարզվի, որ ստացված y փոփոխականը կախված է մի քանի գործոնային փոփոխականներից (գործոններից) x (, x 2, ..., x k,ապա նրանք դիմում են բազմակի ռեգրեսիայի մոդելի կառուցմանը: Սովորաբար օգտագործվում են բազմակի հաղորդակցության երեք ձև՝ գծային. y - a 0 + a x x x + ա^ x 2 + ... + a k x k,ցուցադրական - y - a 0 a*i a x t-a x b,ուժ - y - a 0 x x ix 2 a 2. .x^ կամ դրանց համակցությունները.

Էքսպոնենցիալ և էքսպոնենցիալ ֆունկցիաները ավելի ունիվերսալ են, քանի որ դրանք մոտավոր ոչ գծային հարաբերություններ են, որոնք գնահատման ընթացքում ուսումնասիրված կախվածությունների մեծ մասն են: Բացի այդ, դրանք կարող են օգտագործվել օբյեկտների գնահատման և զանգվածային գնահատման վիճակագրական մոդելավորման մեթոդի և անհատական ​​գնահատման ուղղակի համեմատության մեթոդի մեջ՝ ուղղիչ գործոններ սահմանելիս:

Կալիբրացման փուլում ռեգրեսիոն մոդելի պարամետրերը հաշվարկվում են նվազագույն քառակուսիների մեթոդով, որի էությունն այն է, որ ստացված փոփոխականի հաշվարկված արժեքների քառակուսի շեղումների գումարը. ժամը., այսինքն. հաշվարկված ըստ ընտրված հարաբերությունների հավասարման, փաստացի արժեքներից պետք է լինի նվազագույնը.

Արժեքներ ժ) (. և y.հայտնի է, հետևաբար Քմիայն հավասարման գործակիցների ֆունկցիա է։ Նվազագույնը գտնելու համար Սվերցնել մասնակի ածանցյալներ Քհավասարման գործակիցներով և հավասարեցնել դրանք զրոյի.

Արդյունքում ստանում ենք նորմալ հավասարումների համակարգ, որոնց թիվը հավասար է ցանկալի ռեգրեսիոն հավասարման որոշված ​​գործակիցների թվին։

Ենթադրենք, մենք պետք է գտնենք գծային հավասարման գործակիցները y - ա 0 + արս.Քառակուսի շեղումների գումարը հետևյալն է.

/=1

Տարբերակել ֆունկցիան Քանհայտ գործակիցներով ա 0և մասնակի ածանցյալները հավասարեցնել զրոյի.

Փոխակերպումներից հետո մենք ստանում ենք.

որտեղ Պ -բնօրինակ իրական արժեքների քանակը ժամըդրանք (անալոգների քանակը):

Ռեգրեսիոն հավասարման գործակիցների հաշվարկման վերը նշված կարգը կիրառելի է նաև ոչ գծային կախվածությունների դեպքում, եթե այդ կախվածությունները կարող են գծայինացվել, այսինքն. բերել գծային ձևի` օգտագործելով փոփոխականների փոփոխությունը: Հզոր և էքսպոնենցիալ ֆունկցիաները լոգարիթմ վերցնելուց և փոփոխականների համապատասխան փոփոխությունից հետո ձեռք են բերում գծային ձև: Օրինակ, հզորության ֆունկցիան լոգարիթմ վերցնելուց հետո ստանում է ձև. y \u003d 1n 0-ում +a x 1 ժ. Փոփոխականների փոփոխությունից հետո Y-Մեջ y, L 0 -Մեջ և թիվ X- x-ում մենք ստանում ենք գծային ֆունկցիա

Y=A0 + cijX,որի գործակիցները հայտնաբերված են վերը նկարագրվածի համաձայն:

Նվազագույն քառակուսիների մեթոդը նույնպես օգտագործվում է բազմակի ռեգրեսիայի մոդելի գործակիցները հաշվարկելու համար։ Այսպիսով, երկու փոփոխականներով գծային ֆունկցիայի հաշվարկման նորմալ հավասարումների համակարգը Xjև x 2մի շարք փոխակերպումներից հետո այն ունի հետևյալ տեսքը.

Սովորաբար այս հավասարումների համակարգը լուծվում է գծային հանրահաշվի մեթոդներով։ Բազմաթիվ էքսպոնենցիալ ֆունկցիան բերվում է գծային ձևի՝ վերցնելով լոգարիթմներ և փոխելով փոփոխականները այնպես, ինչպես զուգավորված էքսպոնենցիալ ֆունկցիան։

Հիբրիդային մոդելներ օգտագործելիս հայտնաբերվում են բազմակի ռեգրեսիայի գործակիցներ՝ օգտագործելով հաջորդական մոտարկումների մեթոդի թվային ընթացակարգերը:

Մի քանի ռեգրեսիոն հավասարումների միջև վերջնական ընտրություն կատարելու համար անհրաժեշտ է յուրաքանչյուր հավասարում ստուգել հարաբերությունների խստությունը, որը չափվում է հարաբերակցության գործակցով, շեղումով և տատանումների գործակցով: Գնահատման համար կարող եք նաև օգտագործել Ուսանողի և Ֆիշերի չափանիշները: Որքան մեծ է կապի խստությունը բացահայտում կորը, այնքան ավելի նախընտրելի է այն, բոլոր մյուս բաները հավասար են:

Եթե ​​լուծվում է նման դասի խնդիրը, երբ անհրաժեշտ է հաստատել ծախսերի ցուցիչի կախվածությունը ծախսերի գործոններից, ապա ցանկություն է առաջանում հաշվի առնել հնարավորինս շատ ազդող գործոններ և այդպիսով կառուցել ավելի ճշգրիտ բազմակի ռեգրեսիոն մոդել: հասկանալի. Այնուամենայնիվ, երկու օբյեկտիվ սահմանափակումներ խոչընդոտում են գործոնների քանակի ընդլայնմանը. Նախ, բազմակի ռեգրեսիայի մոդել կառուցելը պահանջում է օբյեկտների շատ ավելի մեծ նմուշ, քան զուգակցված մոդել կառուցելը: Ընդհանրապես ընդունված է, որ նմուշի օբյեկտների թիվը պետք է գերազանցի թվին Պգործոնները, առնվազն 5-10 անգամ: Դրանից բխում է, որ երեք ազդող գործոններով մոդել կառուցելու համար անհրաժեշտ է հավաքել մոտավորապես 20 օբյեկտների նմուշ՝ տարբեր գործոնային արժեքներով: Երկրորդ, մոդելի համար ընտրված գործոնները արժեքի ցուցիչի վրա իրենց ազդեցության մեջ պետք է բավականաչափ անկախ լինեն միմյանցից: Սա հեշտ չէ ապահովել, քանի որ նմուշը սովորաբար միավորում է նույն ընտանիքին պատկանող առարկաները, որոնցում տեղի է ունենում բազմաթիվ գործոնների կանոնավոր փոփոխություն՝ օբյեկտից առարկա:

Որակ ռեգրեսիայի մոդելներ, որպես կանոն, ստուգեք՝ օգտագործելով հետևյալ վիճակագրությունը.

Ռեգրեսիայի հավասարման սխալի ստանդարտ շեղում (գնահատման սխալ).

որտեղ Պ -նմուշի չափը (անալոգների քանակը);

դեպի -գործոնների քանակը (ծախսերի գործոններ);

Սխալ, որը չի բացատրվում ռեգրեսիայի հավասարմամբ (նկ. 3.2);

y. -ստացված փոփոխականի փաստացի արժեքը (օրինակ, արժեքը); y t -ստացված փոփոխականի հաշվարկված արժեքը:

Այս ցուցանիշը նույնպես կոչվում է գնահատման ստանդարտ սխալ (RMS սխալ) Նկարում կետերը ցույց են տալիս նմուշի հատուկ արժեքներ, խորհրդանիշը ցույց է տալիս նմուշի միջին արժեքների գիծը, թեքված գծիկ գիծը ռեգրեսիայի գիծն է:


Բրինձ. 3.2.

Գնահատման սխալի ստանդարտ շեղումը չափում է, թե իրական y արժեքները որքան են շեղվում համապատասխան հաշվարկված արժեքներից: ժամը( , ստացվել է ռեգրեսիայի մոդելի միջոցով: Եթե նմուշը, որի վրա կառուցված է մոդելը, ենթակա է նորմալ բաշխման օրենքին, ապա կարելի է պնդել, որ իրական արժեքների 68%-ը ժամըտիրույթում են ժամը ± &eռեգրեսիայի գծից, իսկ 95%-ը՝ միջակայքում ժամը ± 2դ էլ. Այս ցուցանիշը հարմար է, քանի որ չափման միավորները sg?համապատասխանեցնել չափման միավորներին ժամը,. Այս առումով, այն կարող է օգտագործվել գնահատման գործընթացում ձեռք բերված արդյունքի ճշգրտությունը նշելու համար: Օրինակ, արժեքի վկայագրում կարող եք նշել, որ շուկայական արժեքի արժեքը ստացվել է ռեգրեսիայի մոդելի միջոցով Վ 95% հավանականությամբ գտնվում է միջակայքում (V-2d,.)նախքան (ժամը + 2 դ):

Ստացված փոփոխականի տատանումների գործակիցը.

որտեղ y -ստացված փոփոխականի միջին արժեքը (Նկար 3.2):

Ռեգրեսիոն վերլուծության մեջ variation var-ի գործակիցը արդյունքի ստանդարտ շեղումն է, որն արտահայտվում է որպես արդյունքի փոփոխականի միջինի տոկոս: Տատանումների գործակիցը կարող է չափանիշ ծառայել ստացված ռեգրեսիոն մոդելի կանխատեսող որակների համար. որքան փոքր է արժեքը. var, այնքան բարձր են մոդելի կանխատեսող որակները։ Տատանումների գործակիցի օգտագործումը նախընտրելի է &e ցուցանիշից, քանի որ այն հարաբերական է: Այս ցուցանիշի գործնական կիրառման ժամանակ կարելի է խորհուրդ տալ չօգտագործել մոդել, որի տատանումների գործակիցը գերազանցում է 33%-ը, քանի որ այս դեպքում չի կարելի ասել, որ այդ նմուշները ենթակա են բաշխման նորմալ օրենքին:

Որոշման գործակից (բազմակի հարաբերակցության գործակից քառակուսի):

Այս ցուցանիշը օգտագործվում է արդյունքում ստացված ռեգրեսիոն մոդելի ընդհանուր որակը վերլուծելու համար: Այն ցույց է տալիս, թե ստացված փոփոխականի փոփոխության քանի տոկոսն է պայմանավորված մոդելում ներառված բոլոր գործոնային փոփոխականների ազդեցությամբ: Որոշման գործակիցը միշտ գտնվում է զրոյից մինչև մեկ միջակայքում: Որքան ավելի մոտ է որոշման գործակցի արժեքը միասնությանը, այնքան մոդելը ավելի լավ է նկարագրում սկզբնական տվյալների շարքը: Որոշման գործակիցը կարող է ներկայացվել մեկ այլ կերպ.

Ահա ռեգրեսիայի մոդելով բացատրված սխալը.

ա - սխալը անհասկանալի է

ռեգրեսիոն մոդել. Տնտեսական տեսանկյունից այս չափանիշը հնարավորություն է տալիս դատել, թե գնային տատանումների քանի տոկոսն է բացատրվում ռեգրեսիայի հավասարմամբ։

Ցուցանիշի ընդունման ճշգրիտ սահմանը R2անհնար է բոլոր դեպքերի համար հստակեցնել։ Պետք է հաշվի առնել և՛ ընտրանքի չափը, և՛ հավասարման իմաստալից մեկնաբանությունը: Որպես կանոն, նույն տիպի օբյեկտների վերաբերյալ տվյալներ ուսումնասիրելիս, որոնք ստացվել են մոտավորապես նույն ժամանակ, արժեքը R2չի գերազանցում 0,6-0,7 մակարդակը։ Եթե ​​կանխատեսման բոլոր սխալները զրո են, այսինքն. երբ ստացված և գործոնային փոփոխականների միջև կապը ֆունկցիոնալ է, ապա R2 =1.

Ճշգրտված որոշման գործակից.

Որոշման ճշգրտված գործակցի ներդրման անհրաժեշտությունը բացատրվում է նրանով, որ գործոնների քանակի աճով. դեպիորոշման սովորական գործակիցը գրեթե միշտ մեծանում է, բայց ազատության աստիճանների թիվը նվազում է (n - k- մեկ): Մուտքագրված ճշգրտումը միշտ նվազեցնում է արժեքը R2,քանի որ - 1) > (n-ից -մեկը): Արդյունքում արժեքը R 2 CKOf)կարող է նույնիսկ բացասական դառնալ: Սա նշանակում է, որ արժեքը R2ճշգրտումից առաջ մոտ էր զրոյի, և փոփոխականի ռեգրեսիոն հավասարմամբ բացատրված շեղումների համամասնությունը ժամըշատ փոքր.

Ռեգրեսիոն մոդելների երկու տարբերակներից, որոնք տարբերվում են որոշման ճշգրտված գործակցի արժեքով, բայց ունեն հավասարապես լավ որակի այլ չափանիշներ, նախընտրելի է որոշման ճշգրտված գործակցի մեծ արժեք ունեցող տարբերակը: Որոշման գործակիցը չի ճշգրտվում, եթե (n - k): k> 20.

Fisher հարաբերակցությունը:

Այս չափանիշն օգտագործվում է որոշման գործակցի նշանակությունը գնահատելու համար: Քառակուսիների մնացորդային գումարը կանխատեսման սխալի չափում է՝ օգտագործելով հայտնի ծախսերի արժեքների ռեգրեսիան ժամը..Դրա համեմատությունը քառակուսիների ռեգրեսիոն գումարի հետ ցույց է տալիս, թե քանի անգամ է ռեգրեսիոն կախվածությունը կանխատեսում արդյունքն ավելի լավ, քան միջինը ժամը. Գոյություն ունի կրիտիկական արժեքների աղյուսակ Ֆ ՌՖիշերի գործակիցը՝ կախված համարիչի ազատության աստիճանների քանակից - դեպի, հայտարար v 2 = p - k- 1 և նշանակության մակարդակ ա. Եթե ​​Ֆիշերի չափանիշի հաշվարկված արժեքը Ֆ Ռմեծ է աղյուսակի արժեքից, ապա որոշման գործակցի աննշանության վարկածը, այսինքն. ռեգրեսիոն հավասարման մեջ ներառված հարաբերությունների և իրականում գոյություն ունեցող հարաբերությունների անհամապատասխանության մասին, p = 1 - a հավանականությամբ մերժվում է:

Միջին մոտավոր սխալ(միջին տոկոսային շեղումը) հաշվարկվում է որպես միջին հարաբերական տարբերություն՝ արտահայտված որպես տոկոս, ստացված փոփոխականի փաստացի և հաշվարկված արժեքների միջև.

Ինչպես ավելի քիչ արժեքտվյալ ցուցանիշով, այնքան լավ է մոդելի կանխատեսման որակը: Երբ այս ցուցանիշի արժեքը 7%-ից բարձր չէ, դրանք ցույց են տալիս մոդելի բարձր ճշգրտությունը։ Եթե 8 > 15%, ցույց է տալիս մոդելի անբավարար ճշգրտությունը:

Ռեգրեսիայի գործակցի ստանդարտ սխալ.

որտեղ (/I) -1 .- մատրիցի անկյունագծային տարր (X G X) ~ 1-ից -գործոնների քանակը;

X-գործոնի փոփոխականների արժեքների մատրիցա.

X7-գործոնի փոփոխականների արժեքների փոխադրված մատրիցա;

(JL) _| մատրիցային հակադարձ մատրից է:

Որքան փոքր են այս միավորները յուրաքանչյուր ռեգրեսիայի գործակցի համար, այնքան ավելի հուսալի կլինի համապատասխան ռեգրեսիոն գործակցի գնահատումը:

Ուսանողի թեստ (t-վիճակագրություն):

Այս չափանիշը թույլ է տալիս չափել հարաբերությունների հավաստիության (նշանակության) աստիճանը տվյալ ռեգրեսիայի գործակցի շնորհիվ։ Եթե ​​հաշվարկված արժեքը տ. սեղանի արժեքից մեծ

տավ , որտեղ v - p - k - 1-ը ազատության աստիճանների թիվն է, ապա այս գործակիցը վիճակագրորեն աննշան լինելու վարկածը մերժվում է (100 - ա)% հավանականությամբ։ Գոյություն ունեն /-բաշխման հատուկ աղյուսակներ, որոնք հնարավորություն են տալիս որոշելու չափանիշի կրիտիկական արժեքը՝ ըստ նշանակության a մակարդակի և ազատության աստիճանների քանակի v. a-ի առավել հաճախ օգտագործվող արժեքը 5% է:

Multicollinearity, այսինքն. Գործոնային փոփոխականների միջև փոխհարաբերությունների ազդեցությունը հանգեցնում է դրանց սահմանափակ քանակով բավարարվելու անհրաժեշտությանը: Եթե ​​դա հաշվի չառնվի, ապա դուք կարող եք հայտնվել անտրամաբանական ռեգրեսիայի մոդելի հետ: Բազմագծայինության բացասական ազդեցությունից խուսափելու համար բազմակի ռեգրեսիոն մոդել կառուցելուց առաջ հաշվարկվում են զույգ հարաբերակցության գործակիցները. rxjxjընտրված փոփոխականների միջև X.և X

Այստեղ XjX; -երկու գործոնային փոփոխականների արտադրյալի միջին արժեքը.

XjXj-երկու գործոնային փոփոխականների միջին արժեքների արտադրյալը.

Գործոնային փոփոխականի շեղման գնահատում x..

Երկու փոփոխականները համարվում են ռեգրեսիվորեն կապված (այսինքն՝ համագիծ), եթե դրանց զույգ հարաբերակցության գործակիցը բացարձակ արժեքով խիստ մեծ է 0,8-ից: Այս դեպքում այս փոփոխականներից որևէ մեկը պետք է բացառվի քննարկումից:

Ստացված ռեգրեսիոն մոդելների տնտեսական վերլուծության հնարավորություններն ընդլայնելու համար օգտագործվում են միջինները առաձգականության գործակիցներ,որոշվում է բանաձևով.

որտեղ Xj-համապատասխան գործակցի փոփոխականի միջին արժեքը.

y -ստացված փոփոխականի միջին արժեքը; ա ես -ռեգրեսիայի գործակիցը համապատասխան գործոն փոփոխականի համար:

Էլաստիկության գործակիցը ցույց է տալիս, թե միջինում քանի տոկոսով կփոխվի ստացված փոփոխականի արժեքը, երբ գործոնի փոփոխականը փոխվի 1%-ով, այսինքն. ինչպես է ստացված փոփոխականն արձագանքում գործոնային փոփոխականի փոփոխությանը: Օրինակ, ինչպես է գինը քմ. մ մակերեսով բնակարան քաղաքի կենտրոնից հեռավորության վրա։

Որոշակի ռեգրեսիոն գործակցի նշանակության վերլուծության տեսանկյունից օգտակար է գնահատումը. որոշման մասնավոր գործակից.

Ահա ստացվածի շեղումների գնահատականը

փոփոխական. Այս գործակիցը ցույց է տալիս, թե ստացված փոփոխականի քանի տոկոս տատանումները բացատրվում են ռեգրեսիոն հավասարման մեջ ներառված /-րդ գործոն փոփոխականի փոփոխությամբ։

  • Հեդոնիկ բնութագրերը հասկացվում են որպես օբյեկտի բնութագրիչներ, որոնք արտացոլում են նրա օգտակար (արժեքավոր) հատկությունները գնորդների և վաճառողների տեսանկյունից: