प्रतिगमन विश्लेषण मॉडल में क्या आवश्यकताएं हैं। रेखीय प्रतिगमन की मूल बातें। एकाधिक प्रतिगमन के लिए सहसंबंध

प्रतिगमन विश्लेषण सबसे लोकप्रिय तरीकों में से एक है सांख्यिकीय अध्ययन. इसका उपयोग आश्रित चर पर स्वतंत्र चर के प्रभाव की डिग्री निर्धारित करने के लिए किया जा सकता है। Microsoft Excel की कार्यक्षमता में इस प्रकार के विश्लेषण को करने के लिए डिज़ाइन किए गए उपकरण हैं। आइए देखें कि वे क्या हैं और उनका उपयोग कैसे करें।

लेकिन, उस फ़ंक्शन का उपयोग करने के लिए जो आपको एक प्रतिगमन विश्लेषण करने की अनुमति देता है, सबसे पहले, आपको विश्लेषण पैकेज को सक्रिय करने की आवश्यकता है। तभी इस प्रक्रिया के लिए आवश्यक उपकरण एक्सेल रिबन पर दिखाई देंगे।


अब जब हम टैब पर जाते हैं "जानकारी", टूलबॉक्स में रिबन पर "विश्लेषण"हम एक नया बटन देखेंगे - "डेटा विश्लेषण".

प्रतिगमन विश्लेषण के प्रकार

कई प्रकार के प्रतिगमन हैं:

  • परवलयिक;
  • शक्ति;
  • लघुगणक;
  • घातीय;
  • प्रदर्शन;
  • अतिपरवलिक;
  • रेखीय प्रतिगमन।

अंतिम दृश्य के निष्पादन के बारे में प्रतिगमन विश्लेषणहम बाद में एक्सेल के बारे में और बात करेंगे।

एक्सेल में लीनियर रिग्रेशन

नीचे, एक उदाहरण के रूप में, एक तालिका है जो सड़क पर औसत दैनिक हवा का तापमान और संबंधित कार्य दिवस के लिए स्टोर ग्राहकों की संख्या दिखाती है। आइए प्रतिगमन विश्लेषण की सहायता से पता करें कि वास्तव में कैसे मौसमहवा के तापमान के रूप में एक व्यापारिक प्रतिष्ठान की उपस्थिति को प्रभावित कर सकता है।

सामान्य रैखिक प्रतिगमन समीकरण इस तरह दिखता है: Y = a0 + a1x1 + ... + axk। इस सूत्र में यूका अर्थ है वह चर जिसका प्रभाव हम अध्ययन करने का प्रयास कर रहे हैं। हमारे मामले में, यह खरीदारों की संख्या है। अर्थ एक्स- ये है कई कारकजो चर को प्रभावित करते हैं। विकल्प एकप्रतिगमन गुणांक हैं। अर्थात् वे किसी विशेष कारक के महत्व को निर्धारित करते हैं। अनुक्रमणिका के लिए खड़ा है कुलये वही कारक।


विश्लेषण परिणाम विश्लेषण

प्रतिगमन विश्लेषण के परिणाम सेटिंग्स में निर्दिष्ट स्थान पर तालिका के रूप में प्रदर्शित होते हैं।

मुख्य संकेतकों में से एक है आर स्कवेयर. यह मॉडल की गुणवत्ता को दर्शाता है। हमारे मामले में, यह गुणांक 0.705 या लगभग 70.5% है। यह गुणवत्ता का स्वीकार्य स्तर है। 0.5 से कम का रिश्ता खराब होता है।

एक अन्य महत्वपूर्ण संकेतक सेल में लाइन के चौराहे पर स्थित है "वाई-चौराहे"और कॉलम "गुणांक". यहां यह इंगित किया गया है कि Y का क्या मूल्य होगा, और हमारे मामले में, यह अन्य सभी कारकों के साथ खरीदारों की संख्या है शून्य. इस तालिका में, यह मान 58.04 है।

ग्राफ के प्रतिच्छेदन पर मान "चर X1"तथा "गुणांक" X पर Y की निर्भरता के स्तर को दर्शाता है। हमारे मामले में, यह तापमान पर स्टोर ग्राहकों की संख्या की निर्भरता का स्तर है। 1.31 के गुणांक को प्रभाव का काफी उच्च संकेतक माना जाता है।

जैसा कि आप देख सकते हैं, Microsoft Excel का उपयोग करके प्रतिगमन विश्लेषण तालिका बनाना काफी आसान है। लेकिन, केवल एक प्रशिक्षित व्यक्ति ही आउटपुट पर प्राप्त डेटा के साथ काम कर सकता है, और उनके सार को समझ सकता है।

परिणाम

तालिका 8.3क. प्रतिगमन आँकड़े
प्रतिगमन आँकड़े
एकाधिक आर 0,998364
आर स्कवेयर 0,99673
सामान्यीकृत आर-वर्ग 0,996321
मानक त्रुटि 0,42405
टिप्पणियों 10

आइए पहले तालिका 8.3a में प्रस्तुत गणनाओं के ऊपरी भाग को देखें, समाश्रयण सांख्यिकी।

मूल्य आर-वर्ग, जिसे निश्चितता का माप भी कहा जाता है, परिणामी प्रतिगमन रेखा की गुणवत्ता की विशेषता है। यह गुण मूल डेटा और रिग्रेशन मॉडल (परिकलित डेटा) के बीच पत्राचार की डिग्री द्वारा व्यक्त किया जाता है। निश्चितता का माप हमेशा अंतराल के भीतर होता है।

ज्यादातर मामलों में, आर-वर्ग मान इन मानों के बीच होता है, जिन्हें एक्सट्रीम कहा जाता है, अर्थात। शून्य और एक के बीच।

यदि आर-वर्ग का मान एक के करीब है, तो इसका मतलब है कि निर्मित मॉडल संबंधित चर की लगभग सभी परिवर्तनशीलता की व्याख्या करता है। इसके विपरीत, शून्य के करीब एक आर-वर्ग मान का अर्थ है निर्मित मॉडल की खराब गुणवत्ता।

हमारे उदाहरण में, निश्चितता का माप 0.99673 है, जो मूल डेटा के लिए प्रतिगमन रेखा के बहुत अच्छे फिट होने का संकेत देता है।

एकाधिक आर- बहु सहसंबंध का गुणांक R - स्वतंत्र चर (X) और आश्रित चर (Y) की निर्भरता की डिग्री को व्यक्त करता है।

एकाधिक आर बराबर वर्गमूलनिर्धारण के गुणांक से, यह मान शून्य से एक तक की सीमा में मान लेता है।

एक साधारण रैखिक प्रतिगमन विश्लेषण में, एकाधिक आर पियर्सन सहसंबंध गुणांक के बराबर है। दरअसल, हमारे मामले में एकाधिक आर पिछले उदाहरण (0.998364) से पियर्सन सहसंबंध गुणांक के बराबर है।

तालिका 8.3ख. प्रतिगमन गुणांक
कठिनाइयाँ मानक त्रुटि टी आंकड़ा
वाई-चौराहा 2,694545455 0,33176878 8,121757129
चर एक्स 1 2,305454545 0,04668634 49,38177965
* गणना का एक छोटा संस्करण दिया गया है

अब तालिका 8.3b में प्रस्तुत गणनाओं के मध्य भाग पर विचार करें। यहाँ, समाश्रयण गुणांक b (2.305454545) और y-अक्ष के अनुदिश ऑफसेट दिए गए हैं, अर्थात्। स्थिरांक (2.694545455)।

गणना के आधार पर, हम प्रतिगमन समीकरण इस प्रकार लिख सकते हैं:

वाई= एक्स*2.305454545+2.694545455

चर के बीच संबंध की दिशा संकेतों (नकारात्मक या सकारात्मक) के आधार पर निर्धारित की जाती है प्रतिगमन गुणांक(गुणांक बी)।

अगर साइन at प्रतिगमन गुणांक- सकारात्मक, आश्रित चर का स्वतंत्र के साथ संबंध सकारात्मक होगा। हमारे मामले में, प्रतिगमन गुणांक का संकेत सकारात्मक है, इसलिए संबंध भी सकारात्मक है।

अगर साइन at प्रतिगमन गुणांक- ऋणात्मक, आश्रित चर और स्वतंत्र चर के बीच संबंध ऋणात्मक (उलटा) है।

तालिका 8.3 सी में। अवशेषों के उत्पादन के परिणाम प्रस्तुत किए जाते हैं। इन परिणामों को रिपोर्ट में प्रदर्शित करने के लिए, "रिग्रेशन" टूल लॉन्च करते समय "अवशिष्ट" चेकबॉक्स को सक्रिय करना आवश्यक है।

शेष आहरण

तालिका 8.3ग. खंडहर
अवलोकन भविष्यवाणी Y खंडहर मानक शेष
1 9,610909091 -0,610909091 -1,528044662
2 7,305454545 -0,305454545 -0,764022331
3 11,91636364 0,083636364 0,209196591
4 14,22181818 0,778181818 1,946437843
5 16,52727273 0,472727273 1,182415512
6 18,83272727 0,167272727 0,418393181
7 21,13818182 -0,138181818 -0,34562915
8 23,44363636 -0,043636364 -0,109146047
9 25,74909091 -0,149090909 -0,372915662
10 28,05454545 -0,254545455 -0,636685276

रिपोर्ट के इस भाग का उपयोग करके, हम निर्मित प्रतिगमन रेखा से प्रत्येक बिंदु के विचलन को देख सकते हैं। सबसे बड़ा निरपेक्ष मूल्य

अध्याय 4 की सामग्री का अध्ययन करने के परिणामस्वरूप, छात्र को चाहिए:

जानना

  • प्रतिगमन विश्लेषण की बुनियादी अवधारणाएं;
  • अनुमान के तरीके और कम से कम वर्गों की विधि के अनुमानों के गुण;
  • महत्व परीक्षण और समीकरण और प्रतिगमन गुणांक के अंतराल अनुमान के लिए बुनियादी नियम;

करने में सक्षम हो

  • नमूना डेटा से प्रतिगमन समीकरणों के द्वि-आयामी और कई मॉडलों के मापदंडों का अनुमान लगाएं, उनके गुणों का विश्लेषण करें;
  • समीकरण और समाश्रयण गुणांकों के महत्व की जाँच कर सकेंगे;
  • महत्वपूर्ण मापदंडों के अंतराल अनुमान खोजें;

अपना

  • द्वि-आयामी और बहु-प्रतिगमन समीकरणों के मापदंडों के सांख्यिकीय आकलन के कौशल; प्रतिगमन मॉडल की पर्याप्तता की जांच करने के लिए कौशल;
  • विश्लेषणात्मक सॉफ्टवेयर का उपयोग करके सभी महत्वपूर्ण गुणांकों के साथ प्रतिगमन समीकरण प्राप्त करने में कौशल।

मूल अवधारणा

के बाद सहसंबंध विश्लेषण, जब चर के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंधों की उपस्थिति का पता चला है और उनकी जकड़न की डिग्री का आकलन किया गया है, तो वे आमतौर पर प्रतिगमन विश्लेषण विधियों का उपयोग करके निर्भरता के प्रकार के गणितीय विवरण के लिए आगे बढ़ते हैं। इस प्रयोजन के लिए, कार्यों का एक वर्ग चुना जाता है जो प्रभावी संकेतक को जोड़ता है परऔर तर्क„ बाधा समीकरण के मापदंडों के अनुमानों की गणना करते हैं और परिणामी समीकरण की सटीकता का विश्लेषण करते हैं।

फ़ंक्शन | प्रभावी सुविधा के सशर्त औसत मूल्य की निर्भरता का वर्णन परतर्कों के दिए गए मानों से, कहा जाता है प्रतिगमन समीकरण।

शब्द "प्रतिगमन" (अक्षांश से। प्रतिगमन-रिट्रीट, रिटर्न टू थिंग) अंग्रेजी मनोवैज्ञानिक और मानवविज्ञानी एफ। गैल्टन द्वारा पेश किया गया था और उनके पहले उदाहरणों में से एक के साथ जुड़ा हुआ है, जिसमें गैल्टन ने विकास की आनुवंशिकता के प्रश्न से संबंधित सांख्यिकीय डेटा को संसाधित करते हुए पाया कि यदि ऊंचाई की पिता सभी पिताओं की औसत ऊंचाई से विचलित हो जाते हैं एक्सइंच, तो उनके बेटों की ऊंचाई सभी बेटों की औसत ऊंचाई से कम से कम हो जाती है एक्सइंच पहचान की गई प्रवृत्ति को कहा जाता था माध्य के लिए प्रतिगमन।

शब्द "प्रतिगमन" सांख्यिकीय साहित्य में व्यापक रूप से उपयोग किया जाता है, हालांकि कई मामलों में यह सांख्यिकीय निर्भरता को सटीक रूप से नहीं दर्शाता है।

प्रतिगमन समीकरण के सटीक विवरण के लिए, प्रभावी संकेतक के वितरण के सशर्त नियम को जानना आवश्यक है वाईसांख्यिकीय व्यवहार में, ऐसी जानकारी प्राप्त करना आमतौर पर असंभव होता है, इसलिए, वे फ़ंक्शन के लिए उपयुक्त सन्निकटन खोजने तक सीमित होते हैं। च (एक्सतुम एक्स 2, .... एल *), घटना के प्रारंभिक सार्थक विश्लेषण या मूल सांख्यिकीय डेटा पर आधारित है।

संकेतक के वेक्टर के वितरण के प्रकार के बारे में व्यक्तिगत मॉडल मान्यताओं के ढांचे के भीतर<) может быть получен общий вид प्रतिगमन समीकरण, कहाँ पे। उदाहरण के लिए, इस धारणा के तहत कि संकेतकों का अध्ययन किया गया सेट गणितीय अपेक्षाओं के वेक्टर के साथ () -आयामी सामान्य वितरण कानून का पालन करता है

कहाँ, और सहप्रसरण मैट्रिक्स द्वारा,

भिन्नता कहाँ है वाई,

प्रतिगमन समीकरण (सशर्त अपेक्षा) का रूप है

इस प्रकार, यदि एक बहुभिन्नरूपी यादृच्छिक चर ()

()-आयामी सामान्य वितरण कानून का पालन करता है, फिर प्रभावी संकेतक के प्रतिगमन समीकरण परव्याख्यात्मक चर में रैखिक है एक्सदृश्य।

हालांकि, सांख्यिकीय अभ्यास में, किसी को आम तौर पर अज्ञात सच्चे प्रतिगमन समारोह के लिए उपयुक्त अनुमानों को खोजने के लिए खुद को सीमित करना पड़ता है एफ (एक्स),चूंकि शोधकर्ता को विश्लेषण किए गए प्रदर्शन संकेतक के संभाव्यता वितरण के सशर्त कानून का सटीक ज्ञान नहीं है परतर्कों के दिए गए मानों के लिए एक्स।

सत्य, मॉडल और प्रतिगमन अनुमानों के बीच संबंध पर विचार करें। प्रदर्शन संकेतक दें परतर्क से जुड़े एक्सअनुपात

जहां एक सामान्य वितरण कानून के साथ एक यादृच्छिक चर है, इसके अलावा। इस मामले में वास्तविक प्रतिगमन कार्य है

मान लीजिए कि हम वास्तविक प्रतिगमन समीकरण के सटीक रूप को नहीं जानते हैं, लेकिन हमारे पास अंजीर में दिखाए गए संबंधों से संबंधित दो-आयामी यादृच्छिक चर पर नौ अवलोकन हैं। 4.1.

चावल। 4.1. सत्य की सापेक्ष स्थितिएफ (एक्स) और सैद्धांतिकबहुत खूबप्रतिगमन मॉडल

अंजीर में बिंदुओं का स्थान। 4.1 हमें खुद को फॉर्म की रैखिक निर्भरता के वर्ग तक सीमित रखने की अनुमति देता है

कम से कम वर्ग विधि का उपयोग करके, हम प्रतिगमन समीकरण के लिए एक अनुमान पाते हैं।

तुलना के लिए, अंजीर में। 4.1 ट्रू रिग्रेशन फंक्शन और सैद्धांतिक सन्निकटन रिग्रेशन फंक्शन के ग्राफ़ दिखाता है। प्रतीपगमन समीकरण का अनुमान संभाव्यता में बाद वाले में परिवर्तित होता है बहुत खूबनमूना आकार () में असीमित वृद्धि के साथ।

चूंकि हमने गलती से एक सच्चे प्रतिगमन फ़ंक्शन के बजाय एक रैखिक प्रतिगमन फ़ंक्शन चुना है, जो दुर्भाग्य से, सांख्यिकीय अनुसंधान के अभ्यास में काफी सामान्य है, हमारे सांख्यिकीय निष्कर्षों और अनुमानों में स्थिरता संपत्ति नहीं होगी, अर्थात। कोई फर्क नहीं पड़ता कि हम अवलोकनों की मात्रा को कितना बढ़ा देते हैं, हमारा नमूना अनुमान वास्तविक प्रतिगमन समारोह में परिवर्तित नहीं होगा

यदि हमने प्रतिगमन कार्यों के वर्ग को सही ढंग से चुना था, तो विवरण में अशुद्धि का उपयोग कर बहुत खूबकेवल नमूने की सीमितता द्वारा समझाया जाएगा और इसलिए, इसे मनमाने ढंग से छोटा बनाया जा सकता है

प्रारंभिक सांख्यिकीय डेटा से प्रभावी संकेतक और अज्ञात प्रतिगमन फ़ंक्शन के सशर्त मूल्य को सर्वोत्तम रूप से पुनर्स्थापित करने के लिए, निम्नलिखित का सबसे अधिक बार उपयोग किया जाता है: पर्याप्तता मानदंडहानि कार्य।

1. कम से कम वर्ग विधि,जिसके अनुसार प्रभावी संकेतक के प्रेक्षित मूल्यों का वर्ग विचलन, मॉडल मूल्यों से कम से कम किया जाता है, जहां प्रतिगमन समीकरण के गुणांक; "-एम अवलोकन में तर्कों के वेक्टर के मान हैं। :

वेक्टर का अनुमान लगाने की समस्या का समाधान किया जा रहा है। परिणामी प्रतिगमन कहा जाता है मध्य चौक।

2. कम से कम मॉड्यूल की विधि, जिसके अनुसार मॉड्यूलर मूल्यों से प्रभावी संकेतक के देखे गए मूल्यों के पूर्ण विचलन का योग कम से कम है, अर्थात।

परिणामी प्रतिगमन कहा जाता है मतलब निरपेक्ष(माध्य)।

3. मिनिमैक्स विधिप्रभावी संकेतक के देखे गए मूल्य के अधिकतम विचलन मॉड्यूल को कम करने के लिए कम किया जाता है वाई,मॉडल मूल्य से, अर्थात्।

परिणामी प्रतिगमन कहा जाता है मिनिमैक्स

व्यावहारिक अनुप्रयोगों में, अक्सर ऐसी समस्याएं होती हैं जिनमें यादृच्छिक चर का अध्ययन किया जाता है वाई,चर और अज्ञात मापदंडों के कुछ सेट के आधार पर। हम () के रूप में विचार करेंगे (के + 1)-आयामी सामान्य जनसंख्या, जिसमें से मात्रा का एक यादृच्छिक नमूना पी,जहां () /-वें अवलोकन का परिणाम है। टिप्पणियों के परिणामों के आधार पर अज्ञात मापदंडों का अनुमान लगाना आवश्यक है। ऊपर वर्णित कार्य प्रतिगमन विश्लेषण के कार्यों को संदर्भित करता है।

प्रतिगमन विश्लेषण यादृच्छिक चर की निर्भरता के सांख्यिकीय विश्लेषण की विधि को कॉल करें परप्रतिगमन विश्लेषण में गैर-यादृच्छिक चर के रूप में माने जाने वाले चरों पर, वास्तविक वितरण कानून की परवाह किए बिना

अपने अध्ययन के दौरान, छात्रों को अक्सर कई तरह के समीकरणों का सामना करना पड़ता है। उनमें से एक - प्रतिगमन समीकरण - इस लेख में माना जाता है। इस प्रकार के समीकरण का उपयोग विशेष रूप से गणितीय मापदंडों के बीच संबंधों की विशेषताओं का वर्णन करने के लिए किया जाता है। इस प्रकार की समानता का उपयोग सांख्यिकी और अर्थमिति में किया जाता है।

प्रतिगमन की परिभाषा

गणित में, प्रतिगमन को एक निश्चित मात्रा के रूप में समझा जाता है जो किसी अन्य मात्रा के मूल्यों पर सेट किए गए डेटा के औसत मूल्य की निर्भरता का वर्णन करता है। समाश्रयण समीकरण, किसी विशेष विशेषता के फलन के रूप में, किसी अन्य विशेषता के औसत मान को दर्शाता है। प्रतिगमन फ़ंक्शन में एक साधारण समीकरण y \u003d x का रूप होता है, जिसमें y एक आश्रित चर के रूप में कार्य करता है, और x एक स्वतंत्र चर (सुविधा कारक) है। वास्तव में, समाश्रयण को y = f (x) के रूप में व्यक्त किया जाता है।

चरों के बीच संबंध कितने प्रकार के होते हैं

सामान्य तौर पर, दो विपरीत प्रकार के संबंध प्रतिष्ठित होते हैं: सहसंबंध और प्रतिगमन।

पहले सशर्त चर की समानता की विशेषता है। इस मामले में, यह निश्चित रूप से ज्ञात नहीं है कि कौन सा चर दूसरे पर निर्भर करता है।

यदि चरों और शर्तों के बीच कोई समानता नहीं है, तो कहते हैं कि कौन सा चर व्याख्यात्मक है और कौन सा निर्भर है, तो हम दूसरे प्रकार के कनेक्शन की उपस्थिति के बारे में बात कर सकते हैं। एक रैखिक प्रतिगमन समीकरण बनाने के लिए, यह पता लगाना आवश्यक होगा कि किस प्रकार का संबंध देखा जाता है।

प्रतिगमन के प्रकार

आज तक, प्रतिगमन के 7 अलग-अलग प्रकार हैं: अतिपरवलयिक, रैखिक, एकाधिक, अरेखीय, जोड़ीवार, उलटा, लघुगणकीय रैखिक।

अतिशयोक्तिपूर्ण, रैखिक और लघुगणक

रेखीय प्रतीपगमन समीकरण का प्रयोग सांख्यिकी में समीकरण के प्राचलों को स्पष्ट रूप से समझाने के लिए किया जाता है। यह y = c + m * x + E जैसा दिखता है। हाइपरबोलिक समीकरण में एक नियमित हाइपरबोला y \u003d c + m / x + E का रूप होता है। लॉगरिदमिक रूप से रैखिक समीकरण लॉगरिदमिक फ़ंक्शन का उपयोग करके संबंध को व्यक्त करता है: y \u003d में c + m * में x + में E।

एकाधिक और गैर-रैखिक

दो और जटिल प्रकार के प्रतिगमन बहु और गैर-रेखीय हैं। बहु समाश्रयण समीकरण फ़ंक्शन y \u003d f (x 1, x 2 ... x c) + E द्वारा व्यक्त किया जाता है। इस स्थिति में, y आश्रित चर है और x व्याख्यात्मक चर है। चर ई स्टोकेस्टिक है और समीकरण में अन्य कारकों के प्रभाव को शामिल करता है। गैर-रैखिक प्रतिगमन समीकरण थोड़ा असंगत है। एक ओर, ध्यान में रखे गए संकेतकों के संबंध में, यह रैखिक नहीं है, और दूसरी ओर, संकेतकों के आकलन की भूमिका में, यह रैखिक है।

व्युत्क्रम और जोड़ीदार प्रतिगमन

व्युत्क्रम एक प्रकार का कार्य है जिसे एक रैखिक रूप में परिवर्तित करने की आवश्यकता होती है। सबसे पारंपरिक अनुप्रयोग कार्यक्रमों में, इसका एक फ़ंक्शन y \u003d 1 / c + m * x + E का रूप होता है। युग्मित प्रतिगमन समीकरण डेटा के बीच संबंध को y = f(x) + E के एक फलन के रूप में दर्शाता है। अन्य समीकरणों की तरह, y x पर निर्भर करता है और E एक स्टोकेस्टिक पैरामीटर है।

सहसंबंध की अवधारणा

यह एक संकेतक है जो दो घटनाओं या प्रक्रियाओं के बीच संबंध के अस्तित्व को प्रदर्शित करता है। रिश्ते की ताकत को सहसंबंध गुणांक के रूप में व्यक्त किया जाता है। इसका मान अंतराल [-1;+1] के भीतर उतार-चढ़ाव करता है। एक नकारात्मक संकेतक प्रतिक्रिया की उपस्थिति को इंगित करता है, एक सकारात्मक संकेतक एक प्रत्यक्ष को इंगित करता है। यदि गुणांक 0 के बराबर मान लेता है, तो कोई संबंध नहीं है। मान 1 के जितना करीब होगा - मापदंडों के बीच संबंध उतना ही मजबूत होगा, 0 के करीब - कमजोर।

तरीकों

सहसंबंध पैरामीट्रिक विधियां रिश्ते की मजबूती का अनुमान लगा सकती हैं। उनका उपयोग वितरण अनुमानों के आधार पर उन मानकों का अध्ययन करने के लिए किया जाता है जो सामान्य वितरण कानून का पालन करते हैं।

रैखिक प्रतिगमन समीकरण के पैरामीटर निर्भरता के प्रकार, प्रतिगमन समीकरण के कार्य की पहचान करने और चुने हुए संबंध सूत्र के संकेतकों का मूल्यांकन करने के लिए आवश्यक हैं। संबंध की पहचान के लिए एक विधि के रूप में सहसंबंध क्षेत्र का उपयोग किया जाता है। ऐसा करने के लिए, सभी मौजूदा डेटा को ग्राफिक रूप से दर्शाया जाना चाहिए। एक आयताकार द्वि-आयामी समन्वय प्रणाली में, सभी ज्ञात डेटा को प्लॉट किया जाना चाहिए। इस प्रकार सहसंबंध क्षेत्र बनता है। वर्णन करने वाले कारक का मान भुज के साथ चिह्नित किया जाता है, जबकि आश्रित कारक के मान कोर्डिनेट के साथ चिह्नित किया जाता है। यदि मापदंडों के बीच एक कार्यात्मक संबंध है, तो वे एक पंक्ति के रूप में पंक्तिबद्ध होते हैं।

यदि ऐसे डेटा का सहसंबंध गुणांक 30% से कम है, तो हम कनेक्शन की लगभग पूर्ण अनुपस्थिति के बारे में बात कर सकते हैं। यदि यह 30% और 70% के बीच है, तो यह मध्यम जकड़न के लिंक की उपस्थिति को इंगित करता है। एक 100% संकेतक एक कार्यात्मक कनेक्शन का प्रमाण है।

एक गैर-रेखीय प्रतिगमन समीकरण, एक रैखिक की तरह, एक सहसंबंध सूचकांक (R) के साथ पूरक होना चाहिए।

एकाधिक प्रतिगमन के लिए सहसंबंध

निर्धारण का गुणांक बहु सहसंबंध के वर्ग का सूचक है। वह अध्ययन के तहत विशेषता के साथ संकेतकों के प्रस्तुत सेट के संबंध की जकड़न के बारे में बोलता है। यह परिणाम पर मापदंडों के प्रभाव की प्रकृति के बारे में भी बात कर सकता है। इस सूचक का उपयोग करके बहु प्रतिगमन समीकरण का मूल्यांकन किया जाता है।

बहु सहसंबंध सूचकांक की गणना करने के लिए, इसके सूचकांक की गणना करना आवश्यक है।

कम से कम वर्ग विधि

यह विधि प्रतिगमन कारकों का अनुमान लगाने का एक तरीका है। इसका सार फलन पर कारक की निर्भरता के कारण प्राप्त वर्ग विचलन के योग को कम करने में निहित है।

इस तरह की विधि का उपयोग करके एक युग्मित रैखिक प्रतिगमन समीकरण का अनुमान लगाया जा सकता है। एक युग्मित रैखिक संबंध के संकेतकों के बीच पता लगाने के मामले में इस प्रकार के समीकरणों का उपयोग किया जाता है।

समीकरण विकल्प

रैखिक प्रतिगमन फ़ंक्शन के प्रत्येक पैरामीटर का एक विशिष्ट अर्थ होता है। युग्मित रैखिक प्रतिगमन समीकरण में दो पैरामीटर होते हैं: c और m। पैरामीटर t फ़ंक्शन y के अंतिम संकेतक में औसत परिवर्तन को दर्शाता है, जो एक पारंपरिक इकाई द्वारा चर x में कमी (वृद्धि) के अधीन है। यदि चर x शून्य है, तो फ़ंक्शन पैरामीटर c के बराबर है। यदि चर x शून्य नहीं है, तो कारक c का आर्थिक अर्थ नहीं है। फ़ंक्शन पर एकमात्र प्रभाव कारक c के सामने का चिन्ह है। यदि कोई ऋण है, तो हम कारक की तुलना में परिणाम में धीमे परिवर्तन के बारे में कह सकते हैं। यदि कोई प्लस है, तो यह परिणाम में त्वरित परिवर्तन को इंगित करता है।

प्रतीपगमन समीकरण के मान को बदलने वाले प्रत्येक पैरामीटर को समीकरण के रूप में व्यक्त किया जा सकता है। उदाहरण के लिए, गुणनखंड c का रूप c = y - mx है।

समूहीकृत डेटा

कार्य की ऐसी स्थितियां हैं जिनमें सभी सूचनाओं को विशेषता x के अनुसार समूहीकृत किया जाता है, लेकिन साथ ही, एक निश्चित समूह के लिए, आश्रित संकेतक के संबंधित औसत मूल्यों को इंगित किया जाता है। इस मामले में, औसत मान यह दर्शाते हैं कि संकेतक x पर कैसे निर्भर करता है। इस प्रकार, समूहीकृत जानकारी प्रतिगमन समीकरण को खोजने में मदद करती है। इसका उपयोग संबंध विश्लेषण के रूप में किया जाता है। हालाँकि, इस पद्धति की अपनी कमियां हैं। दुर्भाग्य से, औसत अक्सर बाहरी उतार-चढ़ाव के अधीन होते हैं। ये उतार-चढ़ाव रिश्ते के पैटर्न का प्रतिबिंब नहीं हैं, वे सिर्फ इसके "शोर" को छुपाते हैं। औसत एक रैखिक प्रतिगमन समीकरण की तुलना में संबंध के पैटर्न को बहुत खराब दिखाते हैं। हालांकि, उन्हें समीकरण खोजने के लिए आधार के रूप में इस्तेमाल किया जा सकता है। किसी विशेष जनसंख्या के आकार को संबंधित औसत से गुणा करके, आप समूह के भीतर y का योग प्राप्त कर सकते हैं। अगला, आपको सभी प्राप्त राशियों को बाहर निकालने और अंतिम संकेतक y खोजने की आवश्यकता है। योग संकेतक xy के साथ गणना करना थोड़ा अधिक कठिन है। इस घटना में कि अंतराल छोटा है, हम सशर्त रूप से सभी इकाइयों (समूह के भीतर) के लिए संकेतक x समान ले सकते हैं। x और y के गुणनफलों का योग ज्ञात करने के लिए इसे y के योग से गुणा करें। इसके अलावा, सभी योगों को एक साथ खटखटाया जाता है और कुल योग xy प्राप्त होता है।

एकाधिक जोड़ी समीकरण प्रतिगमन: एक रिश्ते के महत्व का आकलन

जैसा कि पहले चर्चा की गई थी, एकाधिक प्रतिगमन में y \u003d f (x 1, x 2, ..., x m) + E के रूप का एक कार्य होता है। सबसे अधिक बार, इस तरह के समीकरण का उपयोग माल की आपूर्ति और मांग की समस्या को हल करने के लिए किया जाता है, पुनर्खरीद शेयरों पर ब्याज आय, उत्पादन लागत फ़ंक्शन के कारणों और प्रकार का अध्ययन करना। यह व्यापक रूप से व्यापक आर्थिक अध्ययनों और गणनाओं में भी सक्रिय रूप से उपयोग किया जाता है, लेकिन सूक्ष्मअर्थशास्त्र के स्तर पर, इस तरह के समीकरण का उपयोग अक्सर कम किया जाता है।

मल्टीपल रिग्रेशन का मुख्य कार्य एक डेटा मॉडल का निर्माण करना है जिसमें बड़ी मात्रा में जानकारी होती है ताकि आगे यह निर्धारित किया जा सके कि प्रत्येक कारक का व्यक्तिगत रूप से और उनकी समग्रता में संकेतक और उसके गुणांक पर क्या प्रभाव पड़ता है। प्रतिगमन समीकरण विभिन्न मूल्यों पर ले सकता है। इस मामले में, संबंध का आकलन करने के लिए आमतौर पर दो प्रकार के कार्यों का उपयोग किया जाता है: रैखिक और अरेखीय।

एक रैखिक कार्य को इस तरह के संबंध के रूप में दर्शाया गया है: y \u003d a 0 + a 1 x 1 + a 2 x 2, + ... + a m x m। इस मामले में, a2, a m को "शुद्ध" प्रतिगमन के गुणांक माना जाता है। वे अन्य संकेतकों के स्थिर मूल्य की स्थिति के साथ, एक इकाई द्वारा प्रत्येक संबंधित पैरामीटर x में परिवर्तन (कमी या वृद्धि) के साथ पैरामीटर y में औसत परिवर्तन को चिह्नित करने के लिए आवश्यक हैं।

उदाहरण के लिए, अरैखिक समीकरणों में एक शक्ति फलन y=ax 1 b1 x 2 b2 ...x m bm का रूप होता है। इस मामले में, संकेतक बी 1, बी 2 ..... बी एम - को लोच गुणांक कहा जाता है, वे प्रदर्शित करते हैं कि संबंधित संकेतक x में 1% की वृद्धि (कमी) के साथ परिणाम कैसे बदलेगा (कितना%) और अन्य कारकों के एक स्थिर संकेतक के साथ।

एकाधिक प्रतिगमन का निर्माण करते समय किन कारकों पर विचार किया जाना चाहिए

एकाधिक प्रतिगमन को सही ढंग से बनाने के लिए, यह पता लगाना आवश्यक है कि किन कारकों पर विशेष ध्यान दिया जाना चाहिए।

आर्थिक कारकों और प्रतिरूपों के बीच संबंधों की प्रकृति की कुछ समझ होना आवश्यक है। शामिल किए जाने वाले कारकों को निम्नलिखित मानदंडों को पूरा करना चाहिए:

  • मापने योग्य होना चाहिए। किसी वस्तु की गुणवत्ता का वर्णन करने वाले कारक का उपयोग करने के लिए, किसी भी मामले में, इसे मात्रात्मक रूप दिया जाना चाहिए।
  • कोई कारक अंतर्संबंध या कार्यात्मक संबंध नहीं होना चाहिए। इस तरह की कार्रवाइयां अक्सर अपरिवर्तनीय परिणाम देती हैं - सामान्य समीकरणों की प्रणाली बिना शर्त हो जाती है, और इसके लिए इसकी अविश्वसनीयता और अस्पष्ट अनुमान शामिल होते हैं।
  • एक विशाल सहसंबंध संकेतक के मामले में, संकेतक के अंतिम परिणाम पर कारकों के पृथक प्रभाव का पता लगाने का कोई तरीका नहीं है, इसलिए, गुणांक निर्वचनीय हो जाते हैं।

निर्माण के तरीके

आप समीकरण के लिए कारकों का चयन कैसे कर सकते हैं, यह समझाने के लिए बड़ी संख्या में विधियाँ और तरीके हैं। हालाँकि, ये सभी विधियाँ सहसंबंध सूचकांक का उपयोग करके गुणांक के चयन पर आधारित हैं। उनमें से हैं:

  • बहिष्करण विधि।
  • विधि चालू करें।
  • चरणबद्ध प्रतिगमन विश्लेषण।

पहली विधि में कुल समुच्चय से सभी गुणांकों को बाहर निकालना शामिल है। दूसरी विधि में कई अतिरिक्त कारकों की शुरूआत शामिल है। खैर, तीसरा उन कारकों का उन्मूलन है जो पहले समीकरण पर लागू होते थे। इनमें से प्रत्येक विधि को अस्तित्व का अधिकार है। उनके अपने फायदे और नुकसान हैं, लेकिन वे अनावश्यक संकेतकों को बाहर निकालने के मुद्दे को अपने तरीके से हल कर सकते हैं। एक नियम के रूप में, प्रत्येक व्यक्तिगत विधि द्वारा प्राप्त परिणाम काफी करीब हैं।

बहुभिन्नरूपी विश्लेषण के तरीके

कारकों के निर्धारण के लिए ऐसी विधियां परस्पर संबंधित विशेषताओं के अलग-अलग संयोजनों पर विचार करने पर आधारित हैं। इनमें विभेदक विश्लेषण, पैटर्न मान्यता, प्रमुख घटक विश्लेषण और क्लस्टर विश्लेषण शामिल हैं। इसके अलावा, कारक विश्लेषण भी है, हालांकि, यह घटक पद्धति के विकास के परिणामस्वरूप दिखाई दिया। उन सभी को कुछ परिस्थितियों में, कुछ शर्तों और कारकों के तहत लागू किया जाता है।

आधुनिक राजनीति विज्ञान समाज में सभी घटनाओं और प्रक्रियाओं के संबंध की स्थिति से आगे बढ़ता है। समाज के राजनीतिक क्षेत्र में मौजूद संबंधों और निर्भरता का अध्ययन किए बिना घटनाओं और प्रक्रियाओं को समझना, राजनीतिक जीवन की घटनाओं की भविष्यवाणी और प्रबंधन करना असंभव है। नीति अनुसंधान के सबसे सामान्य कार्यों में से एक कुछ अवलोकन योग्य चर के बीच संबंधों का अध्ययन करना है। विश्लेषण के सांख्यिकीय तरीकों का एक पूरा वर्ग, सामान्य नाम "प्रतिगमन विश्लेषण" (या, जैसा कि इसे "सहसंबंध-प्रतिगमन विश्लेषण" भी कहा जाता है) से एकजुट होकर, इस समस्या को हल करने में मदद करता है। हालांकि, यदि सहसंबंध विश्लेषण दो चर के बीच संबंधों की ताकत का आकलन करना संभव बनाता है, तो प्रतिगमन विश्लेषण का उपयोग करके इस संबंध के प्रकार को निर्धारित करना संभव है, किसी अन्य चर के मूल्य पर किसी भी चर के मूल्य की निर्भरता की भविष्यवाणी करना संभव है। .

सबसे पहले, आइए याद रखें कि सहसंबंध क्या है। correlativeसांख्यिकीय संबंध का सबसे महत्वपूर्ण विशेष मामला कहा जाता है, जिसमें यह तथ्य होता है कि एक चर के समान मान भिन्न के अनुरूप होते हैं औसत मानदूसरा। विशेषता x के मान में परिवर्तन के साथ, विशेषता y का औसत मान स्वाभाविक रूप से बदल जाता है, जबकि प्रत्येक व्यक्तिगत मामले में विशेषता का मान पर(विभिन्न संभावनाओं के साथ) कई अलग-अलग मान ले सकते हैं।

आंकड़ों में "सहसंबंध" शब्द की उपस्थिति (और राजनीति विज्ञान अपनी समस्याओं को हल करने के लिए आंकड़ों की उपलब्धि को आकर्षित करता है, इसलिए, राजनीति विज्ञान से संबंधित एक अनुशासन है) अंग्रेजी जीवविज्ञानी और सांख्यिकीविद् फ्रांसिस गैल्टन के नाम से जुड़ा हुआ है, जिन्होंने 19वीं शताब्दी में प्रस्तावित किया था। सहसंबंध-प्रतिगमन विश्लेषण की सैद्धांतिक नींव। विज्ञान में "सहसंबंध" शब्द पहले जाना जाता था। विशेष रूप से, 18 वीं शताब्दी में जीवाश्म विज्ञान में। यह फ्रांसीसी वैज्ञानिक जॉर्जेस कुवियर द्वारा लागू किया गया था। उन्होंने तथाकथित सहसंबंध कानून पेश किया, जिसकी मदद से खुदाई के दौरान मिले जानवरों के अवशेषों के अनुसार, उनकी उपस्थिति को बहाल करना संभव था।

इस वैज्ञानिक के नाम और उसके सहसंबंध के नियम के साथ एक प्रसिद्ध कहानी जुड़ी हुई है। इसलिए, विश्वविद्यालय की छुट्टी के दिनों में, जिन छात्रों ने एक प्रसिद्ध प्रोफेसर के साथ चाल चलने का फैसला किया, उन्होंने एक छात्र के ऊपर सींग और खुरों के साथ एक बकरी की खाल खींची। वह कुवियर के बेडरूम की खिड़की पर चढ़ गया और चिल्लाया: "मैं तुम्हें खाऊंगा।" प्रोफेसर उठा, उसने सिल्हूट को देखा और उत्तर दिया: "यदि आपके सींग और खुर हैं, तो आप एक शाकाहारी हैं और मुझे नहीं खा सकते हैं। और सहसंबंध के नियम की अज्ञानता के लिए आपको एक ड्यूस मिलेगा। वह पलटा और सो गया। एक मजाक एक मजाक है, लेकिन इस उदाहरण में हम कई सहसंबंध-प्रतिगमन विश्लेषण का उपयोग करने का एक विशेष मामला देख रहे हैं। यहां प्रोफेसर ने सहसंबंध के नियम के आधार पर दो देखे गए लक्षणों (सींग और खुरों की उपस्थिति) के मूल्यों के ज्ञान के आधार पर, तीसरे गुण (जिस वर्ग से यह जानवर संबंधित है) का औसत मूल्य प्राप्त किया। एक शाकाहारी है)। इस मामले में, हम इस चर के विशिष्ट मूल्य के बारे में बात नहीं कर रहे हैं (यानी, यह जानवर नाममात्र के पैमाने पर विभिन्न मूल्यों को ले सकता है - यह एक बकरी, एक मेढ़ा या एक बैल हो सकता है ...)

अब हम "प्रतिगमन" शब्द पर चलते हैं। कड़ाई से बोलते हुए, यह उन सांख्यिकीय समस्याओं के अर्थ से जुड़ा नहीं है जिन्हें इस पद्धति की सहायता से हल किया जाता है। सुविधाओं के बीच संबंधों का अध्ययन करने के तरीकों के विकास के इतिहास के ज्ञान के आधार पर ही शब्द की व्याख्या दी जा सकती है। इस तरह के अध्ययन के पहले उदाहरणों में से एक सांख्यिकीविद् एफ। गैल्टन और के। पियर्सन का काम था, जिन्होंने दो अवलोकन योग्य संकेतों (जहां) के अनुसार पिता और उनके बच्चों के विकास के बीच एक पैटर्न खोजने की कोशिश की। एक्स-पिता की ऊंचाई और यू के आकारबच्चों की वृद्धि)। अपने अध्ययन में, उन्होंने प्रारंभिक परिकल्पना की पुष्टि की कि औसतन, लंबे पिता औसतन लंबे बच्चों की परवरिश करते हैं। कम पिता और बच्चों पर भी यही सिद्धांत लागू होता है। हालाँकि, यदि वैज्ञानिक वहाँ रुक गए होते, तो सांख्यिकी पर पाठ्यपुस्तकों में उनके कार्यों का उल्लेख कभी नहीं होता। शोधकर्ताओं ने पहले से ही पुष्टि की गई परिकल्पना के भीतर एक और पैटर्न पाया। उन्होंने यह साबित कर दिया कि बहुत लंबे पिता औसतन लंबे बच्चे पैदा करते हैं, लेकिन उन बच्चों से ऊंचाई में बहुत अलग नहीं होते जिनके पिता, हालांकि औसत से ऊपर, औसत ऊंचाई से बहुत अलग नहीं होते हैं। बहुत छोटे कद (छोटे समूह के औसत से विचलन) वाले पिता के लिए भी यही सच है - उनके बच्चे, औसतन, उन साथियों से ऊंचाई में भिन्न नहीं थे जिनके पिता केवल छोटे थे। उन्होंने इस नियमितता का वर्णन करने वाले फ़ंक्शन को बुलाया प्रतिगमन समारोह।इस अध्ययन के बाद, समान कार्यों का वर्णन करने वाले और समान तरीके से निर्मित सभी समीकरणों को प्रतिगमन समीकरण कहा जाने लगा।

प्रतिगमन विश्लेषण बहुभिन्नरूपी सांख्यिकीय डेटा विश्लेषण के तरीकों में से एक है, जो एक आश्रित और कई (या एक) स्वतंत्र चर के बीच संबंधों का अध्ययन या मॉडल करने के लिए डिज़ाइन की गई सांख्यिकीय तकनीकों का एक सेट है। आश्रित चर, आँकड़ों में स्वीकृत परंपरा के अनुसार, प्रतिक्रिया कहलाती है और इसे इस प्रकार दर्शाया जाता है वीस्वतंत्र चरों को भविष्यवक्ता कहा जाता है और इन्हें इस प्रकार दर्शाया जाता है एक्स।विश्लेषण के दौरान, कुछ चर प्रतिक्रिया से कमजोर रूप से संबंधित होंगे और अंततः विश्लेषण से बाहर कर दिए जाएंगे। आश्रित से जुड़े शेष चरों को कारक भी कहा जा सकता है।

प्रतिगमन विश्लेषण दूसरे चर (उदाहरण के लिए, शिक्षा के स्तर के आधार पर अपरंपरागत राजनीतिक व्यवहार के लिए प्रवृत्ति) या कई चर के आधार पर एक या अधिक चर के मूल्यों की भविष्यवाणी करना संभव बनाता है। इसकी गणना पीसी पर की जाती है। एक प्रतिगमन समीकरण संकलित करने के लिए जो आपको कारकों पर नियंत्रित सुविधा की निर्भरता की डिग्री को मापने की अनुमति देता है, पेशेवर गणितज्ञ-प्रोग्रामर को शामिल करना आवश्यक है। प्रतिगमन विश्लेषण एक राजनीतिक स्थिति के विकास के लिए भविष्य कहनेवाला मॉडल बनाने, सामाजिक तनाव के कारणों का आकलन करने और सैद्धांतिक प्रयोगों के संचालन में एक अमूल्य सेवा प्रदान कर सकता है। कई सामाजिक-जनसांख्यिकीय मापदंडों के नागरिकों के चुनावी व्यवहार पर प्रभाव का अध्ययन करने के लिए प्रतिगमन विश्लेषण का सक्रिय रूप से उपयोग किया जाता है: लिंग, आयु, पेशा, निवास स्थान, राष्ट्रीयता, स्तर और आय की प्रकृति।

प्रतिगमन विश्लेषण के संबंध में, अवधारणाएं स्वतंत्रतथा आश्रितचर। एक स्वतंत्र चर एक चर है जो दूसरे चर में परिवर्तन की व्याख्या या कारण बनता है। आश्रित चर एक चर है जिसका मान पहले चर के प्रभाव से समझाया जाता है। उदाहरण के लिए, 2004 में राष्ट्रपति चुनावों में, निर्धारक कारक, अर्थात। स्वतंत्र चर संकेतक थे जैसे देश की जनसंख्या की वित्तीय स्थिति का स्थिरीकरण, उम्मीदवारों की लोकप्रियता का स्तर और कारक सत्ताधारीइस मामले में, उम्मीदवारों के लिए डाले गए मतों का प्रतिशत एक आश्रित चर के रूप में माना जा सकता है। इसी तरह, "मतदाता की आयु" और "चुनावी गतिविधि का स्तर" चर के जोड़े में, पहला स्वतंत्र है, दूसरा निर्भर है।

प्रतिगमन विश्लेषण आपको निम्नलिखित समस्याओं को हल करने की अनुमति देता है:

  • 1) Ci . के बीच सांख्यिकीय रूप से महत्वपूर्ण संबंध की उपस्थिति या अनुपस्थिति के बहुत तथ्य को स्थापित करें एक्स;
  • 2) प्रतिगमन समारोह का सबसे अच्छा (सांख्यिकीय अर्थों में) अनुमानों का निर्माण करें;
  • 3) दिए गए मानों के अनुसार एक्सअज्ञात के लिए एक भविष्यवाणी बनाएँ पर
  • 4) प्रत्येक कारक के प्रभाव के विशिष्ट भार का मूल्यांकन करें एक्सपर परऔर, तदनुसार, मॉडल से महत्वहीन सुविधाओं को बाहर करें;
  • 5) चर के बीच कारण संबंधों की पहचान करके, व्याख्यात्मक चर के मूल्यों को समायोजित करके आंशिक रूप से पी के मूल्यों का प्रबंधन करें एक्स।

प्रतिगमन विश्लेषण पारस्परिक रूप से स्वतंत्र चर का चयन करने की आवश्यकता से जुड़ा है जो अध्ययन के तहत संकेतक के मूल्य को प्रभावित करते हैं, प्रतिगमन समीकरण के रूप का निर्धारण करते हैं, और प्राथमिक समाजशास्त्रीय डेटा को संसाधित करने के लिए सांख्यिकीय विधियों का उपयोग करके मापदंडों का मूल्यांकन करते हैं। इस प्रकार का विश्लेषण संबंध के रूप, दिशा और निकटता (घनत्व) के विचार पर आधारित है। अंतर करना भाप से भरा कमरातथा एकाधिक प्रतिगमनअध्ययन सुविधाओं की संख्या के आधार पर। व्यवहार में, प्रतिगमन विश्लेषण आमतौर पर सहसंबंध विश्लेषण के संयोजन में किया जाता है। प्रतिगमन समीकरणमात्राओं के बीच एक संख्यात्मक संबंध का वर्णन करता है, जिसे एक चर के बढ़ने या घटने की प्रवृत्ति के रूप में व्यक्त किया जाता है जबकि दूसरा बढ़ता या घटता है। एक ही समय में, रज़ल और ज ए यूट l ठंढतथा गैर-रैखिक प्रतिगमन।राजनीतिक प्रक्रियाओं का वर्णन करते समय, प्रतिगमन के दोनों प्रकार समान रूप से पाए जाते हैं।

राजनीतिक लेखों में रुचि की अन्योन्याश्रयता के वितरण के लिए स्कैटरप्लॉट ( यू)और उत्तरदाताओं की शिक्षा (एक्स)एक रैखिक प्रतिगमन है (चित्र 30)।

चावल। तीस।

चुनावी गतिविधि के स्तर के वितरण के लिए स्कैटरप्लॉट ( यू)और प्रतिवादी की आयु (ए) (सशर्त उदाहरण) एक गैर-रेखीय प्रतिगमन है (चित्र। 31)।


चावल। 31.

युग्मित प्रतिगमन मॉडल में दो विशेषताओं (ए "और वाई) के संबंध का वर्णन करने के लिए, एक रैखिक समीकरण का उपयोग किया जाता है

जहाँ a, सुविधाओं की भिन्नता के साथ समीकरण की त्रुटि का एक यादृच्छिक मान है, अर्थात। "रैखिकता" से समीकरण का विचलन।

गुणांक का मूल्यांकन करने के लिए एकतथा बीकम से कम वर्ग विधि का उपयोग करें, जो मानता है कि प्रतिगमन रेखा से स्कैटर प्लॉट पर प्रत्येक बिंदु के वर्ग विचलन का योग न्यूनतम होना चाहिए। कठिनाइयाँ ए एच बीसमीकरणों की प्रणाली का उपयोग करके गणना की जा सकती है:

कम से कम वर्ग अनुमान की विधि गुणांकों के ऐसे अनुमान देती है एकतथा बी,जिसके लिए रेखा निर्देशांक के साथ बिंदु से गुजरती है एक्सतथा वाई,वे। एक अनुपात है पर = कुल्हाड़ी + बी।प्रतीपगमन समीकरण का आलेखीय निरूपण कहलाता है सैद्धांतिक प्रतिगमन रेखा।एक रैखिक निर्भरता के साथ, प्रतिगमन गुणांक ग्राफ पर सैद्धांतिक प्रतिगमन रेखा के ढलान के स्पर्शरेखा को x-अक्ष पर दर्शाता है। गुणांक पर चिन्ह संबंध की दिशा को दर्शाता है। यदि यह शून्य से अधिक है, तो संबंध प्रत्यक्ष है, यदि यह कम है, तो यह उलटा है।

"पॉलिटिकल पीटर्सबर्ग-2006" (तालिका 56) अध्ययन से निम्नलिखित उदाहरण वर्तमान में अपने जीवन के साथ संतुष्टि की डिग्री और भविष्य में जीवन की गुणवत्ता में बदलाव की अपेक्षाओं के बीच नागरिकों की धारणाओं के बीच एक रैखिक संबंध दिखाता है। कनेक्शन प्रत्यक्ष, रैखिक है (मानकीकृत प्रतिगमन गुणांक 0.233 है, महत्व स्तर 0.000 है)। इस मामले में, प्रतिगमन गुणांक अधिक नहीं है, लेकिन यह सांख्यिकीय रूप से महत्वपूर्ण संकेतक (पियर्सन गुणांक के सांख्यिकीय रूप से महत्वपूर्ण संकेतक के वर्ग की निचली सीमा) की निचली सीमा से अधिक है।

तालिका 56

अपेक्षाओं पर वर्तमान में नागरिकों के जीवन की गुणवत्ता का प्रभाव

(सेंट पीटर्सबर्ग, 2006)

* आश्रित चर: "आपको क्या लगता है कि अगले 2-3 वर्षों में आपका जीवन कैसे बदलेगा?"

राजनीतिक जीवन में, अध्ययन के तहत चर का मूल्य अक्सर एक साथ कई विशेषताओं पर निर्भर करता है। उदाहरण के लिए, राजनीतिक गतिविधि का स्तर और प्रकृति एक साथ राज्य के राजनीतिक शासन, राजनीतिक परंपराओं, किसी दिए गए क्षेत्र में लोगों के राजनीतिक व्यवहार की ख़ासियत और प्रतिवादी के सामाजिक माइक्रोग्रुप, उसकी उम्र, शिक्षा, आय से प्रभावित होती है। स्तर, राजनीतिक अभिविन्यास, आदि। इस मामले में, आपको समीकरण का उपयोग करने की आवश्यकता है एकाधिक प्रतिगमन, जिसका निम्न रूप है:

जहां गुणांक बी।- आंशिक प्रतिगमन गुणांक। यह स्वतंत्र (परिणाम) चर के मूल्यों को निर्धारित करने के लिए प्रत्येक स्वतंत्र चर के योगदान को दर्शाता है। यदि आंशिक प्रतिगमन गुणांक 0 के करीब है, तो हम यह निष्कर्ष निकाल सकते हैं कि स्वतंत्र और आश्रित चर के बीच कोई सीधा संबंध नहीं है।

ऐसे मॉडल की गणना मैट्रिक्स बीजगणित का उपयोग करके पीसी पर की जा सकती है। एकाधिक प्रतिगमन आपको सामाजिक संबंधों की बहुक्रियात्मक प्रकृति को प्रतिबिंबित करने और परिणामी विशेषता पर व्यक्तिगत रूप से और सभी एक साथ प्रत्येक कारक के प्रभाव के माप को स्पष्ट करने की अनुमति देता है।

गुणांक निरूपित बी,रैखिक प्रतिगमन का गुणांक कहा जाता है और कारक विशेषता की भिन्नता के बीच संबंध की ताकत को दर्शाता है एक्सऔर प्रभावी सुविधा की भिन्नता यूयह गुणांक विशेषताओं के मापन की निरपेक्ष इकाइयों में संबंध की मजबूती को मापता है। हालांकि, सुविधाओं के सहसंबंध की निकटता को परिणामी विशेषता के मानक विचलन के संदर्भ में भी व्यक्त किया जा सकता है (ऐसे गुणांक को सहसंबंध गुणांक कहा जाता है)। प्रतिगमन गुणांक के विपरीत बीसहसंबंध गुणांक सुविधाओं के मापन की स्वीकृत इकाइयों पर निर्भर नहीं करता है, और इसलिए, यह किसी भी विशेषता के लिए तुलनीय है। आमतौर पर, कनेक्शन को मजबूत माना जाता है यदि /> 0.7, मध्यम जकड़न - 0.5 ग्राम 0.5 पर।

जैसा कि आप जानते हैं, निकटतम कनेक्शन एक कार्यात्मक कनेक्शन है, जब प्रत्येक व्यक्तिगत मूल्य यूमूल्य के लिए विशिष्ट रूप से असाइन किया जा सकता है एक्स।इस प्रकार, सहसंबंध गुणांक 1 के जितना करीब होता है, संबंध उतना ही कार्यात्मक होता है। प्रतिगमन विश्लेषण के लिए महत्व स्तर 0.001 से अधिक नहीं होना चाहिए।

सहसंबंध गुणांक को लंबे समय से सुविधाओं के संबंध की निकटता का मुख्य संकेतक माना जाता है। हालांकि, बाद में निर्धारण का गुणांक ऐसा संकेतक बन गया। इस गुणांक का अर्थ इस प्रकार है - यह परिणामी विशेषता के कुल विचरण के हिस्से को दर्शाता है पर, सुविधा के विचरण द्वारा समझाया गया एक्स।यह केवल सहसंबंध गुणांक (0 से 1 तक बदलते हुए) को चुकता करके पाया जाता है और बदले में, एक रैखिक संबंध के लिए 0 (0%) से शेयर को दर्शाता है 1 (100%) विशेषता मान वाई,विशेषता के मूल्यों द्वारा निर्धारित एक्स।यह के रूप में दर्ज किया गया है मैं 2,और SPSS पैकेज में प्रतिगमन विश्लेषण के परिणामी तालिकाओं में - एक वर्ग के बिना।

आइए हम बहु समाश्रयण समीकरण के निर्माण की मुख्य समस्याओं को निरूपित करें।

  • 1. प्रतिगमन समीकरण में शामिल कारकों की पसंद।इस स्तर पर, शोधकर्ता पहले मुख्य कारणों की एक सामान्य सूची संकलित करता है, जो सिद्धांत के अनुसार, अध्ययन के तहत घटना का निर्धारण करता है। फिर उसे प्रतिगमन समीकरण में सुविधाओं का चयन करना होगा। मुख्य चयन नियम यह है कि विश्लेषण में शामिल कारकों को एक दूसरे के साथ जितना संभव हो उतना कम सहसंबद्ध होना चाहिए; केवल इस मामले में एक निश्चित कारक-विशेषता के प्रभाव के मात्रात्मक माप को विशेषता देना संभव है।
  • 2. एकाधिक प्रतिगमन समीकरण के रूप का चयन(व्यवहार में, रैखिक या रैखिक-लघुगणक अधिक बार उपयोग किया जाता है)। इसलिए, एकाधिक प्रतिगमन का उपयोग करने के लिए, शोधकर्ता को पहले परिणामी एक पर कई स्वतंत्र चर के प्रभाव का एक काल्पनिक मॉडल बनाना होगा। प्राप्त परिणामों के विश्वसनीय होने के लिए, यह आवश्यक है कि मॉडल वास्तविक प्रक्रिया से बिल्कुल मेल खाता हो, अर्थात। चरों के बीच संबंध रैखिक होना चाहिए, एक महत्वपूर्ण स्वतंत्र चर को नजरअंदाज नहीं किया जा सकता है, जैसे कि एक भी चर जो अध्ययन के तहत प्रक्रिया से सीधे संबंधित नहीं है, को विश्लेषण में शामिल नहीं किया जा सकता है। इसके अलावा, चर के सभी माप अत्यंत सटीक होने चाहिए।

उपरोक्त विवरण से इस पद्धति के आवेदन के लिए कई शर्तों का पालन किया जाता है, जिसके बिना एकाधिक प्रतिगमन विश्लेषण (एमआरए) की प्रक्रिया के लिए आगे बढ़ना असंभव है। केवल निम्नलिखित सभी बिंदुओं का अनुपालन आपको प्रतिगमन विश्लेषण को सही ढंग से करने की अनुमति देता है।