प्रतिगमन समीकरण गुणांक सहसंबंध और प्रतिगमन विश्लेषण दर्शाता है। सहसंबंध और प्रतिगमन

प्रतिगमन अनुपात

- अंग्रेज़ीगुणांक, प्रतिगमन; जर्मनप्रतिगमन आश्रित y और स्वतंत्र चर x के बीच संबंध की विशेषताओं में से एक। के.पी. यह दर्शाता है कि यदि चर x अपने किसी एक परिवर्तन से बदलता है तो y द्वारा लिया गया मान कितनी इकाइयों से बढ़ जाता है। ज्यामितीय के.पी. सीधी रेखा y का ढाल है।

एंटीनाज़ी। समाजशास्त्र का विश्वकोश, 2009

देखें कि "REGRESSION RATIO" अन्य शब्दकोशों में क्या है:

    प्रतिगमन गुणांक- - [एल.जी. सुमेंको। सूचना प्रौद्योगिकी का अंग्रेजी रूसी शब्दकोश। एम।: जीपी टीएसएनआईआईएस, 2003।] सामान्य एन रिग्रेशन गुणांक में विषय सूचना प्रौद्योगिकी ... तकनीकी अनुवादक की मार्गदर्शिका

    प्रतिगमन गुणांक- 35. प्रतिगमन गुणांक प्रतिगमन विश्लेषण मॉडल का एक पैरामीटर स्रोत: GOST 24026 80: अनुसंधान परीक्षण। एक प्रयोग की योजना बनाना। शब्द और परिभाषाएं …

    प्रतिगमन गुणांक- समाश्रयण समीकरण में स्वतंत्र चर का गुणांक ... समाजशास्त्रीय सांख्यिकी का शब्दकोश

    प्रतिगमन अनुपात- अंग्रेज़ी। गुणांक, प्रतिगमन; जर्मन प्रतिगमन आश्रित y और स्वतंत्र चर x के बीच संबंध की विशेषताओं में से एक। के.पी. से पता चलता है कि y द्वारा स्वीकार किया गया मान कितनी इकाइयों से बढ़ता है यदि चर x बदल जाता है ... ... समाजशास्त्र का व्याख्यात्मक शब्दकोश

    नमूना प्रतिगमन गुणांक- 2.44. नमूना प्रतिगमन गुणांक वक्र या प्रतिगमन सतह के समीकरण में एक चर का गुणांक स्रोत: GOST R 50779.10 2000: सांख्यिकीय तरीके। संभाव्यता और बुनियादी आँकड़े। शब्द और परिभाषाएं … मानक और तकनीकी दस्तावेज की शर्तों की शब्दकोश-संदर्भ पुस्तक

    आंशिक प्रतिगमन गुणांकएक सांख्यिकीय उपाय है जो उस स्थिति में निर्भर चर पर स्वतंत्र चर के प्रभाव की डिग्री को दर्शाता है जहां मॉडल में अन्य सभी चर का पारस्परिक प्रभाव शोधकर्ता के नियंत्रण में है ... समाजशास्त्रीय शब्दकोश

    प्रतिगमन, वजन- प्रतिगमन गुणांक का पर्यायवाची ... मनोविज्ञान का व्याख्यात्मक शब्दकोश

    वंशानुक्रम अनुपात- एक विशेषता के कुल फेनोटाइपिक भिन्नता में आनुवंशिक परिवर्तनशीलता के सापेक्ष हिस्से का संकेतक। आर्थिक रूप से उपयोगी लक्षणों की आनुवंशिकता का आकलन करने के लिए सबसे सामान्य तरीके: जहां h2 आनुवंशिकता का गुणांक है; आर इंट्राक्लास ... ... फार्म जानवरों के प्रजनन, आनुवंशिकी और प्रजनन में प्रयुक्त नियम और परिभाषाएं

    - (आर वर्ग) माना निर्भरता मॉडल, यानी व्याख्यात्मक चर द्वारा समझाया गया आश्रित चर के विचरण का अनुपात है। अधिक सटीक रूप से, यह एक इकाई शून्य से अस्पष्टीकृत विचरण का अनुपात है (मॉडल की यादृच्छिक त्रुटि का विचरण, या सशर्त ... विकिपीडिया

    प्रतीपगमन समीकरण में स्वतंत्र चर का गुणांक। इसलिए, उदाहरण के लिए, यादृच्छिक चर Y और X को जोड़ने वाले रैखिक प्रतिगमन समीकरण में, R. k. B0 और b1 बराबर हैं: जहां r X और Y का सहसंबंध गुणांक है। आर के अनुमानों की गणना (चयनित ... ... गणित का विश्वकोश

पुस्तकें

  • अर्थमिति का परिचय (सीडीपीसी), यानोवस्की लियोनिद पेट्रोविच, बुकहोवेट्स एलेक्सी जॉर्जीविच। अर्थमिति के मूल सिद्धांत और एक आयामी समय श्रृंखला के सांख्यिकीय विश्लेषण दिए गए हैं। शास्त्रीय जोड़ी और कई प्रतिगमन, शास्त्रीय और सामान्यीकृत तरीकों पर बहुत ध्यान दिया जाता है ...
  • स्पीड रीडिंग। प्रभावी प्रशिक्षक (सीडीपीसी)। कार्यक्रम उन उपयोगकर्ताओं को संबोधित किया जाता है जो कम से कम समय में गति पढ़ने की तकनीक में महारत हासिल करना चाहते हैं। पाठ्यक्रम "सिद्धांत - अभ्यास" सिद्धांत के अनुसार संरचित है। सैद्धांतिक सामग्री और व्यावहारिक ...

प्रतिगमन विश्लेषण एक सांख्यिकीय शोध पद्धति है जो आपको एक या अधिक स्वतंत्र चर पर एक पैरामीटर की निर्भरता दिखाने की अनुमति देती है। प्री-कंप्यूटर युग में, इसका अनुप्रयोग काफी कठिन था, खासकर जब यह बड़ी मात्रा में डेटा की बात आती थी। आज, एक्सेल में रिग्रेशन बनाना सीखकर, आप कुछ ही मिनटों में जटिल सांख्यिकीय समस्याओं को हल कर सकते हैं। अर्थशास्त्र के क्षेत्र से विशिष्ट उदाहरण नीचे दिए गए हैं।

प्रतिगमन प्रकार

इस अवधारणा को ही 1886 में गणित में पेश किया गया था। प्रतिगमन होता है:

  • रैखिक;
  • परवलयिक;
  • बिजली कानून;
  • घातीय;
  • अतिपरवलिक;
  • सांकेतिक;
  • लघुगणक

उदाहरण 1

आइए हम 6 औद्योगिक उद्यमों में औसत वेतन पर नौकरी छोड़ने वाले कर्मचारियों की संख्या की निर्भरता को निर्धारित करने की समस्या पर विचार करें।

कार्य। छह उद्यमों ने औसत मासिक वेतन और स्वेच्छा से नौकरी छोड़ने वाले कर्मचारियों की संख्या का विश्लेषण किया। सारणीबद्ध रूप में, हमारे पास है:

इस्तीफा देने वालों की संख्या

वेतन

30,000 रूबल

35,000 रूबल

40,000 रूबल

45,000 रूबल

50,000 रूबल

55,000 रूबल

60,000 रूबल

6 उद्यमों में औसत वेतन पर छोड़े गए कर्मचारियों की संख्या की निर्भरता निर्धारित करने की समस्या के लिए, प्रतिगमन मॉडल में समीकरण Y = a 0 + a 1 x 1 + ... + akxk का रूप होता है, जहां xi हैं चरों को प्रभावित करने वाले, ai प्रतिगमन गुणांक हैं, और ak कारकों की संख्या है।

इस कार्य के लिए, Y छोड़ने वाले कर्मचारियों का संकेतक है, और प्रभावित करने वाला कारक वेतन है, जिसे हम X से निरूपित करते हैं।

एक्सेल टेबल प्रोसेसर की क्षमताओं का उपयोग करना

एक्सेल में रिग्रेशन विश्लेषण मौजूदा सारणीबद्ध डेटा में अंतर्निहित कार्यों के आवेदन से पहले होना चाहिए। हालांकि, इन उद्देश्यों के लिए बहुत उपयोगी "विश्लेषण पैकेज" ऐड-इन का उपयोग करना बेहतर है। इसे सक्रिय करने के लिए आपको चाहिए:

  • "फ़ाइल" टैब से "पैरामीटर" अनुभाग पर जाएं;
  • खुलने वाली विंडो में, "ऐड-इन्स" लाइन का चयन करें;
  • "कंट्रोल" लाइन के दाईं ओर नीचे स्थित "गो" बटन पर क्लिक करें;
  • "विश्लेषण पैकेज" नाम के आगे एक टिक लगाएं और "ओके" पर क्लिक करके अपने कार्यों की पुष्टि करें।

यदि सब कुछ सही ढंग से किया जाता है, तो आवश्यक बटन "एक्सेल" वर्कशीट के ऊपर स्थित "डेटा" टैब के दाईं ओर दिखाई देगा।

एक्सेल में

अब जब हमारे पास अर्थमितीय गणना करने के लिए सभी आवश्यक आभासी उपकरण उपलब्ध हैं, तो हम अपनी समस्या को हल करना शुरू कर सकते हैं। इसके लिए:

  • "डेटा विश्लेषण" बटन पर क्लिक करें;
  • खुलने वाली विंडो में, "रिग्रेशन" बटन पर क्लिक करें;
  • दिखाई देने वाले टैब में, Y (छोड़ने वाले कर्मचारियों की संख्या) और X (उनका वेतन) के लिए मानों की श्रेणी दर्ज करें;
  • हम "ओके" बटन दबाकर अपने कार्यों की पुष्टि करते हैं।

परिणामस्वरूप, प्रोग्राम स्वचालित रूप से स्प्रैडशीट प्रोसेसर की नई शीट को प्रतिगमन विश्लेषण डेटा के साथ भर देगा। ध्यान दें! एक्सेल में उस स्थान को स्वतंत्र रूप से परिभाषित करने की क्षमता है जिसे आप इस उद्देश्य के लिए पसंद करते हैं। उदाहरण के लिए, यह वही शीट हो सकती है जिसमें Y और X मान हों, या यहां तक ​​कि इस तरह के डेटा को संग्रहीत करने के लिए विशेष रूप से डिज़ाइन की गई एक नई कार्यपुस्तिका भी हो सकती है।

आर-स्क्वायर के लिए प्रतिगमन परिणामों का विश्लेषण

एक्सेल में, प्रश्न में उदाहरण के डेटा को संसाधित करने के दौरान प्राप्त डेटा इस प्रकार है:

सबसे पहले आपको आर-स्क्वायर की वैल्यू पर ध्यान देना चाहिए। यह निर्धारण के गुणांक का प्रतिनिधित्व करता है। इस उदाहरण में, आर-वर्ग = 0.755 (75.5%), अर्थात्, मॉडल के परिकलित पैरामीटर 75.5% द्वारा माने गए मापदंडों के बीच संबंध की व्याख्या करते हैं। निर्धारण गुणांक का मान जितना अधिक होता है, उतना ही अधिक चुना हुआ मॉडल किसी विशिष्ट कार्य के लिए अधिक उपयुक्त माना जाता है। ऐसा माना जाता है कि यह वास्तविक स्थिति का सही वर्णन करता है जब R-वर्ग मान 0.8 से ऊपर होता है। यदि R-वर्ग<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

बाधाओं का विश्लेषण

संख्या 64.1428 दर्शाती है कि यदि हम जिस मॉडल पर विचार कर रहे हैं उसमें सभी चर xi शून्य हैं, तो Y का मान क्या होगा। दूसरे शब्दों में, यह तर्क दिया जा सकता है कि विश्लेषण किए गए पैरामीटर का मूल्य अन्य कारकों से प्रभावित होता है जो किसी विशेष मॉडल में वर्णित नहीं हैं।

सेल B18 में स्थित अगला गुणांक -0.16285, Y पर वेरिएबल X के प्रभाव के महत्व को दर्शाता है। इसका मतलब यह है कि माना मॉडल के भीतर कर्मचारियों का औसत मासिक वेतन -0.16285 के वजन के साथ छोड़ने वाले कर्मचारियों की संख्या को प्रभावित करता है। , यानी, इसके प्रभाव की डिग्री बिल्कुल छोटी है। एक "-" चिन्ह इंगित करता है कि गुणांक ऋणात्मक है। यह स्पष्ट है, क्योंकि हर कोई जानता है कि उद्यम में वेतन जितना अधिक होता है, उतने ही कम लोग रोजगार अनुबंध को समाप्त करने या छोड़ने की इच्छा व्यक्त करते हैं।

बहु - प्रतिगमन

इस शब्द को फॉर्म के कई स्वतंत्र चर के साथ एक बाधा समीकरण के रूप में समझा जाता है:

y = f (x 1 + x 2 +… x m) + , जहां y एक प्रभावी संकेतक (आश्रित चर) है, और x 1, x 2,… x m संकेतक-कारक (स्वतंत्र चर) हैं।

पैरामीटर अनुमान

एकाधिक प्रतिगमन (MR) के लिए, यह कम से कम वर्गों (OLS) की विधि का उपयोग करके किया जाता है। Y = a + b 1 x 1 +… + b m x m + के रूप के रैखिक समीकरणों के लिए हम सामान्य समीकरणों की एक प्रणाली का निर्माण करते हैं (नीचे देखें)

विधि के सिद्धांत को समझने के लिए, दो-कारक मामले पर विचार करें। तब हमारे पास सूत्र द्वारा वर्णित स्थिति होती है

यहाँ से हमें मिलता है:

जहां सूचकांक में परिलक्षित संबंधित विशेषता का प्रसरण है।

OLS को मानकीकृत पैमाने पर MR समीकरण पर लागू किया जाता है। इस मामले में, हमें समीकरण मिलता है:

जहाँ t y, t x 1,… t xm मानकीकृत चर हैं जिनके लिए माध्य मान 0 के बराबर हैं; β मैं मानकीकृत प्रतिगमन गुणांक हैं और मानक विचलन 1 है।

ध्यान दें कि इस मामले में सभी β i को सामान्यीकृत और केंद्रीकृत के रूप में निर्दिष्ट किया गया है, इसलिए एक दूसरे के साथ उनकी तुलना को सही और मान्य माना जाता है। इसके अलावा, यह βi के सबसे छोटे मूल्यों वाले कारकों को छोड़कर, कारकों को फ़िल्टर करने के लिए प्रथागत है।

एक रेखीय प्रतिगमन समीकरण का उपयोग करने में समस्या

मान लीजिए कि आपके पास पिछले 8 महीनों में किसी विशिष्ट उत्पाद N के लिए मूल्य गतिकी की तालिका है। 1850 रूबल / टी की कीमत पर अपने बैच को खरीदने की सलाह पर निर्णय लेना आवश्यक है।

माह संख्या

महीने का नाम

उत्पाद की कीमत नहीं

1750 रूबल प्रति टन

1755 रूबल प्रति टन

1767 रूबल प्रति टन

1760 रूबल प्रति टन

1770 रूबल प्रति टन

1790 रूबल प्रति टन

1810 रूबल प्रति टन

1840 रूबल प्रति टन

एक्सेल स्प्रेडशीट प्रोसेसर में इस समस्या को हल करने के लिए, आपको ऊपर प्रस्तुत उदाहरण से पहले से ज्ञात डेटा विश्लेषण टूल का उपयोग करने की आवश्यकता है। अगला, "रिग्रेशन" अनुभाग चुनें और पैरामीटर सेट करें। यह याद रखना चाहिए कि "इनपुट अंतराल वाई" फ़ील्ड में, आश्रित चर के लिए मूल्यों की एक श्रृंखला दर्ज की जानी चाहिए (इस मामले में, वर्ष के विशिष्ट महीनों में माल की कीमतें), और "इनपुट" में अंतराल X" - स्वतंत्र चर (माह की संख्या) के लिए। हम "ओके" पर क्लिक करके कार्यों की पुष्टि करते हैं। एक नई शीट पर (यदि ऐसा संकेत दिया गया था) तो हमें प्रतिगमन के लिए डेटा मिलता है।

हम उनका उपयोग y = ax + b के रूप में एक रैखिक समीकरण बनाने के लिए करते हैं, जहां महीने संख्या के नाम के साथ रेखा के गुणांक और गुणांक और रेखाएं "Y-चौराहे" शीट से प्रतिगमन विश्लेषण अधिनियम के परिणामों के साथ पैरामीटर ए और बी के रूप में। इस प्रकार, समस्या 3 के लिए रैखिक समाश्रयण समीकरण (SD) को इस प्रकार लिखा जाता है:

उत्पाद की कीमत एन = 11.714 * माह संख्या + 1727.54।

या बीजीय संकेतन में

वाई = 11.714 एक्स + 1727.54

परिणामों का विश्लेषण

यह तय करने के लिए कि प्राप्त रैखिक प्रतिगमन समीकरण पर्याप्त है, एकाधिक सहसंबंध और निर्धारण गुणांक का उपयोग किया जाता है, साथ ही फिशर का परीक्षण और छात्र का परीक्षण। प्रतिगमन परिणामों के साथ एक्सेल तालिका में, उन्हें क्रमशः एकाधिक आर, आर-वर्ग, एफ-सांख्यिकी और टी-सांख्यिकी कहा जाता है।

केएमसी आर स्वतंत्र और आश्रित चर के बीच संभाव्य संबंध की निकटता का आकलन करना संभव बनाता है। इसका उच्च मूल्य चर "महीना संख्या" और "उत्पाद मूल्य एन प्रति टन रूबल में" के बीच काफी मजबूत संबंध को इंगित करता है। हालाँकि, इस संबंध की प्रकृति अज्ञात बनी हुई है।

निर्धारण गुणांक का वर्ग R2 (RI) कुल प्रसार के अनुपात की एक संख्यात्मक विशेषता है और प्रयोगात्मक डेटा के किस भाग के प्रसार को दर्शाता है, अर्थात। आश्रित चर के मान रैखिक प्रतिगमन समीकरण से मेल खाते हैं। विचाराधीन समस्या में, यह मान 84.8% है, अर्थात्, प्राप्त एसडी द्वारा सांख्यिकीय डेटा को उच्च स्तर की सटीकता के साथ वर्णित किया गया है।

एफ-सांख्यिकी, जिसे फिशर परीक्षण भी कहा जाता है, का उपयोग रैखिक संबंध के महत्व का आकलन करने के लिए किया जाता है, इसके अस्तित्व की परिकल्पना का खंडन या पुष्टि करता है।

(छात्र का मानदंड) एक रैखिक संबंध के अज्ञात या मुक्त शब्द के साथ गुणांक के महत्व का आकलन करने में मदद करता है। यदि t-मानदंड का मान> t करोड़, तो रैखिक समीकरण के मुक्त पद के महत्व की परिकल्पना को खारिज कर दिया जाता है।

एक्सेल टूल्स का उपयोग करके एक फ्री टर्म के लिए मानी गई समस्या में, यह प्राप्त किया गया था कि t = 169.20903, और p = 2.89E-12, यानी, हमारे पास एक शून्य संभावना है कि फ्री टर्म के महत्व के बारे में सही परिकल्पना होगी अस्वीकार कर दिया। अज्ञात t = 5.79405, और p = 0.001158 पर गुणांक के लिए। दूसरे शब्दों में, अज्ञात के साथ गुणांक के महत्व के बारे में सही परिकल्पना के खारिज होने की संभावना 0.12% है।

इस प्रकार, यह तर्क दिया जा सकता है कि परिणामी रैखिक प्रतिगमन समीकरण पर्याप्त है।

शेयरों का एक ब्लॉक खरीदने की समीचीनता की समस्या

एक्सेल में मल्टीपल रिग्रेशन एक ही डेटा एनालिसिस टूल का उपयोग करके किया जाता है। आइए एक विशिष्ट लागू समस्या पर विचार करें।

कंपनी "एनएनएन" के प्रबंधन को जेएससी "एमएमएम" में 20% हिस्सेदारी खरीदने की सलाह पर निर्णय लेना चाहिए। पैकेज (जेवी) की लागत 70 मिलियन अमेरिकी डॉलर है। एनएनएन विशेषज्ञों ने इसी तरह के लेनदेन पर डेटा एकत्र किया है। लाखों अमेरिकी डॉलर में व्यक्त किए गए ऐसे मापदंडों द्वारा शेयरों के ब्लॉक के मूल्य का मूल्यांकन करने का निर्णय लिया गया, जैसे:

  • देय खाते (वीके);
  • वार्षिक कारोबार की मात्रा (VO);
  • प्राप्य खाते (वीडी);
  • अचल संपत्तियों की लागत (एसओएफ)।

इसके अलावा, पैरामीटर हजारों अमेरिकी डॉलर में उद्यम (V3 P) का वेतन बकाया है।

एक्सेल स्प्रेडशीट समाधान

सबसे पहले, आपको प्रारंभिक डेटा की एक तालिका बनाने की आवश्यकता है। यह इस तरह दिख रहा है:

  • "डेटा विश्लेषण" विंडो को कॉल करें;
  • "प्रतिगमन" अनुभाग का चयन करें;
  • कॉलम जी से आश्रित चर के मूल्यों की श्रेणी "इनपुट अंतराल वाई" बॉक्स में दर्ज की गई है;
  • "इनपुट अंतराल एक्स" विंडो के दाईं ओर एक लाल तीर के साथ आइकन पर क्लिक करें और शीट पर कॉलम बी, सी, डी, एफ से सभी मानों की श्रेणी का चयन करें।

"नई वर्कशीट" आइटम की जाँच करें और "ओके" पर क्लिक करें।

किसी दिए गए कार्य के लिए प्रतिगमन विश्लेषण प्राप्त करें।

परिणामों और निष्कर्षों का अध्ययन

हम एक्सेल स्प्रेडशीट शीट पर ऊपर प्रस्तुत गोल डेटा से प्रतिगमन समीकरण "एकत्र" करते हैं:

एसपी = 0.103 * एसओएफ + 0.541 * वीओ - 0.031 * वीके + 0.405 * वीडी + 0.691 * वीजेडपी - 265.844।

अधिक परिचित गणितीय रूप में, इसे इस प्रकार लिखा जा सकता है:

y = 0.103 * x1 + 0.541 * x2 - 0.031 * x3 + 0.405 * x4 + 0.691 * x5 - 265.844

JSC "MMM" के लिए डेटा तालिका में प्रस्तुत किया गया है:

उन्हें प्रतिगमन समीकरण में प्रतिस्थापित करते हुए, आंकड़ा 64.72 मिलियन अमेरिकी डॉलर है। इसका मतलब है कि जेएससी "एमएमएम" के शेयर नहीं खरीदे जाने चाहिए, क्योंकि उनका मूल्य 70 मिलियन अमेरिकी डॉलर अधिक है।

जैसा कि आप देख सकते हैं, एक्सेल स्प्रेडशीट प्रोसेसर और रिग्रेशन समीकरण के उपयोग ने एक बहुत ही विशिष्ट लेनदेन की उपयुक्तता के बारे में एक सूचित निर्णय लेना संभव बना दिया है।

अब आप जानते हैं कि प्रतिगमन क्या है। ऊपर चर्चा किए गए एक्सेल में उदाहरण आपको अर्थमिति के क्षेत्र में व्यावहारिक समस्याओं को हल करने में मदद करेंगे।

चित्रमय विधि का उपयोग करना.
इस पद्धति का उपयोग अध्ययन किए गए आर्थिक संकेतकों के बीच संबंध के रूप की कल्पना करने के लिए किया जाता है। ऐसा करने के लिए, एक आयताकार समन्वय प्रणाली में एक ग्राफ प्लॉट किया जाता है, प्रभावी विशेषता वाई के व्यक्तिगत मूल्यों को ऑर्डिनेट अक्ष के साथ प्लॉट किया जाता है, और कारक विशेषता एक्स के व्यक्तिगत मूल्यों को एब्सिस्सा अक्ष के साथ प्लॉट किया जाता है।
प्रभावी और भाज्य चिन्हों के बिन्दुओं के समुच्चय को कहते हैं सहसंबंध क्षेत्र.
सहसंबंध क्षेत्र के आधार पर, यह (सामान्य जनसंख्या के लिए) यह अनुमान लगाया जा सकता है कि एक्स और वाई के सभी संभावित मूल्यों के बीच संबंध रैखिक है।

रैखिक प्रतिगमन समीकरण y = bx + a + . का रूप है
यहाँ एक यादृच्छिक त्रुटि है (विचलन, गड़बड़ी)।
यादृच्छिक त्रुटि के अस्तित्व के कारण:
1. समाश्रयण मॉडल में महत्वपूर्ण व्याख्यात्मक चरों को शामिल न करना;
2. चर का एकत्रीकरण। उदाहरण के लिए, कुल खपत का कार्य खर्च के बारे में व्यक्तिगत व्यक्तियों के कुल निर्णयों की सामान्य अभिव्यक्ति का प्रयास है। यह अलग-अलग मापदंडों वाले अलग-अलग अनुपातों का सिर्फ एक अनुमान है।
3. मॉडल की संरचना का गलत विवरण;
4. गलत कार्यात्मक विनिर्देश;
5. मापन त्रुटियां।
चूंकि विचलन मैं प्रत्येक विशिष्ट अवलोकन के लिए यादृच्छिक हैं और नमूने में उनके मान अज्ञात हैं, तो:
1) प्रेक्षणों x i और y i से, केवल α और β . के प्राचलों का अनुमान है
2) प्रतिगमन मॉडल के पैरामीटर α और β का अनुमान क्रमशः ए और बी मान हैं, जो प्रकृति में यादृच्छिक हैं, क्योंकि एक यादृच्छिक नमूने के अनुरूप;
फिर अनुमानित प्रतिगमन समीकरण (नमूना डेटा से निर्मित) का रूप y = bx + a + होगा, जहां ei त्रुटियों के देखे गए मान (अनुमान) हैं i, और b, क्रमशः, मापदंडों का अनुमान α और β प्रतिगमन मॉडल जो पाया जाना चाहिए।
पैरामीटर α और β का अनुमान लगाने के लिए - कम से कम वर्ग विधि का उपयोग किया जाता है।
सामान्य समीकरणों की प्रणाली।

हमारे डेटा के लिए, समीकरणों की प्रणाली का रूप है:

10ए + 356बी = 49
356a + 2135b = 9485

पहले समीकरण से हम a व्यक्त करते हैं और इसे दूसरे समीकरण में प्रतिस्थापित करते हैं
हमें b = 68.16, a = 11.17 . मिलता है

प्रतिगमन समीकरण:
वाई = 68.16 एक्स - 11.17

1. प्रतिगमन समीकरण के पैरामीटर।
चयनित औसत।



नमूना भिन्नताएं।


मानक विचलन

1.1. सहसंबंध गुणांक
हम संचार की जकड़न के संकेतक की गणना करते हैं। यह सूचक एक चयनात्मक रैखिक सहसंबंध गुणांक है, जिसकी गणना सूत्र द्वारा की जाती है:

रैखिक सहसंबंध गुणांक -1 से +1 तक मान लेता है।
संकेतों के बीच संबंध कमजोर और मजबूत (करीब) हो सकते हैं। उनके मानदंड का मूल्यांकन चाडॉक पैमाने पर किया जाता है:
0.1 < r xy < 0.3: слабая;
0.3 < r xy < 0.5: умеренная;
0.5 < r xy < 0.7: заметная;
0.7 < r xy < 0.9: высокая;
0.9 < r xy < 1: весьма высокая;
हमारे उदाहरण में, विशेषता Y और X कारक के बीच संबंध बहुत अधिक और प्रत्यक्ष है।

1.2. प्रतिगमन समीकरण(प्रतिगमन समीकरण का अनुमान)।

रैखिक प्रतिगमन समीकरण y = 68.16 x -11.17 . है
रैखिक प्रतिगमन समीकरण के गुणांकों को आर्थिक रूप से सार्थक बनाया जा सकता है। प्रतिगमन समीकरण गुणांकदिखाता है कि कितनी इकाइयां हैं। जब कारक 1 इकाई से बदलता है तो परिणाम बदल जाएगा।
गुणांक बी = 68.16 माप की प्रति इकाई कारक x के मूल्य में वृद्धि या कमी के साथ प्रभावी संकेतक (y की इकाइयों में) में औसत परिवर्तन को दर्शाता है। इस उदाहरण में, 1 इकाई की वृद्धि के साथ, y औसतन 68.16 बढ़ जाता है।
गुणांक a = -11.17 औपचारिक रूप से y के अनुमानित स्तर को दर्शाता है, लेकिन केवल तभी जब x = 0 नमूना मूल्यों के करीब हो।
लेकिन अगर x = 0, x के सैंपल किए गए मानों से दूर है, तो शाब्दिक व्याख्या गलत परिणाम दे सकती है, और भले ही रिग्रेशन लाइन प्रेक्षित नमूने के मूल्यों का सटीक रूप से वर्णन करती हो, इस बात की कोई गारंटी नहीं है कि यह होगा बाएं या दाएं एक्सट्रपलेशन होने पर भी हो।
प्रतिगमन समीकरण में संबंधित x मानों को प्रतिस्थापित करते हुए, आप प्रत्येक अवलोकन के लिए प्रभावी y (x) संकेतक के संरेखित (अनुमानित) मान निर्धारित कर सकते हैं।
y और x के बीच का संबंध प्रतिगमन गुणांक b का संकेत निर्धारित करता है (यदि> 0 - सीधा संबंध, अन्यथा - उल्टा)। हमारे उदाहरण में, कनेक्शन प्रत्यक्ष है।

1.3. लोच गुणांक।
प्रभावी संकेतक y और कारक संकेतक x की माप की इकाइयों में अंतर होने पर प्रभावी संकेतक पर कारकों के प्रभाव का सीधे आकलन करने के लिए प्रतिगमन गुणांक (उदाहरण के लिए) का उपयोग करना अवांछनीय है।
इन उद्देश्यों के लिए, लोच और बीटा के गुणांक की गणना की जाती है। लोच का गुणांक सूत्र द्वारा पाया जाता है:


यह दर्शाता है कि जब कारक विशेषता x में 1% से परिवर्तन होता है, तो औसतन, प्रभावी विशेषता y किस प्रतिशत से बदल जाती है। यह कारकों की परिवर्तनशीलता की डिग्री को ध्यान में नहीं रखता है।
हमारे उदाहरण में, लोच का गुणांक 1 से अधिक है। इसलिए, जब X 1% से बदलता है, Y 1% से अधिक बदल जाएगा। दूसरे शब्दों में, X का Y पर महत्वपूर्ण प्रभाव पड़ता है।
बीटा गुणांकअपने मानक विचलन के मूल्य के किस हिस्से से दिखाता है कि प्रभावी संकेतक का मूल्य औसतन बदल जाएगा जब कारक संकेतक अपने मानक विचलन के मूल्य से स्थिर स्तर पर निर्धारित शेष स्वतंत्र चर के मूल्य के साथ बदलता है:

वे। इस सूचक के मानक विचलन के मूल्य से x में वृद्धि से इस सूचक के मानक विचलन के औसत Y में 0.9796 की वृद्धि होगी।

1.4. सन्निकटन त्रुटि।
आइए हम निरपेक्ष सन्निकटन त्रुटि का उपयोग करके प्रतिगमन समीकरण की गुणवत्ता का अनुमान लगाएं।


चूंकि त्रुटि 15% से अधिक है, इसलिए इस समीकरण को प्रतिगमन के रूप में उपयोग करना वांछनीय नहीं है।

1.6. निर्धारण गुणांक।
(एकाधिक) सहसंबंध गुणांक के वर्ग को निर्धारण का गुणांक कहा जाता है, जो कारक गुण में भिन्नता द्वारा समझाए गए प्रभावी गुण में भिन्नता के अनुपात को दर्शाता है।
अक्सर, निर्धारण के गुणांक की व्याख्या देते हुए, इसे प्रतिशत के रूप में व्यक्त किया जाता है।
आर 2 = 0.98 2 = 0.9596
वे। 95.96% मामलों में, x में परिवर्तन से y में परिवर्तन होता है। दूसरे शब्दों में, प्रतिगमन समीकरण को फिट करने की सटीकता अधिक है। Y में शेष 4.04% परिवर्तन उन कारकों द्वारा समझाया गया है जिन्हें मॉडल में ध्यान में नहीं रखा गया है।

एक्स आप एक्स 2 वाई 2 एक्स वाई वाई (एक्स) (वाई आई-वाई सीपी) 2 (वाई-वाई (एक्स)) 2 (एक्स आई-एक्स सीपी) 2 | वाई - वाई एक्स |: y
0.371 15.6 0.1376 243.36 5.79 14.11 780.89 2.21 0.1864 0.0953
0.399 19.9 0.1592 396.01 7.94 16.02 559.06 15.04 0.163 0.1949
0.502 22.7 0.252 515.29 11.4 23.04 434.49 0.1176 0.0905 0.0151
0.572 34.2 0.3272 1169.64 19.56 27.81 87.32 40.78 0.0533 0.1867
0.607 44.5 .3684 1980.25 27.01 30.2 0.9131 204.49 0.0383 0.3214
0.655 26.8 0.429 718.24 17.55 33.47 280.38 44.51 0.0218 0.2489
0.763 35.7 0.5822 1274.49 27.24 40.83 61.54 26.35 0.0016 0.1438
0.873 30.6 0.7621 936.36 26.71 48.33 167.56 314.39 0.0049 0.5794
2.48 161.9 6.17 26211.61 402 158.07 14008.04 14.66 2.82 0.0236
7.23 391.9 9.18 33445.25 545.2 391.9 16380.18 662.54 3.38 1.81

2. प्रतीपगमन समीकरण के प्राचलों का अनुमान।
2.1. सहसंबंध गुणांक का महत्व।

छात्र तालिका के अनुसार α = 0.05 के महत्व स्तर और स्वतंत्रता की डिग्री k = 7 के साथ, हम टी आलोचना पाते हैं:
टी क्रिट = (7; 0.05) = 1.895
जहाँ m = 1 व्याख्यात्मक चरों की संख्या है।
यदि टी अवलोकन> टी महत्वपूर्ण है, तो सहसंबंध गुणांक के प्राप्त मूल्य को महत्वपूर्ण माना जाता है (शून्य परिकल्पना यह बताती है कि सहसंबंध गुणांक शून्य है)।
चूँकि t obs> t crit, हम इस परिकल्पना को अस्वीकार करते हैं कि सहसंबंध गुणांक 0 के बराबर है। दूसरे शब्दों में, सहसंबंध गुणांक सांख्यिकीय रूप से महत्वपूर्ण है
युग्मित रैखिक प्रतिगमन में t 2 r = t 2 b और फिर प्रतिगमन और सहसंबंध गुणांक के महत्व के बारे में परिकल्पना का परीक्षण करना रैखिक प्रतिगमन समीकरण के महत्व के बारे में परिकल्पना का परीक्षण करने के बराबर है।

2.3. प्रतिगमन गुणांक के अनुमानों के निर्धारण की सटीकता का विश्लेषण।
गड़बड़ी की भिन्नता का एक निष्पक्ष अनुमान मूल्य है:


S 2 y = 94.6484 - अस्पष्टीकृत विचरण (प्रतिगमन रेखा के चारों ओर आश्रित चर के प्रसार का माप)।
एस वाई = 9.7287 - अनुमान की मानक त्रुटि (प्रतिगमन की मानक त्रुटि)।
S a - यादृच्छिक चर का मानक विचलन a।


एस बी - यादृच्छिक चर बी का मानक विचलन।

2.4. आश्रित चर के लिए विश्वास अंतराल।
निर्मित मॉडल के आधार पर आर्थिक पूर्वानुमान यह मानता है कि चर के पूर्व-मौजूदा संबंध प्रमुख अवधि के लिए संरक्षित हैं।
प्रभावी संकेतक के आश्रित चर की भविष्यवाणी करने के लिए, मॉडल में शामिल सभी कारकों के अनुमानित मूल्यों को जानना आवश्यक है।
कारकों के अनुमानित मूल्यों को मॉडल में प्रतिस्थापित किया जाता है और अध्ययन किए गए संकेतक के बिंदु भविष्य कहनेवाला अनुमान प्राप्त किए जाते हैं। (ए + बीएक्स पी ± )
कहाँ पे

आइए हम अंतराल की सीमाओं की गणना करें जिसमें वाई के संभावित मूल्यों का 95% असीमित संख्या में अवलोकनों के साथ केंद्रित होगा और एक्स पी = 1 (-11.17 + 68.16 * 1 ± 6.4554)
(50.53;63.44)

के लिए व्यक्तिगत विश्वास अंतरालयूइस मूल्य परएक्स.
(ए + बीएक्स मैं ± )
कहाँ पे

एक्स मैं वाई = -11.17 + 68.16x मैं मैं वाई मिन वाई मैक्स
0.371 14.11 19.91 -5.8 34.02
0.399 16.02 19.85 -3.83 35.87
0.502 23.04 19.67 3.38 42.71
0.572 27.81 19.57 8.24 47.38
0.607 30.2 19.53 10.67 49.73
0.655 33.47 19.49 13.98 52.96
0.763 40.83 19.44 21.4 60.27
0.873 48.33 19.45 28.88 67.78
2.48 158.07 25.72 132.36 183.79

95% की संभावना के साथ, यह गारंटी दी जा सकती है कि असीमित संख्या में टिप्पणियों के लिए Y मान पाए गए अंतराल से आगे नहीं जाएंगे।

2.5. रेखीय प्रतीपगमन समीकरण के गुणांकों के बारे में परिकल्पना का परीक्षण करना।
1) टी-सांख्यिकी। छात्र की कसौटी।
आइए हम व्यक्तिगत प्रतिगमन गुणांक की शून्य से समानता के बारे में परिकल्पना एच 0 का परीक्षण करें (वैकल्पिक एच 1 के बराबर नहीं है) महत्व स्तर α = 0.05 पर।
टी क्रिट = (7; 0.05) = 1.895


12.8866> 1.895 से, प्रतिगमन गुणांक b के सांख्यिकीय महत्व की पुष्टि की जाती है (हम इस परिकल्पना को अस्वीकार करते हैं कि यह गुणांक शून्य है)।


2.0914> 1.895 से, प्रतिगमन गुणांक के सांख्यिकीय महत्व की पुष्टि की जाती है (हम इस परिकल्पना को अस्वीकार करते हैं कि यह गुणांक शून्य है)।

प्रतीपगमन समीकरण के गुणांकों के लिए विश्वास अंतराल।
आइए हम प्रतिगमन गुणांक के विश्वास अंतराल को निर्धारित करें, जो कि 95% की विश्वसनीयता के साथ निम्नानुसार होगा:
(बी - टी क्रिट एस बी; बी + टी क्रिट एस बी)
(68.1618 - 1.895 5.2894; 68.1618 + 1.895 5.2894)
(58.1385;78.1852)
95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस पैरामीटर का मान पाए गए अंतराल में होगा।
(ए - टी ए)
(-11.1744 - 1.895 5.3429; -11.1744 + 1.895 5.3429)
(-21.2992;-1.0496)
95% की संभावना के साथ, यह तर्क दिया जा सकता है कि इस पैरामीटर का मान पाए गए अंतराल में होगा।

2) एफ-सांख्यिकी। फिशर की कसौटी।
प्रतिगमन मॉडल के महत्व की जाँच फिशर के एफ-परीक्षण का उपयोग करके की जाती है, जिसका परिकलित मूल्य अध्ययन किए गए संकेतक की टिप्पणियों की प्रारंभिक श्रृंखला के विचरण के अनुपात और अवशिष्ट के विचरण के निष्पक्ष अनुमान के रूप में पाया जाता है। इस मॉडल के लिए अनुक्रम।
यदि परिकलित मान lang = EN-US> n-m-1) स्वतंत्रता की डिग्री किसी दिए गए महत्व स्तर के लिए सारणीबद्ध मान से अधिक है, तो मॉडल को महत्वपूर्ण माना जाता है।

जहाँ m मॉडल में कारकों की संख्या है।
निम्नलिखित एल्गोरिथम का उपयोग करके युग्मित रैखिक प्रतिगमन के सांख्यिकीय महत्व का अनुमान लगाया गया है:
1. एक शून्य परिकल्पना सामने रखी जाती है कि समग्र रूप से समीकरण सांख्यिकीय रूप से महत्वहीन है: एच 0: आर 2 = 0 महत्व स्तर α पर।
2. अगला, एफ-मानदंड का वास्तविक मूल्य निर्धारित किया जाता है:


जहां एम = 1 युग्मित प्रतिगमन के लिए।
3. सारणीबद्ध मान किसी दिए गए महत्व स्तर के लिए फिशर वितरण तालिकाओं से निर्धारित किया जाता है, इस बात को ध्यान में रखते हुए कि वर्गों के कुल योग (अधिक विचरण) के लिए स्वतंत्रता की डिग्री की संख्या 1 है और अवशिष्ट की स्वतंत्रता की डिग्री की संख्या है रैखिक प्रतिगमन के लिए वर्गों (कम विचरण) का योग n-2 है ...
4. यदि एफ-मानदंड का वास्तविक मान सारणीबद्ध एक से कम है, तो वे कहते हैं कि शून्य परिकल्पना को अस्वीकार करने का कोई कारण नहीं है।
अन्यथा, शून्य परिकल्पना को खारिज कर दिया जाता है और समीकरण के सांख्यिकीय महत्व के बारे में एक वैकल्पिक परिकल्पना को समग्र रूप से संभाव्यता (1-α) के साथ स्वीकार किया जाता है।
स्वतंत्रता की डिग्री के साथ मानदंड का तालिका मान k1 = 1 और k2 = 7, Fkp = 5.59
चूंकि वास्तविक मान F> Fkp, निर्धारण का गुणांक सांख्यिकीय रूप से महत्वपूर्ण है (प्रतिगमन समीकरण का पाया गया अनुमान सांख्यिकीय रूप से विश्वसनीय है)।

अवशेषों के स्वत: सहसंबंध की जांच.
ओएलएस का उपयोग करके गुणात्मक प्रतिगमन मॉडल के निर्माण के लिए एक महत्वपूर्ण शर्त अन्य सभी टिप्पणियों में विचलन के मूल्यों से यादृच्छिक विचलन के मूल्यों की स्वतंत्रता है। यह सुनिश्चित करता है कि किसी भी विचलन और विशेष रूप से आसन्न विचलन के बीच कोई संबंध नहीं है।
ऑटोसहसंबंध (सीरियल सहसंबंध)समय (समय श्रृंखला) या अंतरिक्ष (क्रॉस श्रृंखला) में आदेशित देखे गए संकेतकों के बीच सहसंबंध के रूप में परिभाषित किया गया है। समय-श्रृंखला डेटा का उपयोग करते समय और क्रॉस-सेक्शनल डेटा का उपयोग करते समय बहुत कम ही रिग्रेशन विश्लेषण में अवशिष्ट (विचरण) का स्वत: सहसंबंध पाया जाता है।
आर्थिक कार्यों में, यह बहुत अधिक सामान्य है सकारात्मक स्वसहसंबंधसे नकारात्मक स्वसहसंबंध... ज्यादातर मामलों में, सकारात्मक ऑटोसहसंबंध कुछ कारकों के दिशात्मक निरंतर प्रभाव के कारण होता है जिन्हें मॉडल में ध्यान में नहीं रखा गया था।
नकारात्मक स्वसहसंबंधवास्तव में इसका मतलब है कि एक सकारात्मक विचलन के बाद एक नकारात्मक और इसके विपरीत होता है। यह स्थिति तब हो सकती है जब मौसमी आंकड़ों (सर्दी-गर्मी) के अनुसार शीतल पेय की मांग और आय के बीच समान संबंध माना जाए।
के बीच में स्वसहसंबंध के मुख्य कारण, निम्नलिखित को प्रतिष्ठित किया जा सकता है:
1. विशिष्टता त्रुटियां। मॉडल में किसी भी महत्वपूर्ण व्याख्यात्मक चर को ध्यान में रखने में विफलता या निर्भरता के रूप का गलत विकल्प आमतौर पर प्रतिगमन रेखा से अवलोकन बिंदुओं के व्यवस्थित विचलन का कारण बनता है, जिससे स्वत: सहसंबंध हो सकता है।
2. जड़ता। कई आर्थिक संकेतक (मुद्रास्फीति, बेरोजगारी, जीएनपी, आदि) में एक निश्चित चक्रीय प्रकृति होती है जो व्यावसायिक गतिविधि की तरंग से जुड़ी होती है। इसलिए, संकेतकों में परिवर्तन तुरंत नहीं होता है, लेकिन एक निश्चित जड़ता है।
3. मकड़ी का जाला प्रभाव। कई औद्योगिक और अन्य क्षेत्रों में, आर्थिक संकेतक एक अंतराल (समय अंतराल) के साथ आर्थिक स्थितियों में बदलाव का जवाब देते हैं।
4. डेटा चौरसाई। अक्सर, एक निश्चित लंबी अवधि के लिए डेटा इसके घटक अंतराल पर औसत डेटा द्वारा प्राप्त किया जाता है। इससे उतार-चढ़ाव की एक निश्चित चौरसाई हो सकती है जो कि विचाराधीन अवधि के भीतर मौजूद थे, जो बदले में स्वत: सहसंबंध का कारण बन सकता है।
ऑटोसहसंबंध के परिणाम विषमलैंगिकता के समान हैं: टी- और एफ-सांख्यिकी से निष्कर्ष जो प्रतिगमन गुणांक और निर्धारण के गुणांक के महत्व को निर्धारित करते हैं, गलत हो सकते हैं।

ऑटोसहसंबंध का पता लगाना

1. ग्राफिकल विधि
स्वतःसहसंबंध को ग्राफिक रूप से परिभाषित करने के लिए कई विकल्प हैं। उनमें से एक विचलन ई को उनकी प्राप्ति के क्षणों से जोड़ता है। इस मामले में, एब्सिस्सा अक्ष पर, या तो सांख्यिकीय डेटा प्राप्त करने का समय या अवलोकन की क्रमिक संख्या स्थगित कर दी जाती है, और विचलन ई (या विचलन के अनुमान) को ऑर्डिनेट अक्ष के साथ प्लॉट किया जाता है।
यह मान लेना स्वाभाविक है कि यदि विचलन के बीच एक निश्चित संबंध होता है, तो स्वत: सहसंबंध होता है। निर्भरता की अनुपस्थिति सबसे अधिक संभावना स्वत: सहसंबंध की अनुपस्थिति का संकेत देगी।
यदि आप e i बनाम e i-1 का ग्राफ़ बनाते हैं तो स्वतः सहसंबंध स्पष्ट हो जाता है।

डारबिन-वाटसन मानदंड.
यह परीक्षण स्वतः सहसंबंध का पता लगाने के लिए जाना जाता है।
प्रारंभिक चरण में प्रतिगमन समीकरण के सांख्यिकीय विश्लेषण में, अक्सर एक पूर्वापेक्षा की व्यवहार्यता की जांच की जाती है: आपस में विचलन की सांख्यिकीय स्वतंत्रता के लिए शर्तें। इस मामले में, ई के पड़ोसी मूल्यों की असंबद्धता की जाँच की जाती है।

आप वाई (एक्स) ई मैं = वाई-वाई (एक्स) ई 2 (ई आई - ई आई -1) 2
15.6 14.11 1.49 2.21 0
19.9 16.02 3.88 15.04 5.72
22.7 23.04 -0.3429 0.1176 17.81
34.2 27.81 6.39 40.78 45.28
44.5 30.2 14.3 204.49 62.64
26.8 33.47 -6.67 44.51 439.82
35.7 40.83 -5.13 26.35 2.37
30.6 48.33 -17.73 314.39 158.7
161.9 158.07 3.83 14.66 464.81
662.54 1197.14

विचलन के सहसंबंध का विश्लेषण करने के लिए, डर्बिन-वाटसन आँकड़ों का उपयोग किया जाता है:

महत्वपूर्ण मान d 1 और d 2 आवश्यक महत्व स्तर α, टिप्पणियों की संख्या n = 9 और व्याख्यात्मक चर की संख्या m = 1 के लिए विशेष तालिकाओं के आधार पर निर्धारित किए जाते हैं।
यदि निम्न स्थिति सत्य है, तो कोई स्व-सहसंबंध नहीं है:
घ 1< DW и d 2 < DW < 4 - d 2 .
तालिकाओं का उल्लेख किए बिना, आप एक अनुमानित नियम का उपयोग कर सकते हैं और मान सकते हैं कि अवशिष्टों का कोई स्वत: सहसंबंध नहीं है यदि 1.5< DW < 2.5. Для более надежного вывода целесообразно обращаться к табличным значениям.

सहसंबंध निर्भरता का अध्ययन चर के बीच ऐसे संबंधों के अध्ययन पर आधारित है जिसमें एक चर के मान, इसे आश्रित चर के रूप में लिया जा सकता है, "औसतन" परिवर्तन इस पर निर्भर करता है कि अन्य चर क्या मान लेता है, आश्रित चर के संबंध में कारण के रूप में माना जाता है। इस कारण की कार्रवाई विभिन्न कारकों की जटिल बातचीत की स्थितियों में की जाती है, जिसके परिणामस्वरूप पैटर्न की अभिव्यक्ति संभावनाओं के प्रभाव से अस्पष्ट होती है। विशेषता-कारक के मूल्यों के किसी दिए गए समूह के लिए प्रभावी विशेषता के औसत मूल्यों की गणना करके, दुर्घटनाओं का प्रभाव आंशिक रूप से समाप्त हो जाता है। सैद्धांतिक संचार लाइन के मापदंडों की गणना करके, उनका आगे उन्मूलन किया जाता है और कारक "x" में परिवर्तन के साथ "y" में एक स्पष्ट (रूप में) परिवर्तन प्राप्त किया जाता है।

स्टोकेस्टिक संबंधों का अध्ययन करने के लिए, दो समानांतर श्रृंखलाओं की तुलना करने की विधि, विश्लेषणात्मक समूहों की विधि, सहसंबंध विश्लेषण, प्रतिगमन विश्लेषण और कुछ गैर-पैरामीट्रिक विधियों का व्यापक रूप से उपयोग किया जाता है। सामान्य तौर पर, संबंधों के अध्ययन के क्षेत्र में आँकड़ों का कार्य न केवल उनकी उपस्थिति, दिशा और संबंध की ताकत को निर्धारित करना है, बल्कि प्रभावी पर कारक संकेतों के प्रभाव के रूप (विश्लेषणात्मक अभिव्यक्ति) को भी निर्धारित करना है। इसे हल करने के लिए, सहसंबंध और प्रतिगमन विश्लेषण के तरीकों का उपयोग किया जाता है।

अध्याय 1. प्रतिगमन समीकरण: सैद्धांतिक आधार

1.1. प्रतिगमन समीकरण: सार और कार्यों के प्रकार

प्रतिगमन (अव्य। प्रतिगमन- रिवर्स आंदोलन, विकास के अधिक जटिल रूपों से कम जटिल में संक्रमण) संभाव्यता सिद्धांत और गणितीय आंकड़ों में बुनियादी अवधारणाओं में से एक है, जो मूल्यों पर एक यादृच्छिक चर के औसत मूल्य की निर्भरता को व्यक्त करता है। एक और यादृच्छिक चर या कई यादृच्छिक चर। इस अवधारणा को फ्रांसिस गैल्टन ने 1886 में पेश किया था।

सैद्धांतिक प्रतिगमन रेखा वह रेखा है जिसके चारों ओर सहसंबंध क्षेत्र के बिंदुओं को समूहीकृत किया जाता है और जो मुख्य दिशा, संबंध की मुख्य प्रवृत्ति को इंगित करता है।

सैद्धांतिक प्रतिगमन रेखा को प्रभावी विशेषता "y" के औसत मूल्यों में परिवर्तन को प्रतिबिंबित करना चाहिए क्योंकि कारक विशेषता "x" के मूल्यों में परिवर्तन होता है, बशर्ते कि अन्य सभी - कारक "x" के संबंध में यादृच्छिक - कारणों को पूरी तरह से रद्द कर दिया गया है। इसलिए, इस रेखा को खींचा जाना चाहिए ताकि सैद्धांतिक प्रतिगमन रेखा के संबंधित बिंदुओं से सहसंबंध क्षेत्र के बिंदुओं के विचलन का योग शून्य के बराबर हो, और इन विचलन के वर्गों का योग न्यूनतम मूल्य हो।

y = f (x) - समाश्रयण समीकरण चरों के बीच सांख्यिकीय संबंध के लिए एक सूत्र है।

एक समतल पर एक सीधी रेखा (एक द्वि-विमीय समष्टि में) समीकरण y = a + b * x द्वारा दी गई है। अधिक विस्तार से: चर y को एक स्थिर (ए) और एक ढलान (बी) के रूप में चर x से गुणा करके व्यक्त किया जा सकता है। स्थिरांक को कभी-कभी अवरोधन भी कहा जाता है, और ढलान को कभी-कभी प्रतिगमन या बी-गुणांक कहा जाता है।

प्रतिगमन विश्लेषण में एक महत्वपूर्ण कदम फ़ंक्शन के प्रकार को निर्धारित करना है जो सुविधाओं के बीच संबंध को दर्शाता है। मुख्य आधार अध्ययन की गई निर्भरता की प्रकृति, उसके तंत्र का सार्थक विश्लेषण होना चाहिए। उसी समय, प्रभावी संकेतक के साथ प्रत्येक कारक के संबंध के रूप को सैद्धांतिक रूप से प्रमाणित करना हमेशा संभव नहीं होता है, क्योंकि अध्ययन की गई सामाजिक-आर्थिक घटनाएं बहुत जटिल होती हैं और उनके स्तर को बनाने वाले कारक बारीकी से परस्पर जुड़े होते हैं और परस्पर क्रिया करते हैं। एक दूसरे के साथ। इसलिए, सैद्धांतिक विश्लेषण के आधार पर, कनेक्शन की दिशा, अध्ययन की गई आबादी में इसे बदलने की संभावना, रैखिक संबंध का उपयोग करने की वैधता, चरम मूल्यों की संभावित उपस्थिति आदि के बारे में सबसे सामान्य निष्कर्ष अक्सर निकाले जा सकते हैं। . विशिष्ट साक्ष्य का विश्लेषण ऐसी धारणाओं का एक आवश्यक पूरक होना चाहिए।

अनुभवजन्य प्रतिगमन रेखा के आधार पर संचार लाइन का अनुमानित विचार प्राप्त किया जा सकता है। अनुभवजन्य प्रतिगमन रेखा आमतौर पर एक टूटी हुई रेखा होती है, जिसमें कम या ज्यादा महत्वपूर्ण किंक होती है। यह इस तथ्य से समझाया गया है कि अन्य बेहिसाब कारकों का प्रभाव जो प्रभावी संकेतक की भिन्नता को प्रभावित करता है, औसत में अवलोकनों की अपर्याप्त संख्या के कारण पूरी तरह से समाप्त नहीं होता है, इसलिए अनुभवजन्य लिंक का उपयोग प्रकार के चयन और पुष्टि के लिए किया जा सकता है। सैद्धांतिक वक्र बशर्ते कि अवलोकनों की संख्या पर्याप्त हो। महान।

विशिष्ट अध्ययनों के तत्वों में से एक निर्भरता के विभिन्न समीकरणों की तुलना है, जो मॉडल के प्रतिस्पर्धी वेरिएंट द्वारा अनुभवजन्य डेटा के सन्निकटन की गुणवत्ता के मानदंड के उपयोग पर आधारित है। निम्नलिखित प्रकार के कार्यों का उपयोग अक्सर संबंधों को चिह्नित करने के लिए किया जाता है आर्थिक संकेतक:

1. रैखिक:

2. अतिशयोक्तिपूर्ण:

3. सांकेतिक:

4. परवलयिक:

5. डिग्री:

6. लघुगणक:

7. रसद:

एक व्याख्यात्मक और एक व्याख्यात्मक चर वाला मॉडल एक जोड़ीदार प्रतिगमन मॉडल है। यदि दो या दो से अधिक व्याख्यात्मक (कारक) चर का उपयोग किया जाता है, तो हम एक बहु प्रतिगमन मॉडल का उपयोग करने की बात करते हैं। साथ ही, इन चरों को जोड़ने वाले रैखिक, घातांक, अतिशयोक्तिपूर्ण, घातांक और अन्य प्रकार के कार्यों को विकल्प के रूप में चुना जा सकता है।

पैरामीटर ए और बी को खोजने के लिए, प्रतिगमन समीकरण कम से कम वर्ग विधि का उपयोग करते हैं। अनुभवजन्य डेटा को सर्वोत्तम रूप से फिट करने वाले फ़ंक्शन को खोजने के लिए कम से कम वर्ग विधि को लागू करते समय, यह माना जाता है कि सैद्धांतिक प्रतिगमन रेखा से अनुभवजन्य बिंदुओं के विचलन के वर्गों का बैग न्यूनतम मूल्य होना चाहिए।

न्यूनतम वर्ग विधि की कसौटी इस प्रकार लिखी जा सकती है:

नतीजतन, अनुभवजन्य डेटा के साथ सबसे संगत सीधी रेखा के पैरामीटर ए और बी को निर्धारित करने के लिए कम से कम वर्ग विधि का उपयोग एक चरम समस्या में कम हो गया है।

रेटिंग के संबंध में निम्नलिखित निष्कर्ष निकाले जा सकते हैं:

1. कम से कम वर्ग अनुमान नमूना कार्य हैं जो उन्हें गणना करना आसान बनाते हैं।

2. कम से कम वर्ग अनुमान सैद्धांतिक प्रतिगमन गुणांक के बिंदु अनुमान हैं।

3. अनुभवजन्य प्रतिगमन रेखा अनिवार्य रूप से बिंदु x, y से होकर गुजरती है।

4. अनुभवजन्य प्रतिगमन समीकरण इस तरह से बनाया गया है कि विचलन का योग

.

अनुभवजन्य और सैद्धांतिक लिंक का एक ग्राफिक प्रतिनिधित्व चित्र 1 में दिखाया गया है।


समीकरण में b पैरामीटर प्रतिगमन गुणांक है। प्रत्यक्ष सहसंबंध की उपस्थिति में, प्रतिगमन गुणांक का सकारात्मक मूल्य होता है, और उलटा संबंध के मामले में, प्रतिगमन गुणांक नकारात्मक होता है। प्रतिगमन गुणांक दिखाता है कि जब कारक विशेषता "x" एक से बदल जाती है, तो औसतन प्रभावी विशेषता "y" का मान कितना बदल जाता है। ज्यामितीय रूप से, प्रतिगमन गुणांक x-अक्ष के सापेक्ष सहसंबंध समीकरण का प्रतिनिधित्व करने वाली सीधी रेखा का ढलान है (समीकरण के लिए)

).

निर्भरताओं को पुनर्प्राप्त करने के लिए समर्पित बहुभिन्नरूपी सांख्यिकीय विश्लेषण के खंड को प्रतिगमन विश्लेषण कहा जाता है। "रैखिक प्रतिगमन विश्लेषण" शब्द का उपयोग तब किया जाता है जब माना गया कार्य रैखिक रूप से अनुमानित मापदंडों पर निर्भर करता है (स्वतंत्र चर पर निर्भरता मनमानी हो सकती है)। अनुमान सिद्धांत

रैखिक प्रतिगमन विश्लेषण के मामले में अज्ञात पैरामीटर अच्छी तरह से विकसित होते हैं। यदि कोई रैखिकता नहीं है और एक रैखिक समस्या को पारित करना असंभव है, तो, एक नियम के रूप में, किसी को अनुमानों से अच्छे गुणों की उम्मीद नहीं करनी चाहिए। आइए हम विभिन्न प्रकार की निर्भरता के मामले में दृष्टिकोण प्रदर्शित करें। यदि निर्भरता में बहुपद (बहुपद) का रूप है। यदि सहसंबंध की गणना दो चर के बीच संबंध की ताकत को दर्शाती है, तो प्रतिगमन विश्लेषण इस संबंध के प्रकार को निर्धारित करने के लिए कार्य करता है और दूसरे (स्वतंत्र) के मूल्य के आधार पर एक (आश्रित) चर के मूल्य की भविष्यवाणी करना संभव बनाता है। ) चर। रेखीय समाश्रयण विश्लेषण के लिए, आश्रित चर का एक अंतराल (या क्रमसूचक) पैमाना होना चाहिए। उसी समय, बाइनरी लॉजिस्टिक रिग्रेशन किसी भी पैमाने से संबंधित किसी अन्य चर पर एक द्विबीजपत्री चर की निर्भरता को प्रकट करता है। प्रोबिट विश्लेषण के लिए वही आवेदन शर्तें मान्य हैं। यदि आश्रित चर श्रेणीबद्ध है, लेकिन दो से अधिक श्रेणियां हैं, तो बहुराष्ट्रीय रसद प्रतिगमन यहां एक उपयुक्त विधि होगी; आप अंतराल पैमाने से संबंधित चर के बीच गैर-रैखिक संबंधों का विश्लेषण भी कर सकते हैं। इसके लिए नॉनलाइनियर रिग्रेशन विधि का इरादा है।

दो अध्ययन की गई विशेषताओं के बीच एक रैखिक प्रकार के कनेक्शन के साथ, सहसंबंधों की गणना के अलावा, प्रतिगमन गुणांक की गणना लागू की जाती है।

एक सीधी रेखा के सहसंबंध के मामले में, एक विशेषता में प्रत्येक परिवर्तन दूसरी विशेषता में एक अच्छी तरह से परिभाषित परिवर्तन से मेल खाता है। हालाँकि, सहसंबंध गुणांक इस संबंध को केवल सापेक्ष शब्दों में - एक इकाई के अंशों में दर्शाता है। समाश्रयण विश्लेषण की सहायता से संबंध का यह मान नामित इकाइयों में प्राप्त किया जाता है। माप की प्रति इकाई में दूसरा परिवर्तन होने पर पहला संकेत औसतन जिस राशि से बदलता है उसे प्रतिगमन गुणांक कहा जाता है।

सहसंबंध के विपरीत, प्रतिगमन विश्लेषण व्यापक जानकारी देता है, क्योंकि दो प्रतिगमन गुणांक की गणना करके आरएक्स / वाईतथा आरयू / एक्सपहली विशेषता की दूसरे पर निर्भरता और दूसरी पर पहली पर निर्भरता दोनों को निर्धारित करना संभव है। एक समीकरण का उपयोग करते हुए एक प्रतिगमन संबंध की अभिव्यक्ति एक विशेषता के एक निश्चित मूल्य को दूसरी विशेषता के मूल्य को स्थापित करने की अनुमति देती है।

प्रतीपगमन गुणांक R सहसंबंध गुणांक का गुणनफल है और प्रत्येक विशेषता के लिए परिकलित मानक विचलन का अनुपात है। इसकी गणना सूत्र द्वारा की जाती है

जहाँ, R प्रतिगमन गुणांक है; एसएक्स पहली विशेषता का मानक विचलन है, जो दूसरे में परिवर्तन के कारण बदलता है; SУ - दूसरी विशेषता का मानक विचलन उस परिवर्तन के कारण जिसमें पहली विशेषता बदल जाती है; r इन विशेषताओं के बीच सहसंबंध गुणांक है; एक्स - फ़ंक्शन; वाई-तर्क।

यह सूत्र x के मान का परिमाण निर्धारित करता है जब y माप की प्रति इकाई बदलता है। यदि एक रिवर्स गणना आवश्यक है, तो आप y का मान पा सकते हैं जब x सूत्र का उपयोग करके माप की प्रति इकाई बदलता है:


इस मामले में, एक विशेषता को दूसरे परिवर्तनों के संबंध में बदलने में सक्रिय भूमिका, पिछले सूत्र की तुलना में, तर्क एक फ़ंक्शन बन जाता है और इसके विपरीत। नामित व्यंजक में SX और SY स्वीकार किए जाते हैं।

आर और आर के मूल्यों के बीच एक स्पष्ट संबंध है, इस तथ्य में व्यक्त किया गया है कि y में प्रतिगमन x और x में प्रतिगमन y का गुणनफल सहसंबंध गुणांक के वर्ग के बराबर है, अर्थात।

आरएक्स / वाई * आरई / एक्स = आर 2

यह इंगित करता है कि सहसंबंध गुणांक किसी दिए गए नमूने के प्रतिगमन गुणांक के दोनों मूल्यों का ज्यामितीय माध्य है। इस सूत्र का उपयोग गणनाओं की शुद्धता की जांच के लिए किया जा सकता है।

गणना मशीनों पर डिजिटल सामग्री को संसाधित करते समय, विस्तृत प्रतिगमन गुणांक सूत्रों का उपयोग किया जा सकता है:

आर या


प्रतिगमन गुणांक के लिए, इसकी प्रतिनिधित्व त्रुटि की गणना की जा सकती है। प्रतिगमन गुणांक त्रुटि द्विघात अनुपात के अनुपात से गुणा किए गए सहसंबंध गुणांक त्रुटि के बराबर है:

प्रतिगमन गुणांक की विश्वसनीयता की कसौटी की गणना सामान्य सूत्र का उपयोग करके की जाती है:

नतीजतन, यह सहसंबंध गुणांक की विश्वसनीयता की कसौटी के बराबर है:

tR मान की विश्वसनीयता = n - 2 पर विद्यार्थी की तालिका के अनुसार स्थापित की जाती है, जहाँ n प्रेक्षण युग्मों की संख्या है।

वक्रतापूर्ण प्रतिगमन।

प्रतिगमन, घुमावदार... कोई भी गैर-रेखीय प्रतिगमन जिसमें एक चर (y) में परिवर्तन के लिए प्रतिगमन समीकरण t के कार्य के रूप में दूसरे (x) में बदलता है, द्विघात, घन, या एक उच्च क्रम समीकरण है। हालांकि यह गणितीय रूप से एक प्रतिगमन समीकरण प्राप्त करना संभव है जो वक्र पर प्रत्येक झुकाव को फिट करेगा, इनमें से अधिकतर गड़बड़ी नमूनाकरण या माप त्रुटियों के परिणामस्वरूप होती है, और इस तरह के "पूर्ण" फिट कुछ भी नहीं करते हैं। यह निर्धारित करना हमेशा आसान नहीं होता है कि एक वक्रीय प्रतिगमन एक डेटासेट में फिट बैठता है या नहीं, हालांकि सांख्यिकीय परीक्षण यह निर्धारित करने के लिए मौजूद हैं कि क्या समीकरण की प्रत्येक उच्च शक्ति उस डेटासेट के फिट होने की डिग्री को महत्वपूर्ण रूप से बढ़ाती है।

कर्व फिटिंग उसी तरह से की जाती है जैसे स्ट्रेट लाइन फिटिंग में कम से कम वर्ग विधि का उपयोग किया जाता है। प्रतिगमन रेखा को सहसंबंध क्षेत्र के प्रत्येक बिंदु पर वर्ग दूरी के योग के न्यूनतम योग की शर्त को पूरा करना चाहिए। इस स्थिति में, समीकरण (1) में, y x j के वास्तविक मानों से चयनित वक्रीय संबंध के समीकरण का उपयोग करके निर्धारित फ़ंक्शन का परिकलित मान है। उदाहरण के लिए, यदि कनेक्शन का अनुमान लगाने के लिए दूसरे क्रम के परवलय को चुना जाता है, तो y = a + bx + cx2, (14)। और वक्र पर स्थित एक बिंदु और संबंधित के लिए सहसंबंध क्षेत्र के दिए गए बिंदु के बीच का अंतर तर्क को समीकरण (3) के रूप में yj = yj (a + bx + cx2) के रूप में लिखा जा सकता है (15) इस मामले में, सहसंबंध क्षेत्र के प्रत्येक बिंदु से वर्ग दूरी का योग नई प्रतिगमन रेखा में दूसरे क्रम के परवलय के मामले का रूप होगा: S 2 = yj 2 = 2 (16) इस योग की न्यूनतम शर्त के आधार पर, a, b और c के संबंध में S 2 का आंशिक व्युत्पन्न शून्य के बराबर है . आवश्यक परिवर्तन करने के बाद, हमें ए, बी और सी निर्धारित करने के लिए तीन अज्ञात के साथ तीन समीकरणों की एक प्रणाली प्राप्त होती है। , y = m a + b x + c x 2 yx = a x + b x 2 + c x 2.yx2 = a x 2 + b x 3 + c x4। (17)। ए, बी और सी के समीकरणों की प्रणाली को हल करते हुए, हम प्रतिगमन गुणांक के संख्यात्मक मान पाते हैं। मान y, x, x2, yx, yx2, x3, x4। सीधे उत्पादन माप से पाए जाते हैं। वक्रीय निर्भरता के साथ संबंध की जकड़न का अनुमान सैद्धांतिक सहसंबंध अनुपात xy है, जो दो भिन्नताओं के अनुपात का वर्गमूल है: फ़ंक्शन के परिकलित मानों y "j के विचलन का माध्य वर्ग p2 मान y के अंकगणितीय माध्य मान Y से विचलन के माध्य वर्ग के लिए पाया गया प्रतिगमन समीकरण के अनुसार yj फ़ंक्शन के वास्तविक मानों का इसके अंकगणितीय माध्य मान से: xу = (р2 / y2) 1/2 = ((y "j - Y) 2 / (yj - Y) 2) 1/2 (18) वर्ग सहसंबंध अनुपात xy2 तर्क x की परिवर्तनशीलता के कारण आश्रित चर у की कुल परिवर्तनशीलता का हिस्सा दर्शाता है। इस सूचक को निर्धारण का गुणांक कहा जाता है। सहसंबंध गुणांक के विपरीत, सहसंबंध अनुपात का मान 0 से 1 तक केवल सकारात्मक मान ले सकता है। एक कनेक्शन की अनुपस्थिति में, सहसंबंध अनुपात शून्य है, एक कार्यात्मक कनेक्शन की उपस्थिति में, यह बराबर है एक, और अलग-अलग जकड़न के प्रतिगमन कनेक्शन की उपस्थिति में, सहसंबंध अनुपात शून्य और एक के बीच के मूल्यों पर ले जाता है ... प्रतिगमन विश्लेषण में वक्र के प्रकार की पसंद का बहुत महत्व है, क्योंकि सन्निकटन की सटीकता और संबंध की जकड़न के सांख्यिकीय अनुमान चयनित संबंध के प्रकार पर निर्भर करते हैं। वक्र प्रकार चुनने का सबसे सरल तरीका सहसंबंध क्षेत्रों का निर्माण करना और इन क्षेत्रों में बिंदुओं के स्थान के आधार पर उपयुक्त प्रकार के प्रतिगमन समीकरणों का चयन करना है। प्रतिगमन विश्लेषण के तरीके आपको जटिल प्रकार के मापदंडों के अंतर्संबंध के लिए प्रतिगमन गुणांक के संख्यात्मक मूल्यों को खोजने की अनुमति देते हैं, उदाहरण के लिए, उच्च डिग्री के बहुपदों द्वारा। अक्सर, विचाराधीन प्रक्रिया या घटना की भौतिक प्रकृति के आधार पर वक्र के आकार का निर्धारण किया जा सकता है। इस घटना में तेजी से बदलती प्रक्रियाओं का वर्णन करने के लिए उच्च डिग्री के बहुपदों का उपयोग करना समझ में आता है कि इन प्रक्रियाओं के पैरामीटर में उतार-चढ़ाव की सीमाएं महत्वपूर्ण हैं। जैसा कि धातुकर्म प्रक्रिया के अनुसंधान के लिए लागू होता है, यह निचले क्रम के घटता का उपयोग करने के लिए पर्याप्त है, उदाहरण के लिए, दूसरे क्रम का परवलय। इस वक्र में एक चरम हो सकता है, जैसा कि अभ्यास ने दिखाया है, धातुकर्म प्रक्रिया की विभिन्न विशेषताओं का वर्णन करने के लिए पर्याप्त है। जोड़ीवार सहसंबंध संबंध के मापदंडों की गणना के परिणाम विश्वसनीय होंगे और व्यावहारिक मूल्य के होंगे यदि उपयोग की गई जानकारी प्रक्रिया के अन्य सभी मापदंडों की स्थिरता के साथ तर्क के उतार-चढ़ाव की विस्तृत श्रृंखला की स्थितियों के लिए प्राप्त की गई थी। नतीजतन, मापदंडों के जोड़ी सहसंबंध संबंध का अध्ययन करने के तरीकों का उपयोग केवल व्यावहारिक समस्याओं को हल करने के लिए किया जा सकता है, जब विश्लेषण किए गए तर्क को छोड़कर, फ़ंक्शन पर अन्य गंभीर प्रभावों की अनुपस्थिति में विश्वास होता है। उत्पादन की स्थिति में, इस तरह से लंबे समय तक प्रक्रिया को अंजाम देना असंभव है। हालाँकि, यदि हमारे पास प्रक्रिया के मुख्य मापदंडों के बारे में जानकारी है जो इसके परिणामों को प्रभावित करते हैं, तो इन मापदंडों के प्रभाव को गणितीय रूप से समाप्त किया जा सकता है और हमारे लिए फ़ंक्शन और रुचि के तर्क के बीच संबंध को "शुद्ध रूप" में अलग किया जा सकता है। ऐसे रिश्ते को निजी या व्यक्तिगत कहा जाता है। इसे निर्धारित करने के लिए, एकाधिक प्रतिगमन विधि का उपयोग किया जाता है।

सहसंबंध अनुपात।

सहसंबंध अनुपात और सहसंबंध सूचकांक संख्यात्मक विशेषताएं हैं जो एक यादृच्छिक चर की अवधारणा से निकटता से संबंधित हैं, या बल्कि यादृच्छिक चर की एक प्रणाली से संबंधित हैं। इसलिए, उनके अर्थ और भूमिका को पेश करने और परिभाषित करने के लिए, यादृच्छिक चर की एक प्रणाली और उनमें निहित कुछ गुणों की अवधारणा को स्पष्ट करना आवश्यक है।

एक निश्चित घटना का वर्णन करने वाले दो या दो से अधिक यादृच्छिक चर को एक प्रणाली या यादृच्छिक चर का एक जटिल कहा जाता है।

कई यादृच्छिक चरों की प्रणाली X, Y, Z,…, W को आमतौर पर (X, Y, Z,…, W) द्वारा दर्शाया जाता है।

उदाहरण के लिए, एक विमान पर एक बिंदु का वर्णन एक निर्देशांक द्वारा नहीं, बल्कि दो द्वारा किया जाता है, लेकिन अंतरिक्ष में - यहां तक ​​​​कि तीन द्वारा भी।

कई यादृच्छिक चर की एक प्रणाली के गुण सिस्टम में शामिल व्यक्तिगत यादृच्छिक चर के गुणों तक सीमित नहीं हैं, बल्कि यादृच्छिक चर के बीच पारस्परिक कनेक्शन (निर्भरता) भी शामिल हैं। इसलिए, यादृच्छिक चर की एक प्रणाली का अध्ययन करते समय, किसी को प्रकृति और निर्भरता की डिग्री पर ध्यान देना चाहिए। यह निर्भरता कम या ज्यादा स्पष्ट, कम या ज्यादा करीब हो सकती है। और अन्य मामलों में, यादृच्छिक चर व्यावहारिक रूप से स्वतंत्र हो जाते हैं।

एक यादृच्छिक चर Y को एक यादृच्छिक चर X से स्वतंत्र कहा जाता है यदि एक यादृच्छिक चर Y का वितरण नियम इस बात पर निर्भर नहीं करता है कि X ने क्या मान लिया है।

यह ध्यान दिया जाना चाहिए कि यादृच्छिक चर की निर्भरता और स्वतंत्रता हमेशा एक पारस्परिक घटना है: यदि वाई एक्स पर निर्भर नहीं है, तो एक्स का मूल्य वाई पर निर्भर नहीं करता है। इसे ध्यान में रखते हुए, हम निम्नलिखित परिभाषा दे सकते हैं यादृच्छिक चर की स्वतंत्रता।

यादृच्छिक चर X और Y स्वतंत्र कहलाते हैं यदि उनमें से प्रत्येक का वितरण नियम इस पर निर्भर नहीं करता है कि दूसरे ने क्या मूल्य लिया है। अन्यथा, मात्राएँ X और Y आश्रित कहलाती हैं।

एक यादृच्छिक चर का वितरण कानून कोई भी संबंध है जो एक यादृच्छिक चर के संभावित मूल्यों और संबंधित संभावनाओं के बीच संबंध स्थापित करता है।

यादृच्छिक चरों की "निर्भरता" की अवधारणा, जिसका उपयोग संभाव्यता के सिद्धांत में किया जाता है, मात्राओं की "निर्भरता" की सामान्य अवधारणा से कुछ अलग है, जिसका उपयोग गणित में किया जाता है। तो, "निर्भरता" के तहत गणितज्ञ का अर्थ केवल एक प्रकार की निर्भरता है - पूर्ण, कठोर, तथाकथित कार्यात्मक निर्भरता। दो मात्राएँ X और Y क्रियात्मक रूप से आश्रित कहलाती हैं, यदि उनमें से एक का मूल्य जानने के बाद, दूसरे के मूल्य का सही-सही निर्धारण करना संभव हो।

संभाव्यता के सिद्धांत में, थोड़ा अलग प्रकार की निर्भरता है - संभाव्य निर्भरता। यदि Y का मान एक संभाव्य निर्भरता द्वारा X के मान से संबंधित है, तो, X का मान जानने के बाद, Y के मान को सटीक रूप से इंगित करना असंभव है, लेकिन आप इसके वितरण कानून को इंगित कर सकते हैं कि मूल्य किस मूल्य पर निर्भर करता है एक्स लिया है।

संभाव्य निर्भरता कमोबेश करीब हो सकती है; जैसे-जैसे संभाव्य निर्भरता की निकटता बढ़ती है, यह कार्यात्मक रूप से अधिक से अधिक पहुंचती है। इस प्रकार, कार्यात्मक निर्भरता को निकटतम संभाव्यता निर्भरता के चरम, सीमित मामले के रूप में माना जा सकता है। एक और चरम मामला यादृच्छिक चर की पूर्ण स्वतंत्रता है। इन दो चरम मामलों के बीच संभाव्य निर्भरता के सभी क्रम हैं - सबसे मजबूत से सबसे कमजोर तक।

यादृच्छिक चर के बीच संभाव्य संबंध अक्सर व्यवहार में सामने आते हैं। यदि यादृच्छिक चर X और Y एक संभाव्य संबंध में हैं, तो इसका मतलब यह नहीं है कि X के मान में परिवर्तन के साथ, Y का मान बिल्कुल निश्चित तरीके से बदल जाता है; इसका अर्थ केवल यह है कि X के मान में परिवर्तन के साथ, Y का मान भी परिवर्तित हो जाता है (X में वृद्धि के साथ वृद्धि या कमी)। यह प्रवृत्ति केवल सामान्य शब्दों में देखी जाती है, और प्रत्येक व्यक्तिगत मामले में इससे विचलन संभव है।