प्रभाव - आँकड़ों में stata - विदेशी मुद्रा


स्टेटा परिचय का उपयोग करते हुए एकाधिक प्रतिगमन विश्लेषण एकाधिक प्रतिगमन (सरल रेखीय प्रतिगमन का विस्तार) दो या अधिक स्वतंत्र चर के मूल्य के आधार पर एक आश्रित चर के मूल्य की भविष्यवाणी करने के लिए उपयोग किया जाता है (जो कि परिणाम चर के रूप में भी जाना जाता है) )। उदाहरण के लिए, आप यह निर्धारित करने के लिए कि क्या परीक्षा की चिंता का अभ्यास coursework चिह्न, संशोधन समय, व्याख्यान उपस्थिति और आईक्यू स्कोर (यानी आश्रित चर परीक्षा परीक्षा होगी, और चार स्वतंत्र चर, पाठ्य का निशान, संशोधन होगा) के आधार पर आप कई प्रतिगमन का उपयोग कर सकते हैं। समय, व्याख्यान उपस्थिति और बुद्धि स्कोर)। वैकल्पिक रूप से, आप यह निर्धारित करने के लिए कि आप आयु, लिंग और शैक्षिक स्तर (यानी निर्भर परिवर्तनीय आय होंगे, और तीन स्वतंत्र चर, उम्र, लिंग और शैक्षिक स्तर) के आधार पर अनुमान लगाया जा सकता है कि आप कई प्रतिगमन का उपयोग कर सकते हैं। यदि आपके पास डिक्टोटॉमस आश्रित चर है तो आप एक द्विपद रसद प्रतिगमन का उपयोग कर सकते हैं। एकाधिक प्रतिगमन आपको मॉडल के समग्र फिट (विचरण समझाया) और प्रत्येक भिन्न चर के सापेक्ष योगदान को कुल विचरण को समझाया जाने की अनुमति देता है। उदाहरण के लिए, आप यह जानना चाह सकते हैं कि परीक्षा की चिंता में कितनी विविधता पाठ्यचर्या चिह्न, संशोधन समय, व्याख्यान उपस्थिति और आईक्यू स्कोर के रूप में समझा जा सकता है, लेकिन विचरण को स्पष्ट करने में प्रत्येक स्वतंत्र चर के सापेक्ष योगदान भी हो सकता है। यह त्वरित आरंभ मार्गदर्शिका आपको दिखाती है कि स्ताटा का उपयोग करते हुए कई प्रतिगमन कैसे करें, साथ ही साथ इस परीक्षा से परिणामों की व्याख्या और रिपोर्ट कैसे करें। हालांकि, इससे पहले कि आप इस प्रक्रिया को लागू करें, आपको अलग-अलग मान्यताओं को समझना होगा कि आपके डेटा को एक वैध परिणाम देने के लिए कई प्रतिगमन के लिए मिलना चाहिए। हम इन धारणाओं पर चर्चा करते हैं। धारणाएं ऐसे आठ धारणाएं हैं जो एक से अधिक प्रतिगमन को आगे बढ़ाती हैं। यदि इन आठ धारणाओं में से कोई भी नहीं मिले, तो आप कई प्रतिगमन का उपयोग करके अपने डेटा का विश्लेषण नहीं कर सकते क्योंकि आपको एक वैध परिणाम नहीं मिलेगा। मान्यताओं 1 और 2 चर की अपनी पसंद से संबंधित होने के बाद से, उन्हें स्टेटा का उपयोग करने के लिए परीक्षण नहीं किया जा सकता। हालांकि, आपको यह तय करना चाहिए कि आगे बढ़ने से पहले आपका अध्ययन इन मान्यताओं को पूरा करता है या नहीं। धारणा 1: आपके निर्भर चर को निरंतर स्तर पर मापा जाना चाहिए। ऐसे निरंतर चर के उदाहरणों में ऊँचाई (पैर और इंच में मापा जाता है), तापमान (176 सी में मापा जाता है), वेतन (यूएस डॉलर में मापा जाता है), संशोधन समय (घंटों में मापा जाता है), खुफिया (आईक्यू स्कोर का उपयोग करके मापा जाता है), प्रतिक्रिया समय मिलीसेकंड में), परीक्षण का प्रदर्शन (0 से 100 तक मापा जाता है), विक्रय (प्रति माह लेन-देन की संख्या में मापा जाता है), और आगे। यदि आप अनिश्चित हैं कि आपके निरंतर चर निरंतर है (यानी अंतराल या अनुपात स्तर पर मापा जाता है), तो हमारे प्रकार के वैरिएबल मार्गदर्शिका देखें। धारणा 2: आपके पास दो या अधिक स्वतंत्र चर हैं जो निरंतर या स्पष्ट स्तर पर मापा जाना चाहिए। निरंतर चर के उदाहरणों के लिए ऊपर बुलेट देखें स्पष्ट चर के उदाहरण लिंग (जैसे 2 समूहों: पुरुष और महिला), जातीयता (उदाहरण के लिए 3 समूहों: कोकेशियान, अफ्रीकी अमेरिकी और हिस्पैनिक), शारीरिक गतिविधि स्तर (जैसे 4 समूहों: गतिहीन, कम, मध्यम और उच्च), व्यवसाय (उदाहरण 5 समूहों: सर्जन, डॉक्टर, नर्स, दंत चिकित्सक, चिकित्सक), और आगे भी। इस गाइड में, हम आपको कई प्रतिगमन प्रक्रिया दिखाते हैं क्योंकि हमारे पास निरंतर और स्पष्ट स्वतंत्र चर का मिश्रण है। नोट: यदि आपके पास केवल स्पष्ट स्वतंत्र चर (अर्थात निरंतर स्वतंत्र चर) है, तो यह दो-तरफा एनोवा (दो स्पष्ट स्वतंत्र चर के लिए) या फैक्ट्रोरील एनोवा (तीन या अधिक स्पष्ट के लिए) के परिप्रेक्ष्य से विश्लेषण के लिए अधिक सामान्य है एकाधिक प्रतिगमन के बजाय स्वतंत्र चर) सौभाग्य से, आप स्टेटा का उपयोग करके 3, 4, 5, 6, 7 और 8 मान्यताओं को देख सकते हैं। जब 3, 4, 5, 6, 7 और 8 की मान्यताओं पर आगे बढ़ते हैं, तो हम उन्हें इस क्रम में परीक्षण करने का सुझाव देते हैं क्योंकि यह एक आदेश का प्रतिनिधित्व करता है, यदि धारणा का उल्लंघन सही नहीं है, तो आप कई बार उपयोग नहीं कर सकेंगे प्रतिगमन। असल में, अगर आपके डेटा में इनमें से एक या अधिक मान्यताओं में विफल रहता है, तो वास्तव में आश्चर्यचकित न हों क्योंकि पाठ्यपुस्तक के बजाय वास्तविक-दुनिया के आंकड़ों के साथ काम करते समय यह काफी सामान्य है, जो अक्सर आपको दिखाता है कि जब सबकुछ ठीक हो जाता है तो रैखिक प्रतिगमन कैसे करना चाहिए हालांकि, चिंता न करें क्योंकि जब भी आपका डेटा कुछ मान्यताओं में विफल रहता है, तो इसका समाधान करने के लिए अक्सर एक समाधान होता है (जैसे कि आपके डेटा को बदलना या इसके बजाय एक अन्य सांख्यिकीय परीक्षण का उपयोग करना)। बस याद रखें कि यदि आप यह जांच नहीं करते हैं कि आप डेटा इन मान्यताओं से पूरा करते हैं या आप उनके लिए सही तरीके से परीक्षण करते हैं, तो आप जो परिणाम प्राप्त करते हैं, वह हो सकता है कि एकाधिक प्रतिगमन चलाने के बाद वैध नहीं हो। धारणा 3: आपको अवलोकन की स्वतंत्रता होनी चाहिए (अर्थात् अवशिष्टों की आजादी), जिसे आप डरबाइन-वाटसन सांख्यिकी का उपयोग करते हुए स्ताता में जांच कर सकते हैं। धारणा 4: (ए) निर्भर चर और आपके प्रत्येक स्वतंत्र चर के बीच एक रेखीय संबंध होना चाहिए, और (बी) निर्भर चर और स्वतंत्र चर सामूहिक रूप से आप स्कैटरप्लेट और आंशिक प्रतिगमन भूखंडों का उपयोग कर स्ताटा में लीनारीिटी की जांच कर सकते हैं। धारणा 5: आपके डेटा को समरूपता दिखाने की जरूरत है यह वह जगह है जहां सबसे अच्छा फिट की रेखा के साथ भिन्नता समान होती है जैसा कि आप लाइन पर चलते हैं आप निराधारित भविष्यवाणी मूल्यों के खिलाफ छात्रित अवशेषों की साजिश रचने के द्वारा स्टेटा में होमोसेडस्टक्लिटी की जांच कर सकते हैं। धारणा 6: आपके डेटा में multicollinearity नहीं दिखाना चाहिए जो तब होता है जब आपके पास दो या अधिक स्वतंत्र चर होते हैं जो एक-दूसरे के साथ अत्यधिक सहसंबद्ध होते हैं। आप इस धारणा को स्टेटा में सहसंबंध गुणांक और टॉलरेंस वीआईएफ मानों के निरीक्षण के माध्यम से देख सकते हैं। धारणा 7: कोई महत्वपूर्ण आउटलियर्स नहीं होना चाहिए। उच्च लाभ अंक या अत्यधिक प्रभावशाली अंक जो आपके डेटा सेट में अवलोकन का प्रतिनिधित्व करते हैं जो किसी असामान्य तरीके से हैं इन्हें प्रतिगमन समीकरण पर एक बहुत ही नकारात्मक प्रभाव हो सकता है जो स्वतंत्र चर के आधार पर निर्भर चर के मूल्य की भविष्यवाणी करता है। आप आउटलेटर्स, लीवरेज पॉइंट्स और स्टेटा का उपयोग करने वाले प्रभावशाली बिंदुओं की जांच कर सकते हैं। धारणा 8: अवशिष्ट (त्रुटियों) लगभग सामान्य रूप से वितरित किया जाना चाहिए। जिसे आप हिस्टोग्राम (सुपरमॉक्स्ड सामान्य वक्र के साथ) और सामान्य पी-पी प्लॉट, या स्टूटाइज्ड अवशिष्टों का सामान्य क्यू-क्यू प्लॉट का उपयोग करके स्ताट में चेक कर सकते हैं। प्रथा में, 3, 4, 5, 6, 7 और 8 की धारणाओं की जाँच करना संभवत: आपके समय के दौरान कई प्रतिगमन को ले जाएगा। हालांकि, यह एक कठिन काम नहीं है, और Stata आपको ऐसा करने के लिए आवश्यक सभी उपकरण प्रदान करता है। अनुभाग में, स्टेटा में टेस्ट प्रक्रिया हम समझाते हैं कि स्ताटा प्रक्रिया को कई प्रतिगमन करने के लिए आवश्यक है जो मानते हैं कि कोई मान्यताओं का उल्लंघन नहीं किया गया है। सबसे पहले, हम उदाहरण का प्रयोग करते हैं जो हम स्टाटा में कई प्रतिगमन प्रक्रिया को समझाने के लिए उपयोग करते हैं। स्वास्थ्य शोधकर्ता फिटनेस और स्वास्थ्य के एक संकेतक VO 2 अधिकतम की भविष्यवाणी करने में सक्षम होना चाहता है। आम तौर पर, इस प्रक्रिया को करने के लिए महंगी प्रयोगशाला के उपकरण की आवश्यकता होती है, साथ ही व्यक्तियों को उनकी अधिकतम (यानी भौतिक थकावट के चलते व्यायाम जारी नहीं रह जाने तक) की आवश्यकता होती है। यह उन व्यक्तियों को बंद कर सकता है जो बहुत सक्रिय नहीं हैं और जो बीमार स्वास्थ्य (उदाहरण के पुराने अप्रयुक्त विषयों) के उच्च जोखिम पर हैं। इन कारणों के लिए, उन विशेषताओं के आधार पर वीओ 2 अधिकतम व्यक्तियों की भविष्यवाणी करने का एक तरीका खोजने के लिए वांछनीय रहा है जिन्हें अधिक आसानी से और सस्ते में मापा जा सकता है इसके लिए, एक शोधकर्ता ने अधिकतम प्रतिभागी अधिकतम वीओ 2 परीक्षण करने के लिए 100 प्रतिभागियों की भर्ती की, लेकिन उनकी उम्र, वजन, हृदय गति और लिंग भी दर्ज किया। हार्ट रेट 20 मिनट के अंतिम 5 मिनट के औसत, बहुत आसान, कम वर्कलोड साइक्लिंग टेस्ट। शोधकर्ताओं का लक्ष्य इन चार विशेषताओं: उम्र, वजन, हृदय गति और लिंग पर आधारित वीओ 2 अधिकतम का अनुमान लगाने में सक्षम होना है। नोट: इस गाइड के लिए इस्तेमाल किया जाने वाला उदाहरण और डेटा फर्जी है हमने इन्हें इस गाइड के प्रयोजनों के लिए बनाया है। Stata In Stata में सेटअप, हमने पांच चर बनाए: (1) VO 2 max जो अधिकतम एरोबिक क्षमता है (यानी निर्भर चर) और (2) उम्र जो प्रतिभागियों की आयु है (3) वजन जो प्रतिभागियों का भार है (तकनीकी रूप से, यह उनका द्रव्यमान है) (4) दिल का दिल जो प्रतिभागियों की हृदय गति और (5) लिंग है। जो प्रतिभागियों का लिंग है (यानी स्वतंत्र चर)। इन पांच वेरिएबल्स बनाने के बाद, हमने प्रत्येक के लिए डेटा एडिटर (एडिट) स्प्रेडशीट के पांच कॉलम में स्कोर दर्ज किया, जैसा कि नीचे दिखाया गया है: स्टेटाकार्प एलपी से लिखित अनुमति के साथ प्रकाशित स्टेटा में टेस्ट प्रक्रिया इस खंड में, हम आपको दिखाते हैं कि पिछले डेटा में आठ धारणाएं, धारणाओं में, जब आप कई आंकड़ों का इस्तेमाल करते हैं, तो स्टैट में कई प्रतिगमन का उपयोग कैसे करें। का उल्लंघन नहीं किया गया है। आप कोड या स्टेटस ग्राफ़िकल यूजर इंटरफेस (जीयूआई) का उपयोग कर कई प्रतिगमन कर सकते हैं। आपके विश्लेषण के बाद, हम आपको दिखाते हैं कि आपके परिणामों का विवरण कैसे लें। सबसे पहले, चुनें कि क्या आप कोड या स्टेटस ग्राफ़िकल यूजर इंटरफेस (जीयूआई) का उपयोग करना चाहते हैं। आपके डेटा पर कई प्रतिगमन करने के लिए कोड प्रपत्र लेता है: रिगैग निर्भर परन्तनीय स्वतंत्र वैरिएबल 1 स्वतंत्र व्हेरिएबल 2 स्वतंत्र वारीबल 3 स्वतंत्र वैरिएबल 4 हमारे उदाहरण का उपयोग करना जहां पर निर्भर चर का VO2max है और चार स्वतंत्र चर उम्र के हैं। वजन। हृदय और लिंग आवश्यक कोड होगा: VO2max age weight heartrate i. gender नोट: आप ऊपर दिए गए कोड से देखेंगे कि निरंतर स्वतंत्र चर को बस के रूप में दर्ज किया जाता है, जबकि स्पष्ट स्वतंत्र चर में उपसर्ग I है (उदाहरण के लिए उम्र की उम्र क्योंकि यह एक है निरंतर स्वतंत्र चर, लेकिन लिंग के लिए i. gender। क्योंकि यह एक स्पष्ट स्वतंत्र चर है)। इसलिए, कोड दर्ज करें, वीओ 2 एमएक्स आयु वजन दिलाने वाला i. gender रीग्रेस्ड करें। और अपने कीबोर्ड पर ReturnEnter बटन दबाएं। आप स्टेटा आउटपुट देख सकते हैं जो यहां निर्मित किया जाएगा। ग्राफ़िकल यूजर इंटरफेस (जीयूआई) स्टेटा में कई प्रतिगमन करने के लिए आवश्यक सात कदम नीचे दिखाए गए हैं: स्टैटिक्स gt रैखिक मॉडल और संबंधित टैग लीनियर प्रतिगमन मुख्य मेनू पर क्लिक करें, जैसा कि नीचे दिखाया गया है: स्टाटाकार्प एलपी से लिखित अनुमति के साथ प्रकाशित। नोट: चिंता न करें कि आप मुख्य मेनू पर आंकड़े gt रैखिक मॉडल और संबंधित जीपी रैखिक प्रतिगमन का चयन कर रहे हैं, या जिन चरणों में दिए गए चरणों में संवाद बॉक्स शीर्षक, रैखिक प्रतिगमन हैं। आपने कोई गलती नहीं की है आप कई प्रतिगमन प्रक्रिया को पूरा करने के लिए सही जगह पर हैं यह सिर्फ शीर्षक है जो स्टेटा देता है, भले ही एक बहु प्रतिगमन प्रक्रिया चलती हो। आपको रिगरेट के साथ प्रस्तुत किया जाएगा - रेखीय प्रतिगमन संवाद बॉक्स, जैसा कि नीचे दिखाया गया है: StataCorp LP से लिखित अनुमति के साथ प्रकाशित निर्भर चर, VO2max चुनें निर्भर चर से: बॉक्स और सतत स्वतंत्र चर का चयन करें, उम्र वेट और हार्टट्रेट स्वतंत्र वैरिएबल से: बॉक्स, ड्रॉप-डाउन बटन का उपयोग करके, नीचे दिखाया गया है: स्टाटाकार्प एलपी से लिखित अनुमति के साथ प्रकाशित स्पष्ट स्वतंत्र चर, लिंग का चयन करें। स्वतंत्र चर से: बॉक्स, पहले बटन पर क्लिक करके। यह आपको निम्न संवाद बॉक्स में पेश करेगा जहां आपके निरंतर स्वतंत्र चर (आयु वजन और हार्ट्रेट) पहले से ही वार्लिस्ट में दर्ज किए गए होंगे: बॉक्स: स्टेटाकार्प एलपी से लिखित अनुमति के साथ प्रकाशित Variablendash क्षेत्र के ndashType में चयनित फैक्टर वैरिएबल छोड़ें अगला, ndashAdd कारक variablendash क्षेत्र में, विशिष्टता में चयनित छोड़ें: बॉक्स। अब, ड्रॉप-डाउन बटन का उपयोग करके वैरिएबल बॉक्स में लिंग चुनें, और फिर बेस बॉक्स में डिफ़ॉल्ट चुनें। अंत में, बटन पर क्लिक करें आपको निम्न संवाद बॉक्स के साथ प्रस्तुत किया जाएगा जहां स्पष्ट स्वतंत्र चर, i. gender। इस Varlist में दर्ज किया गया है: बॉक्स: StataCorp LP से लिखित अनुमति के साथ प्रकाशित बटन को क्लिक करे। आपको रिगरेट में लौटा दिया जाएगा - रैखिक प्रतिगमन संवाद बॉक्स, लेकिन स्पष्ट स्वतंत्र चर, i. gender के साथ। अब स्वतंत्र चर में प्रवेश किया: बॉक्स, जैसा कि नीचे दिखाया गया है: StataCorp LP से लिखित अनुमति के साथ प्रकाशित बटन को क्लिक करे। इससे आउटपुट उत्पन्न होगा एकाधिक रिग्रेसन विश्लेषण स्टेटस के स्टेटा आउटपुट की व्याख्या और रिपोर्टिंग से ऊपर किए गए चयनों के आधार पर कई प्रतिगमन विश्लेषण के लिए आउटपुट का एक टुकड़ा उत्पन्न होगा, यह मानते हुए कि कई प्रतिगमन के लिए आवश्यक आठ मान्यताओं को पूरा किया गया है। निर्धारित करना कितना अच्छा है कि मॉडल आर 2 फिट बैठता है और समायोजित आर 2 का उपयोग यह निर्धारित करने के लिए किया जा सकता है कि एक प्रतिगमन मॉडल आंकड़ों में कितना अच्छा है: आर-स्क्वेर्ड पंक्ति आर 2 मान (जिसे निर्धारण के गुणांक भी कहा जाता है) का प्रतिनिधित्व करता है, जो अनुपात है आश्रित चर में भिन्नता का जो कि स्वतंत्र चर से समझाया जा सकता है (तकनीकी रूप से, यह औसत मॉडल के ऊपर और उसके बाद के अपगमन मॉडल के कारण भिन्नता का अनुपात है)। आप 0.577 के हमारे मूल्य से देख सकते हैं कि हमारे स्वतंत्र चर हमारे निर्भर चर, वीओ 2 मैक्स की परिवर्तनशीलता की 57.7 बताते हैं। हालांकि, आपको अपने डेटा की सटीकता से रिपोर्ट करने के लिए एडज आर-स्क्वेर्ड (अनु। आर 2) की व्याख्या करने में सक्षम होना चाहिए। सांख्यिकीय महत्व एफ-आरटीओ परीक्षण करता है कि क्या कुल प्रतिगमन मॉडल डेटा के लिए एक अच्छा फिट है या नहीं। आउटपुट से पता चलता है कि स्वतंत्र चर सांख्यिकीय आधार पर निर्भर चर, एफ (4, 9 5) 32.3 9, पीटीटी .0005 (यानी प्रतिगमन मॉडल डेटा का एक अच्छा फिट है) का अनुमान लगाता है। अनुमानित मॉडल गुणांक उम्र से अधिकतम VO 2 अधिकतम अनुमान लगाने के लिए समीकरण का सामान्य रूप। वजन। दिल की धड़कन और लिंग: भविष्यवाणी VO 2 अधिकतम 87.83 ndash (0.165 x आयु) ndash (0.385 x वजन) ndash (0.118 x हार्ट्रेट) (13.208 x लिंग) यह कोफे से प्राप्त किया गया है। स्तंभ, जैसा कि नीचे दिखाया गया है: अनिर्धारित गुणांक इंगित करते हैं कि स्वतंत्र चर के साथ निर्भर चर कितना भिन्न होता है, जब सभी अन्य स्वतंत्र चर निरंतर बनाए जाते हैं इस उदाहरण में उम्र के प्रभाव पर विचार करें निर्बाध गुणांक, बी 1 उम्र के लिए -0.165 (कोफ स्तंभ की पहली पंक्ति देखें) के बराबर है। इसका मतलब यह है कि उम्र में प्रत्येक 1 वर्ष की वृद्धि के लिए, वीओ 2 की अधिकतम 0.165 मिलीग्राम में कमी आई है। स्वतंत्र चर का सांख्यिक महत्व आप प्रत्येक स्वतंत्र चर के सांख्यिकीय महत्व के लिए परीक्षण कर सकते हैं। यह परीक्षण करता है कि क्या अप्रमाणित (या मानकीकृत) गुणांक जनसंख्या में 0 (शून्य) के बराबर हैं यदि पीटीटी .05, तो आप यह निष्कर्ष निकाल सकते हैं कि गुणांक 0 (शून्य) से सांख्यिकीय रूप से काफी अलग हैं। टी-गुण और संबंधित पी-वेल्यू क्रमशः टी और पीजीटीटी स्तंभों में स्थित हैं, जैसा कि नीचे हाइलाइट किया गया है: आप पीजीटीटी स्तंभ से देख सकते हैं कि सभी स्वतंत्र चर गुणांक 0 (शून्य) से सांख्यिकीय रूप से काफी अलग हैं। हालांकि अवरोधन, बी 0 सांख्यिकीय महत्व के लिए परीक्षण किया गया है, यह शायद ही कभी एक महत्वपूर्ण या दिलचस्प खोज है कई प्रतिगमन विश्लेषण के उत्पादन की रिपोर्टिंग आप निम्नानुसार परिणाम लिख सकते हैं: लिंग, आयु, वजन और हृदय गति से वीओ 2 अधिकतम अनुमान लगाने के लिए एक बहु प्रतिगमन चलाया गया था। इन चर को सांख्यिकीय रूप से महत्वपूर्ण बताया गया है VO 2 max, F (4, 95) 32.3 9, पीटीटी .0005, आर 2 .577 सभी चार वैरिएबल सांख्यिकीय रूप से महत्वपूर्ण तौर पर भविष्यवाणी, पीटीटी .05 के लिए जोड़े गए हैं। तर्क विश्लेषण 13 अनुमान के मानक त्रुटि को जानने के लिए, हम सभी स्क्वायर अवशिष्ट शर्तों का योग लेते हैं और (एन -2) द्वारा विभाजित करते हैं, और फिर स्क्वायर लेते हैं परिणाम की जड़ इस मामले में, स्क्वायर अवशिष्टों का योग 0.090.160.642.250.04 3.18 है। पांच टिप्पणियों के साथ, n - 2 3, और देखें (3.183) 12 1.03 मानक त्रुटि की गणना अपेक्षाकृत नमूना के लिए मानक विचलन के समान है (n - 2 को n - 1 के बजाय प्रयोग किया जाता है)। यह एक प्रतिगमन मॉडल की अनुमानित गुणवत्ता का कुछ संकेत देता है, कम संख्याओं के संकेत के साथ यह दर्शाता है कि अधिक सटीक भविष्यवाणियां संभव हैं। हालांकि, मानक-त्रुटि उपाय यह नहीं दर्शाता कि किस प्रकार स्वतंत्र परिवर्तनीय निर्भर मॉडल में भिन्नता बताता है। निर्धारण के गुणांक मानक त्रुटि की तरह, यह आंकड़ा एक संकेत देता है कि रैखिक-प्रतिगमन मॉडल निर्भर चर के मूल्यों के अनुमानक के रूप में कार्य करता है। यह निर्भर चर में कुल भिन्नता के अंश को मापने के द्वारा काम करता है जिसे स्वतंत्र चर में भिन्नता से समझाया जा सकता है। इस संदर्भ में, कुल भिन्नता दो भिन्न पदार्थों से बनी हुई है: कुल भिन्नता में अंतर को समझाया गया अस्पष्टीकृत भिन्नता कुल भिन्नता कुल भिन्नता निर्धारण के गुणांक। या कुल भिन्नता के प्रतिशत के रूप में भिन्नता की व्याख्या की, इन दो पदों में से पहला है इसे कभी-कभी 1 के रूप में व्यक्त किया जाता है - (अस्पष्टीकृत विविधता कुल भिन्नता)। एक स्वतंत्र चर के साथ एक साधारण रैखिक प्रतिगमन के लिए, निर्धारण के गुणांक की गणना करने के लिए सरल तरीका निर्भर और स्वतंत्र चर के बीच के संबंध गुणांक को जोड़ता है। चूंकि सहसंबंध गुणांक आर द्वारा दिया जाता है, इसलिए दृढ़ संकल्प के गुणांक को आर 2 या आर-स्क्वेयर के रूप में जाना जाता है। उदाहरण के लिए, यदि सहसंबंध गुणांक 0.76 है, तो आर-स्क्वेर्ड (0.76) 2 0.578 है। आर-स्क्वेयर शब्दों को आमतौर पर प्रतिशत के रूप में व्यक्त किया जाता है, इस प्रकार 0.578 में 57.8 होगा। इस संख्या की गणना करने का एक दूसरा तरीका निर्भर चर वाई में कुल भिन्नता को खोजने के लिए होगा जो नमूना मतलब से चुकता विचलन का योग है। अगला, पिछले अनुभाग में उल्लिखित प्रक्रिया के बाद अनुमान के मानक त्रुटि की गणना करें। इसके बाद निर्धारण के गुणांक की गणना की जाती है (Y में कुल भिन्नता - Y में अव्यक्त भिन्नता) वाई में कुल भिन्नता। यह दूसरी विधि एकाधिक रिग्रेसन के लिए आवश्यक है, जहां एक से अधिक स्वतंत्र चर है, लेकिन हमारे संदर्भ के लिए हमें प्रदान किया जाएगा एक आर-वर्ग की गणना करने के लिए r (सहसंबंध गुणांक) आर 2 हमें बताता है कि निर्भर चर में बदलाव Y जो 57.8 के स्वतंत्र वेरिएबल एक्स। आर 2 में परिवर्तनों से समझाया गया है, हमें बताता है कि एक्स के वाई में होने वाले परिवर्तनों में से 57.8 का यह भी मतलब है कि 1 - 57.8 या 42.2 वाई में परिवर्तन एक्स द्वारा अस्पष्ट हैं और अन्य कारकों का नतीजा है तो आर-स्क्वेर्ड जितना अधिक होगा, रैखिक-प्रतिगमन मॉडल की भविष्यवाणिक प्रकृति को बेहतर होगा। प्रतिगमन गुणांक या तो प्रतिगमन गुणांक (अवरोधन, या ढलान बी) के लिए, एक आत्मविश्वास अंतराल निम्न जानकारी से निर्धारित किया जा सकता है: 13 नमूना से एक अनुमानित पैरामीटर मान 13 अनुमान के मानक त्रुटि (एसईई) 13 टी- वितरण 13 स्वतंत्रता के डिग्री (जो नमूना का आकार है - 2) 13 ढलान गुणांक के लिए, विश्वास अंतराल के लिए सूत्र बीटीसी एसईई द्वारा दिया गया है, जहां टीसी हमारे चुने हुए महत्वपूर्ण स्तर पर महत्वपूर्ण टी मूल्य है। उदाहरण के लिए, म्यूचुअल फंड रिटर्न के साथ एक रेखीय प्रतिगमन को आश्रित चर और स्वतंत्र चर के रूप में SampP 500 इंडेक्स के रूप में लेना। त्रैमासिक रिटर्न के पांच साल के लिए, ढलान गुणांक की संख्या 1.18 है, जो 0.147 के अनुमान के एक मानक त्रुटि के साथ है। छात्रों को 18 डिग्री स्वतंत्रता (20 क्वार्टर - 2) के लिए टी-वितरण 0.05 महत्व स्तर 2.101 है। यह डेटा हमें 1.18 (0.147) (2.101), या 0.87 से 1.4 9 की सीमा का एक आत्मविश्वास अंतराल देता है। हमारी व्याख्या यह है कि आबादी का ढलान 0.87 से कम या 1.4 9 से अधिक है, हमें केवल 5 मौके ही मिलेंगी- हमें विश्वास है कि यह फंड SampP 500 के रूप में कम से कम 87 के रूप में अस्थिर है, लेकिन 14 9 से अधिक नहीं हमारे पांच साल के नमूने पर आधारित, अस्थिर। हाइपोथीसिस परीक्षण और प्रतिगमन गुणांक प्रतिगमन गुणांक अक्सर अवधारणा परीक्षण प्रक्रिया का उपयोग कर परीक्षण किया जाता है। विश्लेषक क्या साबित करने का इरादा रखता है, इसके आधार पर हम यह तय करने के लिए ढलान के गुणांक का परीक्षण कर सकते हैं कि वह निर्भर चर में संभावना बताता है, और उस सीमा को बताता है कि किस प्रकार परिवर्तन होते हैं बीटास (ढलान गुणांक) 1 या तो ऊपर या नीचे (बाजार से अधिक वाष्पशील या कम अस्थिर) होने का निर्धारण किया जा सकता है। अल्फा (इंटरसेप्ट गुणांक) को म्यूचुअल फंड और प्रासंगिक बाजार सूचकांक के बीच एक प्रतिगमन पर परीक्षण किया जा सकता है, यह निर्धारित करने के लिए कि क्या पर्याप्त रूप से सकारात्मक अल्फा (फंड मैनेजर द्वारा सुझाए गए मूल्य का सुझाव) का प्रमाण है। परिकल्पना परीक्षण के यांत्रिकी उन उदाहरणों के समान हैं जिन्हें हमने पहले इस्तेमाल किया है एक नल परिकल्पना को नल के मामले में शामिल नहीं किए गए सभी मूल्यों को संतोषजनक विकल्प के साथ, न-बराबर, अधिक से अधिक या कम-से-मामले के आधार पर चुना जाता है। मान लीजिए कि हमारे पिछले उदाहरण में जहां हमने 20 क्वार्टर के लिए SampP 500 पर एक म्यूचुअल फंड रिटर्न वापस किया, हमारा अनुमान है कि यह म्यूचुअल फंड बाजार से अधिक अस्थिर है। बाजार में उतार-चढ़ाव के बराबर एक निधि में ढलान 1.0 होगा, इस परिकल्पना के लिए, हम अशक्त परिकल्पना (एच 0) को उस स्थिति के रूप में कहते हैं, जहां ढलान 1.0 या उससे अधिक (यानी एच 0: बी एलटी 1.0 )। वैकल्पिक परिकल्पना एच ए है बी 1 जी 1.0। हम जानते हैं कि यह एक बड़ा-से अधिक मामला है (यानी एक-पूंछ) - अगर हम 0.05 महत्व का स्तर ग्रहण करते हैं, तो टी 1.734 के बराबर आजादी के स्तर पर है- 2 18. उदाहरण: हमारे नमूने से एक हाइपोथीसिस टेस्ट की व्याख्या करना, हम 1.18 का अनुमानित ख और 0.147 की मानक त्रुटि थी। हमारे परीक्षण आंकड़ों को इस सूत्र के साथ गिना जाता है: अनुमानित गुणांक - अनुमानित गुणांक मानक त्रुटि (1.18 - 1.0) 0.147 0.180.147, या टी 1.224 इस उदाहरण के लिए, हमारी गणना परीक्षण आंकड़े 1.734 के अस्वीकृति के स्तर के नीचे हैं, इसलिए हम नल परिकल्पना को अस्वीकार नहीं कर सकते हैं कि फंड बाजार से अधिक अस्थिर है। व्याख्या: इस फंड के लिए बी 1 1 परिकल्पना में संभवतः सांख्यिकीय महत्व के साथ साबित होने के लिए अधिक टिप्पणियों (स्वतंत्रता की डिग्री) की आवश्यकता होती है। साथ ही, 1.0 से थोड़ा ऊपर 1.18 के साथ, यह काफी संभव है कि यह फंड वास्तव में बाजार के रूप में अस्थिर नहीं है, और हम अयोग्य परिकल्पना को अस्वीकार नहीं करने के लिए सही थे। उदाहरण: प्रतिगमन गुणांक व्याख्या करना सीएफए परीक्षा एक रेखीय प्रतिगमन के सारांश के आंकड़े देने और व्याख्या के लिए पूछने की संभावना है। उदाहरण के लिए, एक छोटे-कैप विकास फंड और रसेल 2000 सूचकांक के बीच प्रतिगमन के लिए निम्नलिखित आंकड़े मान लें: 13 सहसंबंध गुणांक 13 दोनों संक्षिप्ताक्षर आरएसएस और एसएसई: 13 आरएसएस को समझने के लिए हैं। या वर्गों का प्रतिगमन राशि, निर्भर चर वाई में कुल भिन्नता की मात्रा है जो प्रतिगमन समीकरण में समझाया गया है। आरएसएस की गणना भविष्यवाणी वाई वैल्यू और मतलब वाई वैल्यू के बीच प्रत्येक विचलन की गणना द्वारा की जाती है, विचलन को समझाते हुए और सभी शर्तों को जोड़ना यदि कोई स्वतंत्र परिवर्तनीय किसी आश्रित चर में भिन्नता में से कोई भी बताता है, तो Y का अनुमानित मान औसत मान के बराबर है, और आरएसएस 0. 13 एसएसई। या अवशिष्टों की चुकता त्रुटि का योग, अनुमानित वाई और एक वास्तविक वाई के बीच के विचलन को देखते हुए, परिणाम को चुकाना और सभी पदों को जोड़ने से गणना की जाती है 13 टीएसएस, या कुल भिन्नता, आरएसएस और एसएसई का योग है। दूसरे शब्दों में, यह एनोवा प्रक्रिया दो हिस्सों में भिन्नता को तोड़ती है: जो कि मॉडल द्वारा समझाया गया है और जो कि नहीं है। अनिवार्य रूप से, प्रतिगमन समीकरण को उच्च भविष्य कहने वाली गुणवत्ता के लिए, हमें एक उच्च आरएसएस और कम एसएसई देखने की जरूरत है, जो अनुपात (आरएसएस 1) एसएसई (एन -2) उच्च और (एक महत्वपूर्ण एफ - मूल्य) सांख्यिकीय अर्थपूर्ण महत्वपूर्ण मूल्य एफ वितरण से लिया जाता है और स्वतंत्रता की डिग्री पर आधारित है। उदाहरण के लिए, 20 टिप्पणियों के साथ, आजादी की डिग्री n - 2 या 18 होगी, जिसके परिणामस्वरूप 2.1 9 के महत्वपूर्ण मूल्य (तालिका से) हो सकता है। यदि आरएसएस 2.5 थे और एसएसई 1.8 थे, तो गणना की गई परीक्षण आंकड़े एफ (2.5 (1.818) 25 होंगे, जो कि महत्वपूर्ण मूल्य से ऊपर है, जो दर्शाता है कि प्रतिगमन समीकरण की अनुमानित गुणवत्ता है (बी 0 से अलग है) अनुमानित आर्थिक सांख्यिकी प्रतिगमन मॉडल के साथ प्रतिगमन मॉडल अक्सर मुद्रास्फीति और जीडीपी वृद्धि जैसे आर्थिक आंकड़ों का अनुमान लगाने के लिए उपयोग किए जाते हैं। अनुमान लगाते हैं कि निम्न प्रतिगमन अनुमानित वार्षिक मुद्रास्फीति (एक्स या स्वतंत्र चर) और वास्तविक संख्या (वाई, या निर्भर चर) के बीच की गई है: इसका उपयोग करना मॉडल, पूर्वानुमानित मुद्रास्फीति की गणना निम्न मुद्रास्फीति की परिस्थितियों के लिए मॉडल के आधार पर की जाएगी: 13 मुद्रास्फीति का अनुमान 13 मॉडल पर आधारित मुद्रास्फीति 13 इस मॉडल पर आधारित भविष्यवाणियों को सामान्य मुद्रास्फीति अनुमानों के लिए सबसे अच्छा काम करना पड़ता है, और सुझाव देते हैं कि चरम अनुमान ओवरस्टेट मुद्रास्फ़ीति - उदाहरण के मुताबिक वास्तविक मुद्रास्फीति सिर्फ 4.46 था जब अनुमान 4.7 था। मॉडल का सुझाव है कि अनुमान अनुमानित रूप से अत्यधिक अनुमानित हैं। हालांकि इस मॉडल का बेहतर मूल्यांकन करने के लिए, हमें मानक त्रुटि और उन टिप्पणियों की संख्या देखने की आवश्यकता होगी जिन पर यह आधारित है। यदि हम प्रतिगमन मापदंडों (ढलान और अवरोधन) का सही मान जानते हैं, तो किसी भी अनुमानित Y मान का अंतर मानक त्रुटि के वर्ग के बराबर होगा। व्यवहार में, हमें प्रतिगमन मापदंडों का अनुमान लगाया जाना चाहिए, इसलिए हमारे अनुमानित मूल्य का अनुमान अनुमानित मॉडल के आधार पर अनुमान है। हम इस तरह की प्रक्रिया में कैसे आश्वस्त हो सकते हैं भविष्यवाणी के अंतराल को निर्धारित करने के लिए, निम्नलिखित चरणों को नियोजित करें: 1. स्वतंत्र अवलोकन के आधार पर निर्भर चर वाई के मूल्य की भविष्यवाणी करें। 2. भविष्यवाणी त्रुटि के विचरण का उपयोग करके, निम्नलिखित समीकरण: 13 जहां: 2 एस अनुमानित की चुकता मानक त्रुटि है, एन टिप्पणियों की संख्या है, एक्स, भविष्यवाणी करने के लिए इस्तेमाल किया स्वतंत्र चर का मूल्य है, एक्स स्वतंत्र चर का अनुमानित मूल्य है, और एसएक्स 2 एक्स का विचरण है। 3. विश्वास अंतराल के लिए एक महत्वपूर्ण स्तर चुनें। 4. संरचना का उपयोग करते हुए एक अंतराल (1 -) प्रतिशत आत्मविश्वास का निर्माण करते हैं। यह एक और मामला है जहां सामग्री आवश्यक से अधिक तकनीकी हो जाती है और एक को तैयार करने में फंस जाता है, जब वास्तविकता में भविष्यवाणी त्रुटि के भिन्नता के लिए फार्मूला कवर होने की संभावना नहीं है। प्राथमिकता - उसे याद रखना अनमोल अध्ययन घंटे न दें। यदि अवधारणा को बिल्कुल भी परीक्षण किया गया है, तो आपको संभावना 2 भाग का जवाब दिया जाएगा। बस एक प्रश्न का उत्तर देने के लिए भाग 4 में संरचना का उपयोग कैसे करें। उदाहरण के लिए, यदि अनुमानित एक्स एक्सपोजेशन दो प्रतिगमन वाई 1.5 2.5 एक्स के लिए है, तो हमारे पास 1.5 2.5 (2) या 6.5 की अनुमानित Y होनी चाहिए। हमारा विश्वास अंतराल 6.5 टीसीएस एफ है टी-स्टेट एक चयनित विश्वास अंतराल और स्वतंत्रता की डिग्री पर आधारित है, जबकि एस एफ ऊपर समीकरण का वर्गमूल है (भविष्यवाणी की त्रुटि के भिन्नता के लिए) यदि ये संख्याएं हैं तो टीसी 2.10 9 95 आत्मविश्वास के लिए, और एसएफ 0.443, अंतराल 6.5 (2.1) (0.443), या 5.57 से 7.43। प्रतिगमन विश्लेषण की सीमाएं तीन मुख्य सीमाओं पर ध्यान दें: 1. पैरामीटर अस्थिरता - यह अर्थव्यवस्थाओं या बाजारों में हुए बदलावों के कारण समय के साथ-साथ बदलावों के बीच संबंधों की प्रवृत्ति है , अन्य अनिश्चितताओं के बीच में। यदि एक म्यूचुअल फंड ने बाजार में वापसी इतिहास का निर्माण किया जहां प्रौद्योगिकी एक नेतृत्व क्षेत्र था, तो मॉडल तब काम नहीं कर सकता जब विदेशी और छोटे-से-कैप के बाजार में नेता होते हैं .. 2. रिश्ते का सार्वजनिक प्रसार - एक कुशल बाजार में , यह भविष्य की अवधि में उस रिश्ते की प्रभावशीलता को सीमित कर सकता है.उदाहरण के लिए, कम मूल्य-टू-बुक मूल्य शेयर उच्च मूल्य-से-बुक मूल्य को मात देते हैं, इसका मतलब है कि इन शेयरों को उच्च बोली लगा सकते हैं, और मूल्य-आधारित वेशभूषण दृष्टिकोण पिछले संबंधों के समान ही नहीं बनाएंगे। 3. रिग्रेशन रिलेशनशिप का उल्लंघन - इससे पहले हमने रैखिक प्रतिगमन के छह क्लासिक मान्यताओं को संक्षेप में प्रस्तुत किया। वास्तविक दुनिया में ये मान्यताओं अक्सर अवास्तविक हैं - उदा। स्वतंत्र चर एक्स मानते हुए यादृच्छिक नहीं है।

Comments