3. विधि का उपयोग करके फ़ंक्शन सन्निकटन

कम से कम वर्गों

के लिए प्रयोगात्मक परिणामों को संसाधित करते समय कम से कम वर्ग विधि का उपयोग किया जाता है अनुमान (सन्निकटन) प्रयोगात्मक डेटा विश्लेषणात्मक सूत्र। सूत्र का विशिष्ट रूप, एक नियम के रूप में, भौतिक विचारों से चुना जाता है। ऐसे सूत्र हो सकते हैं:

अन्य।

न्यूनतम वर्ग विधि का सार इस प्रकार है। माप परिणामों को तालिका में प्रस्तुत करने दें:

टेबल 4
				एक्स एन
				Y n

(3.1)

जहां च - ज्ञात समारोह,ए 0, ए 1, ..., ए एम - अज्ञात स्थिर पैरामीटर, जिनमें से मान मिलना चाहिए। न्यूनतम वर्ग विधि में, प्रायोगिक निर्भरता के लिए फलन (3.1) का सन्निकटन सबसे अच्छा माना जाता है यदि स्थिति

(3.2)

अर्थात् रकम ए प्रयोगात्मक निर्भरता से आवश्यक विश्लेषणात्मक कार्य के विचलन के वर्ग न्यूनतम होना चाहिए .

ध्यान दें कि फ़ंक्शनक्यू बुलाया विसंगति।

शेष के बाद से

तो उसके पास न्यूनतम है। कई चरों के न्यूनतम फ़ंक्शन के लिए एक आवश्यक शर्त पैरामीटर के संबंध में इस फ़ंक्शन के सभी आंशिक डेरिवेटिव के शून्य की समानता है। इस प्रकार, सन्निकटन फ़ंक्शन (3.1) के मापदंडों के सर्वोत्तम मूल्यों की खोज करना, अर्थात्, ऐसे मान जिनके लिएक्यू = क्यू (ए 0, ए 1, ..., ए एम ) न्यूनतम है, समीकरणों की प्रणाली को हल करने के लिए कम किया गया है:

(3.3)

कम से कम वर्गों की विधि को निम्नलिखित ज्यामितीय व्याख्या दी जा सकती है: किसी दिए गए प्रकार की रेखाओं के अनंत परिवार के बीच, एक रेखा पाई जाती है जिसके लिए प्रयोगात्मक बिंदुओं के निर्देशांक और संबंधित निर्देशांक के बीच अंतर के वर्गों का योग होता है इस रेखा के समीकरण से ज्ञात बिंदु सबसे छोटे होंगे।

एक रैखिक फ़ंक्शन के पैरामीटर ढूँढना

प्रयोगात्मक डेटा को एक रेखीय फलन द्वारा निरूपित करने दें:

ऐसे मूल्यों का चयन करना आवश्यक हैए और बी जिसके लिए समारोह

(3.4)

न्यूनतम होगा। न्यूनतम फ़ंक्शन (3.4) के लिए आवश्यक शर्तें समीकरणों की प्रणाली में कम हो जाती हैं:

परिवर्तनों के बाद, हम दो अज्ञात के साथ दो रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:

(3.5)

जिसे हल करते हुए, हम मापदंडों के आवश्यक मान पाते हैंए और बी

द्विघात फलन के पैरामीटर ढूँढना

यदि सन्निकटन फलन द्विघात निर्भरता है

तो इसके पैरामीटर ए, बी, सी न्यूनतम समारोह के लिए शर्त से पाए जाते हैं:

(3.6)

न्यूनतम फ़ंक्शन (3.6) के लिए शर्तें समीकरणों की प्रणाली में कम हो जाती हैं:

परिवर्तनों के बाद, हम तीन अज्ञात के साथ तीन रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:

(3.7)

पर जिसका समाधान हम मापदंडों के आवश्यक मान पाते हैंए, बी और सी।

उदाहरण ... मान लें कि प्रयोग का परिणाम निम्न तालिका में हैएक्स और वाई:

टेबल 5

यी	0,705	0,495	0,426	0,357	0,368	0,406	0,549	0,768

प्रयोगात्मक डेटा को रैखिक और द्विघात कार्यों के साथ अनुमानित करना आवश्यक है।

समाधान। सन्निकटन फलनों के प्राचलों का पता लगाना रैखिक समीकरणों (3.5) और (3.7) की प्रणालियों को हल करने तक सीमित है। समस्या को हल करने के लिए, हम एक स्प्रेडशीट प्रोसेसर का उपयोग करेंगेएक्सेल।

1. सबसे पहले, आइए शीट 1 और 2 को लिंक करें। आइए प्रयोगात्मक मान दर्ज करेंएक्स मैं और यीकॉलम में ए और बी, दूसरी पंक्ति से शुरू (पहली पंक्ति में हम कॉलम हेडिंग रखेंगे)। फिर हम इन स्तंभों के योगों की गणना करते हैं और उन्हें दसवीं पंक्ति में रखते हैं।

कॉलम सी - जी गणना और योग क्रमशः रखें

2. चलो शीट को अलग करते हैं। शीट 1 पर रैखिक निर्भरता के लिए और शीट 2 पर द्विघात निर्भरता के लिए आगे की गणना उसी तरह की जाएगी।

3. परिणामी तालिका के तहत, गुणांक का एक मैट्रिक्स और मुक्त सदस्यों का एक कॉलम वेक्टर बनाएं। आइए निम्नलिखित एल्गोरिथम के अनुसार रैखिक समीकरणों की प्रणाली को हल करें:

व्युत्क्रम मैट्रिक्स और मैट्रिक्स गुणन की गणना करने के लिए, हम उपयोग करते हैं गुरु द्वारा कार्योंऔर कार्य भीड़तथा मोमनोझी.

4. कोशिकाओं के एक ब्लॉक में H2:एच 9 प्राप्त गुणांक के आधार पर, हम गणना करते हैं सन्निकटन का मूल्यबहुपदयी कटौती।, ब्लॉक I 2: I 9 में - विचलन डी वाई आई = यी ऍक्स्प. - यी कटौती।, कॉलम जे - अवशिष्ट:

परिणामी टेबल और इसके साथ बनाया गया चार्ट विजार्ड्सचित्र 6, 7, 8 में रेखांकन दिखाए गए हैं।

चावल। 6. एक रैखिक फलन के गुणांकों की गणना के लिए तालिका,

अनुमान करने वालेप्रयोगात्मक डेटा।

चावल। 7. द्विघात फलन के गुणांकों की गणना के लिए तालिका,

अनुमान करने वालेप्रयोगात्मक डेटा।

चावल। 8. सन्निकटन परिणामों की चित्रमय प्रस्तुति

रैखिक और द्विघात कार्यों द्वारा प्रयोगात्मक डेटा।

उत्तर। प्रायोगिक डेटा को रैखिक निर्भरता द्वारा अनुमानित किया गया था आप = 0,07881 एक्स + 0,442262 अवशिष्ट के साथ क्यू = 0,165167 और द्विघात निर्भरता आप = 3,115476 एक्स 2 – 5,2175 एक्स + 2,529631 अवशिष्ट के साथ क्यू = 0,002103 .

कार्य। एक सारणीबद्ध, रैखिक और द्विघात फलन द्वारा दिए गए फलन का अनुमान लगाइए।

तालिका 6

№0

एक्स

0,1

0,2

0,3

0,4

0,5

0,6

0,7

0,8

आप

3,030

3,142

3,358

3,463

3,772

3,251

3,170

3,665

№ 1

3,314

3,278

3,262

3,292

3,332

3,397

3,487

3,563

№ 2

1,045

1,162

1,264

1,172

1,070

0,898

0,656

0,344

№ 3

6,715

6,735

6,750

6,741

6,645

6,639

6,647

6,612

№ 4

2,325

2,515

2,638

2,700

2,696

2,626

2,491

2,291

№ 5

1.752

1,762

1,777

1,797

1,821

1,850

1,884

1,944

№ 6

1,924

1,710

1,525

1,370

1,264

1,190

1,148

1,127

№ 7

1,025

1,144

1,336

1,419

1,479

1,530

1,568

1,248

№ 8

5,785

5,685

5,605

5,545

5,505

5,480

5,495

5,510

№ 9

4,052

4,092

4,152

4,234

4,338

4,468

4,599

पाठ्यक्रम कार्य

अनुशासन द्वारा: सूचना विज्ञान

विषय: कम से कम वर्ग समारोह सन्निकटन

परिचय

1. समस्या का विवरण

2. गणना सूत्र

Microsoft Excel का उपयोग करके बनाई गई तालिकाओं का उपयोग करके गणना

एल्गोरिथम आरेख

MathCad कार्यक्रम में गणना

रैखिक फ़ंक्शन का उपयोग करके प्राप्त परिणाम

रेखांकन के रूप में परिणामों की प्रस्तुति

परिचय

कोर्स वर्क का उद्देश्य कंप्यूटर विज्ञान के ज्ञान को गहरा करना, माइक्रोसॉफ्ट एक्सेल स्प्रेडशीट प्रोसेसर और मैथकैड सॉफ्टवेयर उत्पाद के साथ काम करने के कौशल को विकसित और समेकित करना और अनुसंधान से संबंधित विषय क्षेत्र से कंप्यूटर का उपयोग करके समस्याओं को हल करने के लिए उनका उपयोग करना है।

सन्निकटन (लैटिन "अनुमानित" - "दृष्टिकोण" से) - किसी भी गणितीय वस्तुओं की अनुमानित अभिव्यक्ति (उदाहरण के लिए, संख्याएं या कार्य) अन्य सरल, उपयोग करने के लिए अधिक सुविधाजनक, या बस बेहतर ज्ञात के माध्यम से। वैज्ञानिक अनुसंधान में, सन्निकटन का उपयोग अनुभवजन्य परिणामों का वर्णन, विश्लेषण, सामान्यीकरण और आगे उपयोग करने के लिए किया जाता है।

जैसा कि आप जानते हैं, मात्राओं के बीच एक सटीक (कार्यात्मक) संबंध हो सकता है, जब तर्क का एक मान एक विशिष्ट मान से मेल खाता है, और एक कम सटीक (सहसंबंध) संबंध, जब तर्क का एक विशिष्ट मान अनुमानित मूल्य से मेल खाता है या किसी फ़ंक्शन के मानों का एक सेट जो कमोबेश एक-दूसरे के करीब होता है। वैज्ञानिक अनुसंधान करते समय, अवलोकन या प्रयोग के परिणामों को संसाधित करते समय, आमतौर पर दूसरे विकल्प से निपटना पड़ता है।

विभिन्न संकेतकों की मात्रात्मक निर्भरता का अध्ययन करते समय, जिनमें से मूल्यों को अनुभवजन्य रूप से निर्धारित किया जाता है, एक नियम के रूप में, कुछ परिवर्तनशीलता होती है। आंशिक रूप से यह निर्जीव और विशेष रूप से, जीवित प्रकृति की अध्ययन की गई वस्तुओं की विविधता से निर्धारित होता है, आंशिक रूप से - यह अवलोकन त्रुटि और सामग्री की मात्रात्मक प्रसंस्करण के कारण होता है। अंतिम घटक को पूरी तरह से बाहर करना हमेशा संभव नहीं होता है, इसे केवल पर्याप्त शोध पद्धति और कार्य की सटीकता के सावधानीपूर्वक चयन से ही कम किया जा सकता है। इसलिए, किसी भी शोध कार्य को करते समय, अध्ययन किए गए संकेतकों की निर्भरता की वास्तविक प्रकृति की पहचान करने में समस्या उत्पन्न होती है, इस या उस डिग्री को परिवर्तनशीलता के लिए बेहिसाब द्वारा मुखौटा किया जाता है: मान। इसके लिए, एक सन्निकटन का उपयोग किया जाता है - कार्यात्मक निर्भरता के एक उपयुक्त समीकरण द्वारा चर के सहसंबंध निर्भरता का एक अनुमानित विवरण, जो निर्भरता (या इसकी "प्रवृत्ति") की मुख्य प्रवृत्ति को बताता है।

सन्निकटन चुनते समय, किसी को एक विशिष्ट शोध समस्या से आगे बढ़ना चाहिए। आमतौर पर, सन्निकटन के लिए समीकरण का उपयोग जितना सरल होता है, निर्भरता का विवरण उतना ही अधिक अनुमानित होगा। इसलिए, यह पढ़ना महत्वपूर्ण है कि परिणामी प्रवृत्ति से विशिष्ट मूल्यों के विचलन कितने महत्वपूर्ण और क्या कारण हैं। अनुभवजन्य रूप से निर्धारित मूल्यों की निर्भरता का वर्णन करते समय, कुछ अधिक जटिल, बहु-पैरामीट्रिक समीकरण का उपयोग करके बहुत अधिक सटीकता प्राप्त करना संभव है। हालांकि, अनुभवजन्य डेटा की विशिष्ट श्रृंखला में मूल्यों के यादृच्छिक विचलन को व्यक्त करने के लिए अधिकतम सटीकता के साथ प्रयास करने का कोई मतलब नहीं है। सामान्य पैटर्न को समझना बहुत अधिक महत्वपूर्ण है, जो इस मामले में सबसे तार्किक और स्वीकार्य सटीकता के साथ शक्ति फ़ंक्शन के दो-पैरामीटर समीकरण द्वारा सटीक रूप से व्यक्त किया गया है। इस प्रकार, एक सन्निकटन विधि का चयन करते हुए, शोधकर्ता हमेशा एक समझौता करता है: यह तय करता है कि इस मामले में यह किस हद तक "बलिदान" करने के लिए समीचीन और उपयुक्त है और तदनुसार, तुलना किए गए चर की निर्भरता को कितना सामान्य रूप से व्यक्त किया जाना चाहिए। सामान्य पैटर्न से अनुभवजन्य डेटा के यादृच्छिक विचलन द्वारा नकाबपोश पैटर्न की पहचान के साथ, सन्निकटन कई अन्य महत्वपूर्ण समस्याओं को हल करने की भी अनुमति देता है: पाया निर्भरता को औपचारिक बनाना; आश्रित चर के अज्ञात मूल्यों को प्रक्षेप द्वारा या, यदि लागू हो, एक्सट्रपलेशन द्वारा खोजें।

प्रत्येक कार्य में, समस्या की स्थिति, प्रारंभिक डेटा, परिणाम जारी करने का रूप तैयार किया जाता है, समस्या को हल करने के लिए मुख्य गणितीय निर्भरताएं इंगित की जाती हैं। समस्या को हल करने की विधि के अनुसार, एक समाधान एल्गोरिथ्म विकसित किया जाता है, जिसे चित्रमय रूप में प्रस्तुत किया जाता है।

1. समस्या का विवरण

1. कम से कम वर्ग विधि का उपयोग करते हुए, तालिका में दिया गया फलन अनुमानित है:

ए) पहली डिग्री का बहुपद ;

बी) दूसरी डिग्री का बहुपद;

ग) घातीय निर्भरता।

प्रत्येक निर्भरता के लिए नियतत्ववाद के गुणांक की गणना करें।

सहसंबंध गुणांक की गणना करें (केवल मामले में)।

प्रत्येक निर्भरता के लिए एक प्रवृत्ति रेखा बनाएं।

LINEST फ़ंक्शन का उपयोग करते हुए, निर्भरता की संख्यात्मक विशेषताओं की गणना करें।

LINEST का उपयोग करके प्राप्त परिणामों के साथ अपनी गणनाओं की तुलना करें।

निष्कर्ष निकालें कि प्राप्त सूत्रों में से कौन सा फ़ंक्शन फ़ंक्शन का सबसे अच्छा अनुमान लगाता है।

प्रोग्रामिंग भाषाओं में से एक में एक प्रोग्राम लिखें और ऊपर प्राप्त परिणामों के साथ गिनती के परिणामों की तुलना करें।

विकल्प 3. फ़ंक्शन तालिका में दिया गया है। एक।

तालिका नंबर एक।

2. गणना सूत्र

अक्सर, अनुभवजन्य डेटा का विश्लेषण करते समय, x और y के मूल्यों के बीच एक कार्यात्मक संबंध खोजना आवश्यक हो जाता है, जो अनुभव या माप के परिणामस्वरूप प्राप्त होता है।

Xi (स्वतंत्र मूल्य) प्रयोगकर्ता द्वारा दिया जाता है, और यी, जिसे अनुभवजन्य या प्रयोगात्मक मूल्य कहा जाता है, अनुभव के परिणामस्वरूप प्राप्त होता है।

एक्स और वाई के मूल्यों के बीच मौजूद कार्यात्मक निर्भरता का विश्लेषणात्मक रूप आमतौर पर अज्ञात है, इसलिए, एक व्यावहारिक रूप से महत्वपूर्ण कार्य उत्पन्न होता है - एक अनुभवजन्य सूत्र खोजने के लिए

, (1)

(जहां पैरामीटर हैं), जिनमें से मान, यदि संभव हो तो, प्रयोगात्मक मूल्यों से बहुत कम भिन्न होंगे।

कम से कम वर्ग विधि के अनुसार, सर्वोत्तम गुणांक वे होते हैं जिनके लिए दिए गए फ़ंक्शन के मूल्यों से पाए गए अनुभवजन्य कार्य के विचलन के वर्गों का योग न्यूनतम होता है।

कई चर के एक फ़ंक्शन के चरम के लिए आवश्यक शर्त का उपयोग करना - आंशिक डेरिवेटिव की शून्य से समानता, गुणांक का एक सेट ढूंढें जो सूत्र (2) द्वारा परिभाषित न्यूनतम फ़ंक्शन प्रदान करता है और गुणांक निर्धारित करने के लिए एक सामान्य प्रणाली प्राप्त करता है :

(3)

इस प्रकार, गुणांकों को खोजना प्रणाली (3) को हल करने के लिए कम हो गया है।

प्रणाली का प्रकार (3) इस बात पर निर्भर करता है कि हम किस वर्ग के अनुभवजन्य सूत्रों को निर्भरता (1) के लिए देख रहे हैं। एक रैखिक निर्भरता के मामले में, सिस्टम (3) रूप लेता है:

(4)

द्विघात निर्भरता के मामले में, प्रणाली (3) रूप लेती है:

(5)

कुछ मामलों में, एक अनुभवजन्य सूत्र के रूप में, एक फ़ंक्शन लिया जाता है जिसमें अपरिभाषित गुणांक अरेखीय रूप से प्रवेश करते हैं। इस मामले में, कभी-कभी समस्या को रैखिक किया जा सकता है, अर्थात। रैखिक को कम करें। इन निर्भरताओं में घातीय निर्भरता शामिल है

जहां a1 और a2 अपरिभाषित गुणांक हैं।

समानता (6) का लघुगणक लेकर रैखिककरण प्राप्त किया जाता है, जिसके बाद हम संबंध प्राप्त करते हैं

(7)

आइए हम निरूपित करें और, क्रमशः, द्वारा और, फिर निर्भरता (6) को फॉर्म में लिखा जा सकता है, जिससे ए 1 के प्रतिस्थापन के साथ सूत्र (4) को लागू करना संभव हो जाता है।

माप परिणामों (xi, yi), i = 1,2,…, n के अनुसार बहाल कार्यात्मक निर्भरता y (x) के ग्राफ को प्रतिगमन वक्र कहा जाता है। प्रयोगात्मक परिणामों के साथ निर्मित प्रतिगमन वक्र के समझौते की जांच करने के लिए, निम्नलिखित संख्यात्मक विशेषताओं को आम तौर पर पेश किया जाता है: सहसंबंध गुणांक (रैखिक निर्भरता), सहसंबंध अनुपात, और नियतत्ववाद गुणांक।

सहसंबंध गुणांक आश्रित यादृच्छिक चर के बीच रैखिक संबंध का एक उपाय है: यह दर्शाता है कि औसतन, एक चर को दूसरे के रैखिक कार्य के रूप में कितनी अच्छी तरह से दर्शाया जा सकता है।

सहसंबंध गुणांक की गणना सूत्र का उपयोग करके की जाती है:

(8)

(9)

जहाँ क्रमशः x, y का समांतर माध्य है।

निरपेक्ष मान में यादृच्छिक चर के बीच सहसंबंध गुणांक 1 से अधिक नहीं होता है। 1 के करीब, x और y के बीच रैखिक संबंध जितना करीब होगा।

एक अरेखीय सहसंबंध के मामले में, सशर्त माध्य मान वक्र रेखा के पास स्थित होते हैं। इस मामले में, सहसंबंध अनुपात का उपयोग बंधन शक्ति की विशेषता के रूप में करने की सिफारिश की जाती है, जिसकी व्याख्या अध्ययन की गई निर्भरता के प्रकार पर निर्भर नहीं करती है।

सहसंबंध अनुपात की गणना सूत्र द्वारा की जाती है:

(10)

कहाँ पे और अंश बिना शर्त औसत के आसपास सशर्त औसत के फैलाव की विशेषता है।

हमेशा से रहा है। समानता = यादृच्छिक असंबद्ध मूल्यों से मेल खाती है; = अगर और केवल अगर x और y के बीच एक सटीक कार्यात्मक संबंध है। x पर y की रैखिक निर्भरता के मामले में, सहसंबंध अनुपात सहसंबंध गुणांक के वर्ग के साथ मेल खाता है। मान का उपयोग रैखिकता से प्रतिगमन के विचलन के संकेतक के रूप में किया जाता है।

सहसंबंध अनुपात किसी भी रूप में ycx के बीच सहसंबंध का एक उपाय है, लेकिन यह एक विशेष रूप में अनुभवजन्य डेटा की निकटता की डिग्री का विचार नहीं दे सकता है। यह पता लगाने के लिए कि प्लॉट किया गया 5 वां वक्र अनुभवजन्य डेटा को कितनी सटीक रूप से दर्शाता है, एक और विशेषता पेश की जाती है - नियतत्ववाद का गुणांक।

नियतत्ववाद का गुणांक सूत्र द्वारा निर्धारित किया जाता है:

जहां Sres = वर्गों का अवशिष्ट योग है, जो सैद्धांतिक डेटा से प्रयोगात्मक डेटा के विचलन को दर्शाता है; पूर्ण वर्गों का कुल योग है, जहां औसत मान yi है।

- वर्गों का प्रतिगमन योग, जो डेटा के बिखराव की विशेषता है।

वर्गों के कुल योग की तुलना में वर्गों का अवशिष्ट योग जितना छोटा होगा, नियतत्ववाद r2 का गुणांक उतना ही अधिक होगा, जो दर्शाता है कि प्रतिगमन विश्लेषण का उपयोग करके प्राप्त समीकरण कितनी अच्छी तरह चर के बीच संबंध की व्याख्या करता है। यदि यह 1 के बराबर है, तो मॉडल के साथ पूर्ण सहसंबंध होता है, अर्थात। वास्तविक और अनुमानित y-मानों में कोई अंतर नहीं है। अन्यथा, यदि नियतत्ववाद का गुणांक 0 है, तो प्रतिगमन समीकरण y मानों की भविष्यवाणी करने में विफल रहता है।

नियतत्ववाद का गुणांक हमेशा सहसंबंध अनुपात से अधिक नहीं होता है। मामले में जब समानता संतुष्ट होती है, तो हम यह मान सकते हैं कि निर्मित अनुभवजन्य सूत्र सबसे सटीक रूप से अनुभवजन्य डेटा को दर्शाता है।

3. Microsoft Excel का उपयोग करके बनाई गई तालिकाओं का उपयोग करके गणना

गणना करने के लिए, Microsoft Excel स्प्रेडशीट प्रोसेसर के टूल का उपयोग करके डेटा को तालिका 2 के रूप में व्यवस्थित करने की सलाह दी जाती है।

तालिका 2

आइए हम बताते हैं कि तालिका 2 को कैसे संकलित किया जाता है।

चरण 1. कक्ष A1: A25 में, मान xi दर्ज करें।

चरण 2 कोशिकाओं B1: B25 में हम y का मान दर्ज करते हैं।

चरण 3 सेल C1 में, सूत्र = A1 ^ 2 दर्ज करें।

चरण 4। कक्षों C1: C25 में, इस सूत्र की प्रतिलिपि बनाई जाती है।

चरण 5 सेल D1 में, सूत्र = A1 * B1 दर्ज करें।

चरण 6 यह सूत्र कोशिकाओं D1: D25 में कॉपी किया गया है।

चरण 7 सेल F1 में, सूत्र = A1 ^ 4 दर्ज करें।

चरण 8 यह सूत्र कोशिकाओं F1: F25 में कॉपी किया गया है।

चरण 9 सेल G1 में, सूत्र = A1 ^ 2 * B1 दर्ज करें।

चरण 10 यह सूत्र कोशिकाओं G1: G25 में कॉपी किया गया है।

चरण 11 सेल H1 में, सूत्र = LN (B1) दर्ज करें।

चरण 12. कक्षों में H1: H25 इस सूत्र की प्रतिलिपि बनाई गई है।

चरण 13 सेल I1 में, सूत्र = A1 * LN (B1) दर्ज करें।

चरण 14. कक्ष I1: I25 में, इस सूत्र की प्रतिलिपि बनाई गई है।

अगले चरण ऑटोसम एस का उपयोग करके किए जाते हैं।

चरण 15. सेल A26 में, सूत्र = SUM (A1: A25) दर्ज करें।

चरण 16. सेल B26 में, सूत्र = SUM (B1: B25) दर्ज करें।

चरण 17. सेल C26 में, सूत्र = SUM (C1: C25) दर्ज करें।

चरण 18. सेल D26 में, सूत्र = SUM (D1: D25) दर्ज करें।

चरण 19. सेल E26 में, सूत्र = SUM (E1: E25) दर्ज करें।

चरण 20. सेल F26 में, सूत्र = SUM (F1: F25) दर्ज करें।

चरण 21. सेल G26 में, सूत्र = SUM (G1: G25) दर्ज करें।

चरण 22. सेल H26 में, सूत्र = SUM (H1: H25) दर्ज करें।

चरण 23. सेल I26 में, सूत्र = SUM (I1: I25) दर्ज करें।

आइए हम एक रैखिक फ़ंक्शन द्वारा फ़ंक्शन का अनुमान लगाते हैं। गुणांक निर्धारित करने और प्रणाली (4) का उपयोग करने के लिए। सेल A26, B26, C26 और D26 में स्थित तालिका 2 के कुल योग का उपयोग करके, हम सिस्टम (4) को फॉर्म में लिखते हैं

(11)

जिसे हल करने के बाद, हम प्राप्त करते हैं तथा ।

सिस्टम को क्रैमर की विधि द्वारा हल किया गया था। जिसका सार इस प्रकार है। n अज्ञात के साथ n बीजीय रैखिक समीकरणों की एक प्रणाली पर विचार करें:

(12)

सिस्टम का निर्धारक सिस्टम के मैट्रिक्स का निर्धारक है:

(13)

हम सारणिक को निरूपित करते हैं, जो जे-वें कॉलम को कॉलम से बदलकर सिस्टम Δ के सारणिक से प्राप्त होता है

इस प्रकार, रैखिक सन्निकटन का रूप है

सिस्टम (11) को माइक्रोसॉफ्ट एक्सेल टूल्स का उपयोग करके हल किया जाता है। नतीजों को टेबल तीन में दिखाया गया है।

टेबल तीन





	उलटा मैट्रिक्स

कक्ष A32 में तालिका 3: B33 में सूत्र (= MOBR (A28: B29)) है।

कक्ष E32: E33 में सूत्र लिखा जाता है (= MULTIPLE (A32: B33), (C28: C29))।

इसके बाद, हम एक द्विघात फलन द्वारा फलन का अनुमान लगाते हैं ... गुणांक a1, a2, और a3 निर्धारित करने के लिए, हम सिस्टम (5) का उपयोग करते हैं। सेल A26, B26, C26, D26, E26, F26, G26 में स्थित तालिका 2 के कुल योग का उपयोग करके, हम सिस्टम (5) को फॉर्म में लिखते हैं

(16)

जिसे हल करने पर हमें a1 = 10.663624 प्राप्त होता है। तथा

इस प्रकार, द्विघात सन्निकटन का रूप है

सिस्टम (16) को माइक्रोसॉफ्ट एक्सेल टूल्स का उपयोग करके हल किया जाता है। परिणामों को तालिका चार में दिखाया जाता है।

तालिका 4






	उलटा मैट्रिक्स

तालिका 4 में, कक्ष A41: C43 में, सूत्र लिखा गया है (= MOBR (A36: C38))।

कक्ष F41: F43 में सूत्र (= MULTIPLE (A41: C43), (D36: D38)) होता है।

अब हम एक घातांकीय फलन के साथ फलन का अनुमान लगाते हैं। गुणांक निर्धारित करने के लिए और हम मानों को लघुगणक करते हैं और, कोशिकाओं A26, C26, H26 और I26 में स्थित तालिका 2 के कुल योग का उपयोग करके, हम सिस्टम प्राप्त करते हैं

(18)

हल प्रणाली (18) होने के बाद, हम प्राप्त करते हैं और।

पोटेंशिएशन के बाद हमें मिलता है।

इस प्रकार, घातीय सन्निकटन का रूप है

सिस्टम (18) को माइक्रोसॉफ्ट एक्सेल टूल्स का उपयोग करके हल किया जाता है। परिणाम तालिका 5 में दिखाए गए हैं।

तालिका 5





	उलटा मैट्रिक्स

कक्ष A50: B51 में, सूत्र लिखा जाता है (= MOBR (A46: B47))।

कक्ष E49: E50 में, सूत्र लिखा जाता है (= MULTIPLE (A50: B51), (C46: C47))।

सेल E51 में सूत्र = EXP (E49) है।

आइए सूत्रों का उपयोग करके अंकगणितीय माध्य की गणना करें:

Microsoft Excel का उपयोग करते हुए गणना परिणाम तालिका 6 में प्रस्तुत किए गए हैं।

तालिका 6

सेल B54 में सूत्र = A26 / 25 है।

सेल B55 में सूत्र है = B26 / 25

तालिका 7

चरण 1 सेल J1 में, सूत्र दर्ज करें = (A1- $ B $ 54) * (B1- $ B $ 55)।

चरण 2 यह सूत्र कोशिकाओं J2: J25 में कॉपी किया गया है।

चरण 3 सेल K1 में, सूत्र दर्ज करें = (A1- $ B $ 54) ^ 2।

चरण 4 यह सूत्र कोशिकाओं k2: K25 में कॉपी किया गया है।

चरण 5 सेल L1 में, सूत्र दर्ज करें = (B1- $ B $ 55) ^ 2।

चरण 6 यह सूत्र कोशिकाओं L2: L25 में कॉपी किया गया है।

चरण 7 सेल M1 में, सूत्र = ($ E $ 32 + $ E $ 33 * A1-B1) ^ 2 दर्ज करें।

चरण 8 यह सूत्र कोशिकाओं M2: M25 में कॉपी किया गया है।

चरण 9 सेल N1 में, सूत्र दर्ज करें = ($ F $ 41 + $ F $ 42 * A1 + $ F $ 43 * A1 ^ 2-B1) ^ 2।

चरण 10. कक्षों N2: N25 में, यह सूत्र कॉपी किया जाता है।

चरण 11 सेल O1 में, सूत्र = ($ E $ 51 * EXP ($ E $ 50 * A1) -B1) ^ 2 दर्ज करें।

चरण 12 यह सूत्र कक्षों O2: O25 में कॉपी किया गया है।

अगले चरण ऑटो-समिंग एस के साथ किए जाते हैं।

चरण 13 सेल J26 में, सूत्र = SUMM (J1: J25) दर्ज करें।

चरण 14 सेल K26 में, सूत्र = SUMM (K1: K25) दर्ज करें।

चरण 15 सेल L26 में, सूत्र = SUMM (L1: L25) दर्ज करें।

चरण 16 सेल M26 में, सूत्र = SUMM (M1: M25) दर्ज करें।

चरण 17 सेल N26 में, सूत्र = SUMM (N1: N25) दर्ज करें।

चरण 18 सेल O26 में, सूत्र = SUMM (O1: O25) दर्ज करें।

अब हम सूत्र (8) (केवल रैखिक सन्निकटन के लिए) और सूत्र (10) का उपयोग करके नियतत्ववाद के गुणांक का उपयोग करके सहसंबंध गुणांक की गणना करते हैं। Microsoft Excel का उपयोग करके गणना के परिणाम तालिका 8 में प्रस्तुत किए गए हैं।

तालिका 8


	सहसंबंध गुणांक
	नियतत्ववाद गुणांक (रैखिक सन्निकटन)

	नियतत्ववाद गुणांक (द्विघात सन्निकटन)

	नियतत्ववाद गुणांक (घातीय सन्निकटन)

सेल E57 में सूत्र = J26 / (K26 * L26) ^ (1/2) है।

सेल E59 में सूत्र = 1-M26 / L26 है।

सेल E61 में सूत्र = 1-N26 / L26 है।

सेल E63 में सूत्र = 1-O26 / L26 है।

गणना परिणामों के विश्लेषण से पता चलता है कि द्विघात सन्निकटन प्रयोगात्मक डेटा का सबसे अच्छा वर्णन करता है।

एल्गोरिथम आरेख

चावल। 1. गणना कार्यक्रम के लिए एल्गोरिथ्म की योजना।

5. MathCad कार्यक्रम में गणना

रेखीय प्रतिगमन

· रेखा (x, y) - रैखिक प्रतिगमन गुणांक b + ax के दो तत्वों (b, a) का एक वेक्टर;

· एक्स - तर्क के वैध डेटा का वेक्टर;

वाई समान आकार के मान्य डेटा मानों का एक वेक्टर है।

चित्र 2।

बहुपद प्रतिगमन का अर्थ है kth डिग्री के बहुपद द्वारा डेटा (x1, y1) का अनुमान लगाना। k = i के साथ, बहुपद एक सीधी रेखा है, k = 2 के साथ - एक परवलय, k = 3 - एक घन परवलय, आदि के साथ। एक नियम के रूप में, व्यवहार में, k<5.

प्रतिगमन (x, y, k) - बहुपद डेटा प्रतिगमन के निर्माण के लिए गुणांक के वेक्टर;

इंटरप (एस, एक्स, वाई, टी) - बहुपद प्रतिगमन का परिणाम;

एस = वापसी (एक्स, वाई, के);

· एक्स - तर्क के वैध डेटा का वेक्टर, जिसके तत्वों को आरोही क्रम में व्यवस्थित किया गया है;

वाई समान आकार के मान्य डेटा मानों का एक वेक्टर है;

· के - प्रतिगमन बहुपद (सकारात्मक पूर्णांक) की डिग्री;

· टी - प्रतिगमन बहुपद के तर्क का मूल्य।

चित्र तीन

उन लोगों के अलावा, कई और प्रकार के तीन-पैरामीटर प्रतिगमन को मथकैड में बनाया गया है, उनका कार्यान्वयन उपरोक्त प्रतिगमन विकल्पों से कुछ अलग है, जिसमें डेटा सरणी के अलावा, कुछ प्रारंभिक मान सेट करने की आवश्यकता होती है उनके लिए गुणांक ए, बी, सी। उपयुक्त प्रकार के प्रतिगमन का उपयोग करें यदि आपके पास इस बात का अच्छा विचार है कि किस प्रकार की निर्भरता आपके डेटा सेट का वर्णन करती है। जब प्रतिगमन का प्रकार डेटा के अनुक्रम को अच्छी तरह से प्रतिबिंबित नहीं करता है, तो इसका परिणाम अक्सर असंतोषजनक होता है और प्रारंभिक मूल्यों की पसंद के आधार पर बहुत भिन्न भी होता है। प्रत्येक फ़ंक्शन निर्दिष्ट पैरामीटर ए, बी, सी का वेक्टर उत्पन्न करता है।

LINEST . के परिणाम

आइए LINEST फ़ंक्शन के उद्देश्य को देखें।

यह फ़ंक्शन उपलब्ध डेटा के लिए सबसे उपयुक्त सीधी रेखा की गणना करने के लिए कम से कम वर्ग विधि का उपयोग करता है।

फ़ंक्शन एक सरणी देता है जो परिणामी रेखा का वर्णन करता है। एक सीधी रेखा के लिए समीकरण इस प्रकार है:

M1x1 + m2x2 + ... + b या y = mx + b,

सारणीबद्ध माइक्रोसॉफ्ट सॉफ्टवेयर एल्गोरिथ्म

जहां आश्रित y-मान स्वतंत्र x-मान का एक फलन है। m मान प्रत्येक स्वतंत्र चर x के संगत गुणांक हैं, और b एक स्थिरांक है। ध्यान दें कि y, x और m सदिश हो सकते हैं।

परिणाम प्राप्त करने के लिए, आपको एक सारणीबद्ध सूत्र बनाना होगा जो 5 पंक्तियों और 2 स्तंभों पर कब्जा करेगा। यह अंतराल कार्यपत्रक पर कहीं भी स्थित हो सकता है। इस अंतराल पर LINEST फ़ंक्शन आवश्यक है।

परिणामस्वरूप, A65: B69 अंतराल के सभी कक्षों को भरा जाना चाहिए (जैसा कि तालिका 9 में दिखाया गया है)।

तालिका 9.

आइए तालिका 9 में कुछ मूल्यों के उद्देश्य की व्याख्या करें।

कोशिकाओं A65 और B65 में स्थित मान क्रमशः ढलान और बदलाव की विशेषता रखते हैं। - नियतत्ववाद का गुणांक। - एफ - मनाया मूल्य। - स्वतंत्रता की डिग्री की संख्या। - वर्गों का प्रतिगमन योग। - अवशिष्ट योग चौकों की।

रेखांकन के रूप में परिणामों की प्रस्तुति

चावल। 4. रैखिक सन्निकटन का ग्राफ

चावल। 5. द्विघात सन्निकटन का प्लॉट

चावल। 6. घातीय सन्निकटन का ग्राफ

निष्कर्ष

आइए प्राप्त आंकड़ों के परिणामों के आधार पर निष्कर्ष निकालें।

गणना परिणामों के विश्लेषण से पता चलता है कि द्विघात सन्निकटन प्रयोगात्मक डेटा का सबसे अच्छा वर्णन करता है, क्योंकि इसके लिए ट्रेंड लाइन इस क्षेत्र में फ़ंक्शन के व्यवहार को सबसे सटीक रूप से दर्शाती है।

LINEST फ़ंक्शन का उपयोग करके प्राप्त परिणामों की तुलना करते हुए, हम देखते हैं कि वे ऊपर की गई गणनाओं से पूरी तरह मेल खाते हैं। यह इंगित करता है कि गणना सही है।

MathCad प्रोग्राम का उपयोग करके प्राप्त परिणाम पूरी तरह से ऊपर दिए गए मानों से मेल खाते हैं। यह गणना की शुद्धता को इंगित करता है।

ग्रन्थसूची

1 बी.पी. डेमिडोविच, आई.ए. मैरून। कम्प्यूटेशनल गणित की नींव। एम: भौतिक और गणितीय साहित्य का राज्य प्रकाशन गृह।

2 सूचना विज्ञान: पाठ्यपुस्तक संस्करण। प्रो एन.वी. मकारोवा. एम: वित्त और सांख्यिकी, 2007।

3 सूचना विज्ञान: कंप्यूटर पर काम करने की तकनीक पर कार्यशाला, एड। प्रो एन.वी. मकारोवा. एम: वित्त और सांख्यिकी, 2010।

4 वी.बी. कोमागिन। विजुअल बेसिक में एक्सेल प्रोग्रामिंग। एम: रेडियो और संचार, 2007।

5 एन. निकोल, आर. अल्ब्रेक्ट. एक्सेल। स्प्रेडशीट। एम: एड। ईसीओएम, 2008।

कंप्यूटर विज्ञान में पाठ्यक्रम कार्य के कार्यान्वयन के लिए 6 पद्धति संबंधी निर्देश (सभी विशिष्टताओं के पत्राचार छात्रों के लिए), एड। ज़ुरोवा जी.एन., एसपीबीजीजीआई (टीयू), 2011।

मैं एक सॉफ्टवेयर गणितज्ञ हूं। मेरे करियर की सबसे बड़ी छलांग तब थी जब मैंने यह कहना सीखा: "मुझे कुछ भी समझ में नहीं आता!"अब मुझे विज्ञान के प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, मुझे समझ नहीं आ रहा है कि वह मुझे किस बारे में बता रहा था। और ये बहुत मुश्किल है। हां, अपनी अज्ञानता को स्वीकार करना कठिन और शर्मनाक है। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहां, मैं स्वीकार करता हूं, अधिकांश मामलों में मैं सोना चाहता हूं, क्योंकि मुझे कुछ भी समझ में नहीं आता है। लेकिन मुझे समझ में नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की बड़ी समस्या गणित में है। यह मानता है कि सभी श्रोता गणित के सभी क्षेत्रों से परिचित हैं (जो कि बेतुका है)। यह स्वीकार करना शर्म की बात है कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद है)।

लेकिन मैंने यह कहना सीखा कि मैं नहीं जानता कि गुणन क्या है। हाँ, मैं नहीं जानता कि लाई बीजगणित के ऊपर उप-बीजगणित क्या होता है। हां, मुझे नहीं पता कि जीवन में द्विघात समीकरणों की आवश्यकता क्यों है। वैसे, यदि आप सुनिश्चित हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित चालों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं है, कोई प्रतिष्ठा नहीं है, कोई अधिकार नहीं है। हां, यथासंभव अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूर्ण बकवास है।

क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर अनुपात सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित और यांत्रिकी के पहले वर्ष में, विक्टर पेट्रोविच खविन पहचान कीएक बिंदु पर फ़ंक्शन के टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह डेरिवेटिव के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर लंबे समय तक हंसता रहा, जब तक कि मैं अंत में समझ नहीं पाया कि यह किस बारे में है। व्युत्पन्न केवल एक माप से ज्यादा कुछ नहीं है कि हम जिस फ़ंक्शन को अलग कर रहे हैं वह फ़ंक्शन y = x, y = x ^ 2, y = x ^ 3 जैसा दिखता है।

मुझे अब उन छात्रों को व्याख्यान देने का सम्मान मिला है जो डरगणित। अगर आप गणित से डरते हैं, तो हम उसी रास्ते पर हैं। जैसे ही आप कुछ पाठ पढ़ने की कोशिश करते हैं, और आपको लगता है कि यह अत्यधिक जटिल है, तो जान लें कि यह बुरी तरह लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसके बारे में सटीकता खोए बिना "उंगलियों पर" बात नहीं की जा सकती है।

निकट भविष्य के लिए कार्य: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि रैखिक-द्विघात नियामक क्या है। संकोच न करें, अपने जीवन के तीन मिनट बिताएं, लिंक का अनुसरण करें। अगर आपको कुछ समझ नहीं आ रहा है, तो हम आपके साथ रास्ते में हैं। मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं कि आप इसे उंगलियों पर समझ सकते हैं। फिलहाल मैं नहीं जानता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।

इसलिए, पहला व्याख्यान जो मैं अपने छात्रों को पढ़ने जा रहा हूं, जब वे डरावने रूप में मेरे पास आते हैं, तो यह शब्द मेरे पास आते हैं कि एक रैखिक-द्विघात नियामक एक भयानक बायका है जो मेरे जीवन में कभी भी महारत हासिल नहीं करेगा, यह है कम से कम वर्ग विधियां... क्या आप रैखिक समीकरणों को हल कर सकते हैं? यदि आप इस पाठ को पढ़ रहे हैं, तो शायद नहीं।

इसलिए, दो बिंदुओं (x0, y0), (x1, y1), उदाहरण के लिए, (1,1) और (3,2) दिए गए, समस्या इन दो बिंदुओं से गुजरने वाली एक सीधी रेखा के समीकरण को खोजने की है:

चित्रण

इस रेखा में निम्न जैसा समीकरण होना चाहिए:

यहाँ अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन हम इस सीधी रेखा के दो बिंदु जानते हैं:

आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:

यहां एक गेय विषयांतर किया जाना चाहिए: मैट्रिक्स क्या है? एक मैट्रिक्स दो-आयामी सरणी से ज्यादा कुछ नहीं है। यह डेटा स्टोर करने का एक तरीका है; आपको इसे और अधिक महत्व नहीं देना चाहिए। यह हम पर निर्भर है कि किसी निश्चित मैट्रिक्स की व्याख्या कैसे की जाए। समय-समय पर मैं इसे एक रैखिक प्रदर्शन के रूप में, समय-समय पर द्विघात रूप के रूप में और कभी-कभी वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब संदर्भ में स्पष्ट किया जाएगा।

आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व के साथ बदलें:

तब (अल्फा, बीटा) आसानी से पाया जा सकता है:

अधिक विशेष रूप से हमारे पिछले डेटा के लिए:

जो बिंदुओं (1,1) और (3,2) से गुजरने वाली सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:

ठीक है, यहाँ सब कुछ स्पष्ट है। आइए से गुजरने वाली सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0, y0), (x1, y1) और (x2, y2):

ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञात के लिए तीन समीकरण हैं! एक मानक गणितज्ञ कहेगा कि कोई हल नहीं है। प्रोग्रामर क्या कहेगा? शुरुआत के लिए, वह निम्नलिखित रूप में समीकरणों की पिछली प्रणाली को फिर से लिखेंगे:

हमारे मामले में, सदिश i, j, b त्रि-आयामी हैं, इसलिए, (सामान्य स्थिति में) इस प्रणाली का कोई हल नहीं है। कोई भी सदिश (अल्फा \ * i + बीटा \ * j) सदिशों (i, j) द्वारा फैले हुए तल में होता है। यदि b इस तल से संबंधित नहीं है, तो समाधान मौजूद नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौता खोजें। आइए द्वारा निरूपित करें ई (अल्फा, बीटा)हम कितनी दूर तक समानता तक नहीं पहुँच पाए हैं:

और हम इस त्रुटि को कम करने का प्रयास करेंगे:

चौकोर क्यों?

हम न केवल न्यूनतम मानदंड की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु ही मेल खाता है, और वर्ग एक सुचारू कार्य देता है (तर्कों का एक द्विघात कार्य (अल्फा, बीटा)), जबकि केवल लंबाई एक शंकु जैसा कार्य देती है जो न्यूनतम बिंदु पर भिन्न नहीं होती है। भाई वर्ग अधिक सुविधाजनक है।

जाहिर है, त्रुटि कम हो जाती है जब वेक्टर इसदिशों द्वारा फैले हुए समतल के लिए ओर्थोगोनल है मैंतथा जे.

चित्रण

दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें सभी बिंदुओं से इस रेखा तक की दूरी की चुकता लंबाई का योग न्यूनतम हो:

अद्यतन: यहाँ मेरे पास एक खिचड़ी भाषा है, सीधी रेखा की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोगोनल प्रक्षेपण। यह टिप्पणीकार सही है।

चित्रण

काफी अलग तरीके से (ध्यान से, खराब औपचारिक रूप से, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ी बिंदुओं के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:

चित्रण

उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और सीधी रेखा जिसे हम ढूंढ रहे हैं, और संतुलन राज्य की सीधी रेखा बिल्कुल वही है जो हम ढूंढ रहे हैं।

न्यूनतम द्विघात रूप

तो, दिए गए वेक्टर होने बीऔर मैट्रिक्स के कॉलम वैक्टर द्वारा फैला हुआ विमान ए(इस मामले में (x0, x1, x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं इकम से कम एक वर्ग लंबाई के साथ। जाहिर है, न्यूनतम केवल वेक्टर के लिए प्राप्य है इ, मैट्रिक्स के कॉलम वैक्टर द्वारा फैले विमान के लिए ऑर्थोगोनल ए:

दूसरे शब्दों में, हम एक वेक्टर x = (अल्फा, बीटा) की तलाश कर रहे हैं जैसे:

मैं आपको याद दिला दूं कि यह वेक्टर x = (अल्फा, बीटा) द्विघात फलन का न्यूनतम है || ई (अल्फा, बीटा) || ^ 2:

यहां यह याद रखना उपयोगी होगा कि मैट्रिक्स को द्विघात रूप के रूप में व्याख्या किया जा सकता है, उदाहरण के लिए, यूनिट मैट्रिक्स ((1,0), (0,1)) को फ़ंक्शन x ^ 2 + y ^ 2 के रूप में व्याख्या किया जा सकता है। :

द्विघात रूप

यह सब जिम्नास्टिक रेखीय प्रतिगमन के रूप में जाना जाता है।

डिरिचलेट सीमा की स्थिति के साथ लैपलेस का समीकरण

अब सबसे सरल वास्तविक कार्य: एक निश्चित त्रिकोणीय सतह है, आपको इसे चिकना करने की आवश्यकता है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:

प्रारंभिक प्रतिबद्धता उपलब्ध है। बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर है। एक रैखिक प्रणाली को हल करने के लिए, मैं ओपनएनएल का उपयोग करता हूं, यह एक उत्कृष्ट सॉल्वर है, जिसे स्थापित करना बहुत मुश्किल है: आपको अपनी परियोजना के साथ दो फाइलों (.h + .c) को फ़ोल्डर में कॉपी करने की आवश्यकता है। सभी एंटी-अलियासिंग निम्नलिखित कोड के साथ किए जाते हैं:

के लिए (इंट डी = 0; डी<3; d++) { nlNewContext(); nlSolverParameteri(NL_NB_VARIABLES, verts.size()); nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE); nlBegin(NL_SYSTEM); nlBegin(NL_MATRIX); for (int i=0; i<(int)verts.size(); i++) { nlBegin(NL_ROW); nlCoefficient(i, 1); nlRightHandSide(verts[i][d]); nlEnd(NL_ROW); } for (unsigned int i=0; iऔर चेहरा = चेहरे [i]; के लिए (int j = 0; j<3; j++) { nlBegin(NL_ROW); nlCoefficient(face[ j ], 1); nlCoefficient(face[(j+1)%3], -1); nlEnd(NL_ROW); } } nlEnd(NL_MATRIX); nlEnd(NL_SYSTEM); nlSolve(); for (int i=0; i<(int)verts.size(); i++) { verts[i][d] = nlGetVariable(i); } }

X, Y और Z निर्देशांक वियोज्य हैं, मैं उन्हें अलग से चिकना करता हूं। यही है, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में मेरे मॉडल में शीर्षों की संख्या के बराबर चर की संख्या होती है। मैट्रिक्स A की पहली n पंक्तियों में प्रति पंक्ति केवल एक इकाई होती है, और वेक्टर b की पहली n पंक्तियों में मूल मॉडल निर्देशांक होते हैं। यही है, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच वसंत-टाई करता हूं - नए लोगों को पुराने से बहुत दूर नहीं भटकना चाहिए।

मैट्रिक्स A की सभी बाद की पंक्तियाँ (faces.size () * 3 = ग्रिड में सभी त्रिभुजों के किनारों की संख्या) में एक घटना 1 और एक घटना -1 होती है, और वेक्टर b में शून्य घटक विपरीत होते हैं। इसका मतलब है, मैं अपने त्रिकोणीय जाल के प्रत्येक किनारे पर एक वसंत लटकाता हूं: सभी किनारों को एक ही शीर्ष को प्रारंभिक और समाप्ति बिंदु के रूप में प्राप्त करने का प्रयास करते हैं।

एक बार फिर: सभी कोने चर हैं, और वे अपनी मूल स्थिति से दूर नहीं जा सकते हैं, लेकिन साथ ही वे एक दूसरे के समान बनने की कोशिश करते हैं।

यहाँ परिणाम है:

सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया है। आइए कोड को थोड़ा बदलें:

के लिए (int i = 0; i<(int)verts.size(); i++) { float scale = border[i] ? 1000: 1; nlBegin(NL_ROW); nlCoefficient(i, scale); nlRightHandSide(scale*verts[i][d]); nlEnd(NL_ROW); }

हमारे मैट्रिक्स ए में, किनारे पर स्थित कोने के लिए, मैं v_i = verts [i] [d] बिट से एक पंक्ति नहीं जोड़ता, लेकिन 1000 * v_i = 1000 * verts [i] [d]। यह क्या बदलता है? और यह हमारी वर्ग-कानून त्रुटि को बदल देता है। अब, किनारे पर शीर्ष से एक भी विचलन की लागत पहले की तरह एक इकाई नहीं, बल्कि 1000 * 1000 इकाई होगी। यही है, हमने चरम शिखर पर एक मजबूत वसंत लटका दिया, समाधान दूसरों को और अधिक फैलाना पसंद करता है। यहाँ परिणाम है:

आइए शिखर के बीच के झरनों को दोगुना करें:
एनएल गुणांक (चेहरा [जे], 2); nlगुणांक (चेहरा [(j + 1)% 3], -2);

यह तर्कसंगत है कि सतह चिकनी हो गई है:

और अब यह सौ गुना मजबूत है:

यह क्या है? एक तार के छल्ले को साबुन के पानी में डुबाने की कल्पना करें। नतीजतन, गठित साबुन फिल्म सबसे छोटी वक्रता रखने की कोशिश करेगी, जितना संभव हो, सीमा को छूना - हमारी तार की अंगूठी। ठीक यही हमें सीमा तय करने और अंदर की तरफ एक चिकनी सतह की मांग करने से मिला है। बधाई हो, हमने अभी-अभी डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल किया है। अच्छा लग रहा है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की केवल एक प्रणाली।

पॉइसन का समीकरण

आइए याद करते हैं एक और अच्छा नाम।

मान लीजिए मेरे पास इस तरह की एक तस्वीर है:

हर कोई अच्छा है, केवल मुझे कुर्सी पसंद नहीं है।

मैं तस्वीर को आधा काट दूंगा:

और मैं अपने हाथों से कुर्सी को उजागर करूंगा:

फिर मैं तस्वीर के बाईं ओर मुखौटा में सफेद सब कुछ खींचूंगा, और साथ ही पूरे चित्र में मैं कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दाएं के दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए चित्र:

के लिए (int i = 0; i

यहाँ परिणाम है:

वास्तविक जीवन उदाहरण

मैंने जानबूझकर पॉलिश किए हुए परिणाम नहीं किए। मैं आपको केवल यह दिखाना चाहता था कि आप कम से कम वर्ग विधियों को कैसे लागू कर सकते हैं, यह एक ट्यूटोरियल कोड है। अब मैं जीवन से एक उदाहरण देता हूं:

मेरे पास इस तरह के कपड़े के नमूनों की कई तस्वीरें हैं:

मेरा काम इस गुणवत्ता की तस्वीरों से निर्बाध बनावट बनाना है। सबसे पहले, मैं (स्वचालित रूप से) दोहराए जाने वाले पैटर्न की तलाश करता हूं:

अगर मैं इस चतुर्भुज को सीधे काट दूं, तो विरूपण के कारण किनारे नहीं मिलेंगे, यहां चार बार दोहराए गए पैटर्न का एक उदाहरण है:

छिपा हुआ पाठ

यहां एक स्निपेट है जहां सीम स्पष्ट रूप से दिखाई दे रही है:

इसलिए, मैं एक सीधी रेखा के साथ नहीं कटूंगा, यहाँ कट लाइन है:

छिपा हुआ पाठ

और यहाँ एक पैटर्न चार बार दोहराया गया है:

छिपा हुआ पाठ

और इसका एक अंश, इसे स्पष्ट करने के लिए:

इससे भी बेहतर, सभी प्रकार के कर्ल को दरकिनार करते हुए, कट एक सीधी रेखा में नहीं गया, लेकिन फिर भी मूल तस्वीर में असमान प्रकाश व्यवस्था के कारण सीम दिखाई दे रही है। यह वह जगह है जहां पॉसों के समीकरण के लिए कम से कम वर्ग विधि आती है। यहाँ प्रकाश को समतल करने के बाद अंतिम परिणाम दिया गया है:

बनावट पूरी तरह से निर्बाध निकली, और यह एक बहुत ही औसत तस्वीर से स्वचालित थी। गणित से डरो मत, सरल व्याख्याओं की तलाश करो, और आपको इंजीनियरिंग की खुशी होगी।

साधारण कम से कम वर्ग (OLS)- वांछित चर से कुछ कार्यों के विचलन के वर्गों के योग को कम करने के आधार पर विभिन्न समस्याओं को हल करने के लिए उपयोग की जाने वाली गणितीय विधि। इसका उपयोग समीकरणों की अतिनिर्धारित प्रणालियों को "हल" करने के लिए किया जा सकता है (जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो जाती है), सामान्य (अतिनिर्धारित नहीं) समीकरणों के गैर-रेखीय सिस्टम के मामले में समाधान खोजने के लिए, बिंदु मानों को अनुमानित करने के लिए। किसी समारोह का। OLS नमूना डेटा के आधार पर प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए बुनियादी प्रतिगमन विश्लेषण विधियों में से एक है।

कॉलेजिएट यूट्यूब

1 / 5

कम से कम वर्ग विधि। विषय

✪ कम से कम वर्ग पाठ 1/2। रैखिक प्रकार्य

अर्थमिति। व्याख्यान 5 कम से कम वर्ग विधि

मिटिन IV - भौतिक के परिणामों का प्रसंस्करण। प्रयोग - कम से कम वर्ग विधि (व्याख्यान 4)

अर्थमिति: कम से कम वर्गों को समझना # 2

उपशीर्षक

कहानी

19वीं सदी की शुरुआत तक। वैज्ञानिकों के पास समीकरणों की एक प्रणाली को हल करने के लिए निश्चित नियम नहीं थे जिसमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, विशेष विधियों का उपयोग किया जाता था जो समीकरणों के प्रकार और कैलकुलेटर की बुद्धि पर निर्भर करते थे, और इसलिए एक ही अवलोकन डेटा के आधार पर अलग-अलग कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) विधि के पहले अनुप्रयोग के लेखक थे, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे आधुनिक नाम (fr। मेथोड डेस मोइन्ड्रेस क्वारेस) लैपलेस ने इस पद्धति को संभाव्यता के सिद्धांत से जोड़ा, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके सैद्धांतिक और संभाव्य अनुप्रयोगों पर विचार किया। Encke, Bessel, Hansen और अन्य द्वारा आगे के शोध द्वारा इस पद्धति का प्रसार और सुधार किया गया था।

कम से कम वर्ग विधि का सार

होने देना एक्स (\ डिस्प्लेस्टाइल एक्स)- किट n (\ डिस्प्लेस्टाइल n)अज्ञात चर (पैरामीटर), एफ मैं (एक्स) (\ प्रदर्शन शैली f_ (i) (एक्स)), , एम> एन (\ डिस्प्लेस्टाइल एम> एन)- चर के इस सेट से कार्यों का एक सेट। कार्य ऐसे मूल्यों का चयन करना है एक्स (\ डिस्प्लेस्टाइल एक्स)ताकि इन कार्यों के मूल्य कुछ मूल्यों के जितना करीब हो सके y मैं (\ डिस्प्लेस्टाइल y_ (i))... संक्षेप में, हम समीकरणों की अतिनिर्धारित प्रणाली के "समाधान" के बारे में बात कर रहे हैं f i (x) = y i (\ डिस्प्लेस्टाइल f_ (i) (x) = y_ (i)), i = 1,…, m (\ डिस्प्लेस्टाइल i = 1, \ ldots, m)प्रणाली के बाएँ और दाएँ भागों की अधिकतम निकटता के संकेतित अर्थ में। एलएसएम का सार "निकटता के माप" के रूप में बाएं और दाएं पक्षों के विचलन के वर्गों के योग को चुनना है। | एफ मैं (एक्स) - वाई मैं | (\ डिस्प्लेस्टाइल | f_ (i) (x) -y_ (i) |)... इस प्रकार, ओएलएस का सार निम्नानुसार व्यक्त किया जा सकता है:

यानी 2 = ∑ मैं (yi - fi (x)) 2 → मिनट x (\ प्रदर्शन शैली \ योग _ (i) e_ (i) ^ (2) = \ योग _ (i) (y_ (i) -f_ ( i) (x)) ^ (2) \ दायां तीर \ मिनट _ (x)).

यदि समीकरणों की प्रणाली में एक समाधान है, तो वर्गों का न्यूनतम योग शून्य के बराबर होगा और समीकरणों की प्रणाली के सटीक समाधान विश्लेषणात्मक रूप से या, उदाहरण के लिए, विभिन्न संख्यात्मक अनुकूलन विधियों द्वारा पाए जा सकते हैं। यदि सिस्टम को फिर से परिभाषित किया जाता है, अर्थात, स्वतंत्र रूप से बोलना, स्वतंत्र समीकरणों की संख्या मांगी गई चर की संख्या से अधिक है, तो सिस्टम के पास सटीक समाधान नहीं है और कम से कम वर्ग विधि आपको कुछ "इष्टतम" वेक्टर खोजने की अनुमति देती है एक्स (\ डिस्प्लेस्टाइल एक्स)वैक्टर की अधिकतम निकटता के अर्थ में वाई (\ डिस्प्लेस्टाइल वाई)तथा एफ (एक्स) (\ डिस्प्लेस्टाइल एफ (एक्स))या विचलन के वेक्टर की अधिकतम निकटता ई (\ डिस्प्लेस्टाइल ई)शून्य से (निकटता को यूक्लिडियन दूरी के अर्थ में समझा जाता है)।

उदाहरण - रैखिक समीकरणों की एक प्रणाली

विशेष रूप से, कम से कम वर्ग विधि का उपयोग रैखिक समीकरणों की एक प्रणाली को "हल" करने के लिए किया जा सकता है

ए एक्स = बी (\ डिस्प्लेस्टाइल एक्स = बी),

कहाँ पे ए (\ डिस्प्लेस्टाइल ए)आयताकार आकार मैट्रिक्स एम × एन, एम> एन (\ डिस्प्लेस्टाइल एम \ टाइम्स एन, एम> एन)(अर्थात, मैट्रिक्स ए की पंक्तियों की संख्या मांगी गई चर की संख्या से अधिक है)।

सामान्य स्थिति में, समीकरणों की ऐसी प्रणाली का कोई हल नहीं होता है। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है एक्स (\ डिस्प्लेस्टाइल एक्स)वैक्टर के बीच "दूरी" को कम करने के लिए एक एक्स (\ डिस्प्लेस्टाइल कुल्हाड़ी)तथा बी (\ डिस्प्लेस्टाइल बी)... ऐसा करने के लिए, आप सिस्टम के समीकरणों के बाएँ और दाएँ पक्षों के बीच अंतर के वर्गों के योग को कम करने के लिए मानदंड लागू कर सकते हैं, अर्थात, (ए एक्स - बी) टी (ए एक्स - बी) → मिनट एक्स (\ डिस्प्लेस्टाइल (एक्स-बी) ^ (टी) (एक्स-बी) \ राइटएरो \ मिनट _ (एक्स))... यह दिखाना आसान है कि इस न्यूनीकरण समस्या का समाधान समीकरणों की निम्नलिखित प्रणाली के समाधान की ओर ले जाता है

एटीए एक्स = एटी बी ⇒ एक्स = (एटीए) - 1 एटी बी (\ डिस्प्लेस्टाइल ए ^ (टी) एक्स = ए ^ (टी) बी \ राइटएरो एक्स = (ए ^ (टी) ए) ^ (- 1) ए ^ (टी) बी).

प्रतिगमन विश्लेषण में OLS (डेटा फ़िट)

उसे वही रहने दो n (\ डिस्प्लेस्टाइल n)कुछ चर के मान वाई (\ डिस्प्लेस्टाइल वाई)(ये प्रेक्षणों, प्रयोगों आदि के परिणाम हो सकते हैं) और संगत चर एक्स (\ डिस्प्लेस्टाइल एक्स)... चुनौती यह सुनिश्चित करना है कि के बीच संबंध वाई (\ डिस्प्लेस्टाइल वाई)तथा एक्स (\ डिस्प्लेस्टाइल एक्स)कुछ अज्ञात मापदंडों तक ज्ञात किसी फ़ंक्शन द्वारा अनुमानित बी (\ डिस्प्लेस्टाइल बी), अर्थात, वास्तव में, मापदंडों के सर्वोत्तम मूल्यों का पता लगाएं बी (\ डिस्प्लेस्टाइल बी), अधिकतम अनुमानित मान एफ (एक्स, बी) (\ डिस्प्लेस्टाइल एफ (एक्स, बी))वास्तविक मूल्यों के लिए वाई (\ डिस्प्लेस्टाइल वाई)... वास्तव में, यह समीकरणों की एक अतिनिर्धारित प्रणाली के "समाधान" के मामले में कम हो जाता है बी (\ डिस्प्लेस्टाइल बी):

एफ (एक्स टी, बी) = वाई टी, टी = 1,…, एन (\ डिस्प्लेस्टाइल एफ (एक्स_ (टी), बी) = वाई_ (टी), टी = 1, \ एलडॉट्स, एन).

प्रतिगमन विश्लेषण में, और विशेष रूप से अर्थमिति में, चर के बीच संबंध के संभाव्य मॉडल का उपयोग किया जाता है

वाई टी = एफ (एक्स टी, बी) + ε टी (\ डिस्प्लेस्टाइल वाई_ (टी) = एफ (एक्स_ (टी), बी) + \ varepsilon _ (टी)),

कहाँ पे टी (\ डिस्प्लेस्टाइल \ varepsilon _ (टी))- तथाकथित यादृच्छिक त्रुटियांमॉडल।

तदनुसार, प्रेक्षित मानों का विचलन वाई (\ डिस्प्लेस्टाइल वाई)मॉडल से एफ (एक्स, बी) (\ डिस्प्लेस्टाइल एफ (एक्स, बी))मॉडल में पहले से ही माना जाता है। OLS (साधारण, शास्त्रीय) का सार ऐसे मापदंडों को खोजना है बी (\ डिस्प्लेस्टाइल बी)जिसके लिए विचलन के वर्गों का योग (त्रुटियों, प्रतिगमन मॉडल के लिए उन्हें अक्सर प्रतिगमन अवशेष कहा जाता है) ई टी (\ डिस्प्लेस्टाइल ई_ (टी))न्यूनतम होगा:

बी ^ ओ एल एस = आर्ग ⁡ मिनट बी आर एस एस (बी) (\ डिस्प्लेस्टाइल (\ टोपी (बी)) _ (ओएलएस) = \ arg \ मिनट _ (बी) आरएसएस (बी)),

कहाँ पे आर एस एस (\ डिस्प्लेस्टाइल आरएसएस)- अंग्रेज़ी। वर्गों के अवशिष्ट योग को इस प्रकार परिभाषित किया गया है:

आरएसएस (बी) = ई टी ई = ∑ टी = 1 नेट 2 = ∑ टी = 1 एन (वाईटी - एफ (एक्सटी, बी)) 2 (\ डिस्प्लेस्टाइल आरएसएस (बी) = ई ^ (टी) ई = \ योग _ (टी = 1) ^ (एन) ई_ (टी) ^ (2) = \ योग _ (टी = 1) ^ (एन) (वाई_ (टी) -एफ (एक्स_ (टी), बी)) ^ (2) ).

सामान्य स्थिति में, इस समस्या को संख्यात्मक अनुकूलन (न्यूनतमीकरण) विधियों द्वारा हल किया जा सकता है। इस मामले में, वे बात करते हैं अरेखीय कम से कम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी गैर-रैखिक कम से कम वर्ग)। कई मामलों में, एक विश्लेषणात्मक समाधान प्राप्त किया जा सकता है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को खोजना आवश्यक है आर एस एस (बी) (\ डिस्प्लेस्टाइल आरएसएस (बी)), इसे अज्ञात मापदंडों द्वारा विभेदित करना बी (\ डिस्प्लेस्टाइल बी), व्युत्पन्न को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना:

∑ t = 1 n (yt - f (xt, b)) f (xt, b) b = 0 (\ displaystyle \ sum _ (t = 1) ^ (n) (y_ (t) -f (x_) (टी), बी)) (\ फ्रैक (\ आंशिक एफ (एक्स_ (टी), बी)) (\ आंशिक बी)) = 0).

रैखिक प्रतिगमन के लिए ओएलएस

प्रतिगमन निर्भरता को रैखिक होने दें:

yt = ∑ j = 1 kbjxtj + ε = xt T b + t (\ डिस्प्लेस्टाइल y_ (t) = \ योग _ (j = 1) ^ (k) b_ (j) x_ (tj) + \ varepsilon = x_ ( टी) ^ (टी) बी + \ varepsilon _ (टी)).

होने देना आपचर के अवलोकनों का स्तंभ वेक्टर समझाया जा रहा है, और एक्स (\ डिस्प्लेस्टाइल एक्स)- यह (एन × के) (\ डिस्प्लेस्टाइल ((एन \ टाइम्स के)))कारकों की टिप्पणियों का मैट्रिक्स (मैट्रिक्स की पंक्तियाँ किसी दिए गए अवलोकन में कारकों के मूल्यों के वैक्टर हैं, स्तंभों द्वारा - सभी टिप्पणियों में दिए गए कारक के मूल्यों का एक वेक्टर)। रैखिक मॉडल का मैट्रिक्स प्रतिनिधित्व है:

y = X b + (\ डिस्प्लेस्टाइल y = Xb + \ varepsilon).

फिर समझाया गया चर के अनुमानों के वेक्टर और प्रतिगमन अवशिष्ट के वेक्टर बराबर होंगे

वाई ^ = एक्स बी, ई = वाई - वाई ^ = वाई - एक्स बी (\ डिस्प्लेस्टाइल (\ टोपी (वाई)) = एक्सबी, \ क्वाड ई = वाई - (\ टोपी (वाई)) = वाई-एक्सबी).

तदनुसार, प्रतिगमन अवशेषों के वर्गों का योग होगा

आर एस एस = ई टी ई = (वाई - एक्स बी) टी (वाई - एक्स बी) (\ डिस्प्लेस्टाइल आरएसएस = ई ^ (टी) ई = (वाई-एक्सबी) ^ (टी) (वाई-एक्सबी)).

पैरामीटर वेक्टर के संबंध में इस फ़ंक्शन को अलग करना बी (\ डिस्प्लेस्टाइल बी)और डेरिवेटिव को शून्य के बराबर करते हुए, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):

(एक्स टी एक्स) बी = एक्स टी वाई (\ डिस्प्लेस्टाइल (एक्स ^ (टी) एक्स) बी = एक्स ^ (टी) वाई).

गूढ़ मैट्रिक्स रूप में, समीकरणों की यह प्रणाली इस तरह दिखती है:

(∑ एक्सटी 1 2 ∑ एक्सटी 1 एक्सटी 2 ∑ एक्सटी 1 एक्सटी 3… ∑ एक्सटी 1 एक्सटी एक्सटी 2 एक्सटी 1 ∑ एक्सटी 2 2 ∑ एक्सटी 2 एक्सटी 3… ∑ एक्सटी 2 एक्सटी ∑ एक्सटी 3 एक्सटी 1 ∑ एक्सटी 3 एक्सटी 2 xt 3 2… xt 3 xtk xtkxt 1 xtkxt 2 ∑ xtkxt 3… xtk 2) (b 1 b 2 b 3 bk) = (∑ xt 1 yt xt 2 yt xt 3 yt xtkyt), (\ डिस्प्लेस्टाइल (\ start (pmatrix) \ sum x_ (t1) ^ (2) और \ sum x_ (t1) x_ (t2) और \ sum x_ (t1) x_ (t3) और \ ldots & \ योग x_ (t1) x_ (tk) \\\ योग x_ (t2) x_ (t1) और \ योग x_ (t2) ^ (2) और \ योग x_ (t2) x_ (t3) और \ ldots & \ योग x_ (t2) x_ (tk) \\\ योग x_ (t3) x_ (t1) और \ योग x_ (t3) x_ (t2) और \ योग x_ (t3) ^ (2) और \ ldots और \ योग x_ (t3) x_ (tk) \\\ vdots और \ vdots और \ vdots और \ ddots और \ vdots \\\ योग x_ (tk) x_ (t1) और \ योग x_ (tk) x_ (t2) और \ योग x_ (tk) x_ (t3) और \ ldots और \ sum x_ (tk) ^ (2) \\\ अंत (pmatrix)) (\ start (pmatrix) b_ (1) \\ b_ (2) \\ b_ (3 ) \\\ vdots \\ b_ (k) \\\ अंत (pmatrix)) = (\ start (pmatrix) \ sum x_ (t1) y_ (t) \\\ sum x_ (t2) y_ (t) \\ \ योग x_ (t3) y_ (t) \\\ vdots \\\ योग x_ (tk) y_ (t) \\\ अंत (pmatrix)),)जहां सभी राशियों को सभी स्वीकार्य मूल्यों पर लिया जाता है टी (\ डिस्प्लेस्टाइल टी).

यदि मॉडल में एक स्थिरांक शामिल है (हमेशा की तरह), तो एक्स टी 1 = 1 (\ डिस्प्लेस्टाइल एक्स_ (टी1) = 1)सबके साथ टी (\ डिस्प्लेस्टाइल टी), इसलिए, समीकरणों की प्रणाली के मैट्रिक्स के ऊपरी बाएं कोने में, अवलोकनों की संख्या है n (\ डिस्प्लेस्टाइल n), और पहली पंक्ति और पहले कॉलम के बाकी तत्वों में - चर के मूल्यों का योग: ∑ एक्स टी जे (\ डिस्प्लेस्टाइल \ योग x_ (टीजे))और तंत्र के दायीं ओर का पहला तत्व है y t (\ डिस्प्लेस्टाइल \ योग y_ (टी)).

समीकरणों की इस प्रणाली का समाधान रैखिक मॉडल के लिए ओएलएस अनुमानों का सामान्य सूत्र देता है:

बी ^ ओएलएस = (एक्सटीएक्स) - 1 एक्सटी वाई = (1 एन एक्सटीएक्स) - 1 1 एन एक्सटी वाई = वी एक्स - 1 सी एक्सवाई (\ डिस्प्लेस्टाइल (\ टोपी (बी)) _ (ओएलएस) = (एक्स ^ (टी) ) एक्स) ^ (- 1) एक्स ^ (टी) वाई = \ बाएं ((\ फ्रैक (1) (एन)) एक्स ^ (टी) एक्स \ दाएं) ^ (- 1) (\ फ्रैक (1) (एन )) एक्स ^ (टी) वाई = वी_ (एक्स) ^ (- 1) सी_ (एक्सवाई)).

विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का अंतिम प्रतिनिधित्व उपयोगी साबित होता है (समीकरणों की प्रणाली में जब n से विभाजित किया जाता है, तो योग के बजाय, अंकगणितीय साधन दिखाई देते हैं)। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का वेक्टर है। यदि, इसके अतिरिक्त, डेटा भी है सामान्यीकृत SKO के लिए (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के चयनात्मक सहसंबंध मैट्रिक्स का अर्थ होता है, दूसरा वेक्टर एक आश्रित चर के साथ कारकों के चयनात्मक सहसंबंधों का एक वेक्टर होता है।

मॉडलों के लिए ओएलएस अनुमानों की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता पूरी होती है:

वाई ¯ = बी 1 ^ + ∑ जे = 2 केबी ^ जेएक्स ¯ जे (\ डिस्प्लेस्टाइल (\ बार (वाई)) = (\ टोपी (बी_ (1))) + \ योग _ (जे = 2) ^ (के) (\ टोपी (बी)) _ (जे) (\ बार (एक्स)) _ (जे)).

विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी स्थिर होता है, तो हम पाते हैं कि एकमात्र पैरामीटर (स्थिर स्वयं) का ओएलएस अनुमान समझाया जा रहा चर के औसत मूल्य के बराबर है। अर्थात्, अंकगणित माध्य, जो बड़ी संख्या के नियमों से अपने अच्छे गुणों के लिए जाना जाता है, एक OLS-अनुमान भी है - यह इससे विचलन के वर्गों के न्यूनतम योग की कसौटी को पूरा करता है।

सबसे सरल विशेष मामले

युग्मित रैखिक प्रतिगमन के मामले में y t = a + b x t + t (\ डिस्प्लेस्टाइल y_ (t) = a + bx_ (t) + \ varepsilon _ (t)), जब एक चर की दूसरे पर रैखिक निर्भरता का अनुमान लगाया जाता है, तो गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं)। समीकरणों की प्रणाली इस प्रकार है:

(1 x ¯ x ¯ x 2 ) (ab) = (y ¯ xy ) (\ डिस्प्लेस्टाइल (\ start (pmatrix) 1 और (\ bar (x)) \\ (\ bar (x)) और (\ बार (x ^ (2))) \\\ अंत (pmatrix)) (\ start (pmatrix) a \\ b \\\ end (pmatrix)) = (\ start (pmatrix) (\ bar (y)) \ \ (\ overline (xy)) \\\ अंत (pmatrix))).

इसलिए, गुणांकों का अनुमान लगाना आसान है:

(बी ^ = कोव (एक्स, वाई) वार ⁡ (एक्स) = xy ¯ - x y ¯ x 2 ¯ - x ¯ 2, a ^ = y ¯ - bx । (\ डिस्प्लेस्टाइल (\ start (केस)) (\ टोपी (बी)) = (\ फ्रैक (\ मैथोप (\ टेक्स्टआरएम (कोव)) (एक्स, वाई)) (\ मैथोप (\ टेक्स्टआरएम (वार)) (एक्स))) = (\ फ्रैक ((\ ओवरलाइन) (xy)) - (\ बार (x)) (\ बार (y))) ((\ overline (x ^ (2))) - (\ overline (x)) ^ (2))), \\ ( \ टोपी (ए)) = (\ बार (वाई)) - बी (\ बार (एक्स))। \ अंत (केस)))

इस तथ्य के बावजूद कि सामान्य मामले में एक स्थिरांक वाला मॉडल बेहतर होता है, कुछ मामलों में यह सैद्धांतिक विचारों से जाना जाता है कि स्थिरांक ए (\ डिस्प्लेस्टाइल ए)शून्य होना चाहिए। उदाहरण के लिए, भौतिकी में, वोल्टेज और करंट के बीच संबंध का रूप है यू = आई ⋅ आर (\ डिस्प्लेस्टाइल यू = आई \ सीडीटी आर); वोल्टेज और वर्तमान ताकत को मापने के लिए, प्रतिरोध का अनुमान लगाना आवश्यक है। इस मामले में, हम मॉडल के बारे में बात कर रहे हैं वाई = बी एक्स (\ डिस्प्लेस्टाइल वाई = बीएक्स)... इस मामले में, समीकरणों की प्रणाली के बजाय, हमारे पास एकमात्र समीकरण है

(∑ x t 2) b = ∑ x t y t (\ displaystyle \ left (\ sum x_ (t) ^ (2) \ right) b = \ sum x_ (t) y_ (t)).

नतीजतन, एकल गुणांक के आकलन के सूत्र का रूप है

बी ^ = ∑ टी = 1 एनएक्सटीटी ∑ टी = 1 एनएक्सटी 2 = एक्सवाई ¯ एक्स 2 ¯ (\ डिस्प्लेस्टाइल (\ टोपी (बी)) = (\ फ़्रेक (\ योग _ (टी = 1) ^ (एन) x_ (टी ) y_ (t)) (\ sum _ (t = 1) ^ (n) x_ (t) ^ (2))) = (\ frac (\ overline (xy)) (\ overline (x ^ (2)) ))).

बहुपद मॉडल मामला

यदि डेटा को एकल चर बहुपद प्रतिगमन फ़ंक्शन के साथ फिट किया गया है f (x) = b 0 + ∑ i = 1 k b i x i (\ डिस्प्लेस्टाइल f (x) = b_ (0) + \ योग \ सीमाएं _ (i = 1) ^ (k) b_ (i) x ^ (i)), फिर, डिग्री को समझते हुए x i (\ डिस्प्लेस्टाइल x ^ (i))सभी के लिए स्वतंत्र कारक के रूप में मैं (\ डिस्प्लेस्टाइल मैं)रैखिक मॉडल के मापदंडों के आकलन के लिए सामान्य सूत्र के आधार पर मॉडल के मापदंडों का अनुमान लगाना संभव है। ऐसा करने के लिए, सामान्य सूत्र को ध्यान में रखना पर्याप्त है कि इस तरह की व्याख्या के साथ x t i x t j = x t i x t j = x t i + j (\ डिस्प्लेस्टाइल x_ (ti) x_ (tj) = x_ (t) ^ (i) x_ (t) ^ (j) = x_ (t) ^ (i + j))तथा x t j y t = x t j y t (\ displaystyle x_ (tj) y_ (t) = x_ (t) ^ (j) y_ (t))... नतीजतन, इस मामले में मैट्रिक्स समीकरण रूप ले लेंगे:

(एन एनएक्सटी… ∑ एनएक्सटीके एनएक्सटी ∑ एनएक्सटी 2… ∑ एनएक्सटीके + 1 एनएक्सटीके ∑ एनएक्सटीके + 1… ∑ एनएक्सटी 2 के) [बी 0 बी 1 ⋮ बीके] = [∑ nyt nxtyt ]. (\ डिस्प्लेस्टाइल (\ start (pmatrix) n & \ sum \ सीमाएं _ (n) x_ (t) और \ ldots और \ sum \ सीमाएं _ (n) x_ (t) ^ (k) \\\ योग \ सीमाएं _ (एन) x_ (टी) और \ योग \ सीमा _ (एन) x_ (टी) ^ (2) और \ डॉट्स और \ योग \ सीमा _ (एन) x_ (टी) ^ (के + 1) \\\ vdots और \ vdots और \ ddots और \ vdots \\\ योग \ सीमा _ (n) x_ (t) ^ (k) और \ योग \ सीमा _ (n) x_ (t) ^ (k + 1) और \ ldots & \ योग \ सीमा _ (एन) x_ (टी) ^ (2k) \ अंत (pmatrix)) (\ start (bmatrix) b_ (0) \\ b_ (1) \\\ vdots \\ b_ (k) \ अंत ( bmatrix)) = (\ start (bmatrix) \ sum \ Limits _ (n) y_ (t) \\\ sum \ Limits _ (n) x_ (t) y_ (t) \\\ vdots \\\ sum \ सीमा _ (एन) x_ (टी) ^ (के) y_ (टी) \ अंत (बीमैट्रिक्स))।)

ओएलएस अनुमानों के सांख्यिकीय गुण

सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, ओएलएस अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से निम्नानुसार है। ओएलएस अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: यादृच्छिक त्रुटि की गणितीय अपेक्षा, कारकों के संदर्भ में सशर्त, शून्य के बराबर होनी चाहिए। यह शर्त, विशेष रूप से, संतुष्ट होती है यदि

यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं।

दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)। शास्त्रीय मामले में, एक यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से बहिर्जात स्थिति की पूर्ति का मतलब है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, मैट्रिक्स के अभिसरण के साथ-साथ बहिर्जात स्थिति को संतुष्ट करने के लिए पर्याप्त है वी एक्स (\ डिस्प्लेस्टाइल वी_ (एक्स))नमूना आकार को अनंत तक बढ़ाने के साथ कुछ गैर-पतित मैट्रिक्स के लिए।

निरंतरता और निष्पक्षता के अलावा, (साधारण) कम से कम वर्गों के अनुमान प्रभावी होने के लिए (रैखिक निष्पक्ष अनुमानों के वर्ग में सर्वश्रेष्ठ), एक यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा करना आवश्यक है:

इन मान्यताओं को यादृच्छिक त्रुटियों के वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है वी (ε) = σ 2 मैं (\ डिस्प्लेस्टाइल वी (\ varepsilon) = \ सिग्मा ^ (2) मैं).

इन शर्तों को पूरा करने वाला एक रैखिक मॉडल कहलाता है क्लासिक... शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानों के वर्ग में सबसे प्रभावी अनुमान हैं (अंग्रेजी साहित्य में, संक्षेप में कभी-कभी उपयोग किया जाता है नीला (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) सबसे अच्छा रैखिक निष्पक्ष अनुमान है; घरेलू साहित्य में, गॉस - मार्कोव प्रमेय को अधिक बार उद्धृत किया जाता है)। जैसा कि यह दिखाना आसान है, गुणांक अनुमानों के वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:

वी (बी ^ ओएलएस) = σ 2 (एक्सटीएक्स) - 1 (\ डिस्प्लेस्टाइल वी ((\ टोपी (बी)) _ (ओएलएस)) = \ सिग्मा ^ (2) (एक्स ^ (टी) एक्स) ^ (- 1 )).

दक्षता का अर्थ है कि यह सहप्रसरण मैट्रिक्स "न्यूनतम" है (गुणांक का कोई भी रैखिक संयोजन, और विशेष रूप से स्वयं गुणांक, न्यूनतम विचरण है), अर्थात रैखिक निष्पक्ष अनुमानों के वर्ग में, OLS अनुमान सबसे अच्छे हैं। इस मैट्रिक्स के विकर्ण तत्व - गुणांक अनुमानों के प्रसरण - प्राप्त अनुमानों की गुणवत्ता के महत्वपूर्ण पैरामीटर हैं। हालांकि, सहप्रसरण मैट्रिक्स की गणना करना असंभव है, क्योंकि यादृच्छिक त्रुटियों का विचरण अज्ञात है। यह साबित किया जा सकता है कि निष्पक्ष और सुसंगत (शास्त्रीय रैखिक मॉडल के लिए) यादृच्छिक त्रुटियों के विचरण का अनुमान मूल्य है:

एस 2 = आर एस एस / (एन - के) (\ डिस्प्लेस्टाइल एस ^ (2) = आरएसएस / (एन-के)).

इस मान को सहप्रसरण मैट्रिक्स के सूत्र में प्रतिस्थापित करने पर हमें सहप्रसरण मैट्रिक्स का एक अनुमान प्राप्त होता है। प्राप्त अनुमान भी निष्पक्ष और सुसंगत हैं। यह भी महत्वपूर्ण है कि त्रुटियों के विचरण का अनुमान (और इसलिए गुणांकों के प्रसरण) और मॉडल मापदंडों के अनुमान स्वतंत्र यादृच्छिक चर हैं, जो किसी को मॉडल के गुणांक के बारे में परिकल्पना के परीक्षण के लिए परीक्षण के आंकड़े प्राप्त करने की अनुमति देता है।

यह ध्यान दिया जाना चाहिए कि यदि शास्त्रीय मान्यताओं को पूरा नहीं किया जाता है, तो मापदंडों के ओएलएस अनुमान सबसे कुशल नहीं हैं और जहां डब्ल्यू (\ डिस्प्लेस्टाइल डब्ल्यू)- कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स। सामान्य ओएलएस इस दृष्टिकोण का एक विशेष मामला है, जब वजन मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि ज्ञात है, सममित मैट्रिक्स (या ऑपरेटरों) के लिए एक अपघटन होता है डब्ल्यू = पी टी पी (\ डिस्प्लेस्टाइल डब्ल्यू = पी ^ (टी) पी)... इसलिए, इस कार्यात्मक को निम्नानुसार दर्शाया जा सकता है ई टीपीटीपी ई = (पी ई) टीपी ई = ई टी ई ∗ (\ डिस्प्लेस्टाइल ई ^ (टी) पी ^ (टी) पे = (पे) ^ (टी) पे = ई _ (*) ^ (टी ) ई_ (*)), अर्थात्, इस कार्यात्मक को कुछ रूपांतरित "अवशिष्ट" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम कम से कम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस-विधियां (कम से कम वर्ग)।

यह साबित हो गया है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल के लिए (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है), सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित अनुमान हैं सामान्यीकृत ओएलएस (ओएलएस, जीएलएस - सामान्यीकृत कम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहसंयोजक मैट्रिक्स के बराबर वजन मैट्रिक्स के साथ एलएस-विधि: डब्ल्यू = वी ε - 1 (\ डिस्प्लेस्टाइल डब्ल्यू = वी _ (\ varepsilon) ^ (- 1)).

यह दिखाया जा सकता है कि एक रैखिक मॉडल के मापदंडों के लिए ओएलएस अनुमान के सूत्र का रूप है

बी ^ जीएलएस = (एक्सटीवी - 1 एक्स) - 1 एक्सटीवी - 1 वाई (\ डिस्प्लेस्टाइल (\ टोपी (बी)) _ (जीएलएस) = (एक्स ^ (टी) वी ^ (- 1) एक्स) ^ (- 1) एक्स ^ (टी) वी ^ (- 1) वाई).

इन अनुमानों का सहप्रसरण मैट्रिक्स तदनुसार बराबर होगा

वी (बी ^ जीएलएस) = (एक्सटीवी - 1 एक्स) - 1 (\ डिस्प्लेस्टाइल वी ((\ टोपी (बी)) _ (जीएलएस)) = (एक्स ^ (टी) वी ^ (- 1) एक्स) ^ (- एक)).

वास्तव में, OLS का सार मूल डेटा का एक निश्चित (रैखिक) परिवर्तन (P) है और रूपांतरित डेटा में सामान्य OLS का अनुप्रयोग है। इस परिवर्तन का लक्ष्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को पूरा करती हैं।

भारित ओएलएस

एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों का एक सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (WLS) हैं। इस मामले में, मॉडल के अवशेषों के वर्गों का भारित योग कम से कम है, अर्थात, प्रत्येक अवलोकन को इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती "वजन" प्राप्त होता है: ई TW ई = ∑ टी = 1 नेट 2 σ टी 2 (\ डिस्प्लेस्टाइल ई ^ (टी) हम = \ योग _ (टी = 1) ^ (एन) (\ फ्रैक (ई_ (टी) ^ (2)) (\ सिग्मा _ (टी) ^ (2))))... वास्तव में, डेटा को प्रेक्षणों को भारित करके (यादृच्छिक त्रुटियों के अनुमानित मानक विचलन के समानुपाती मान से विभाजित करके) रूपांतरित किया जाता है, और नियमित OLS को भारित डेटा पर लागू किया जाता है।

आईएसबीएन 978-5-7749-0473-0।

अर्थमिति। पाठ्यपुस्तक / एड। एलिसेवा आई.आई. - दूसरा संस्करण। - एम .: वित्त और सांख्यिकी, 2006 .-- 576 पी। - आईएसबीएन 5-279-02786-3।

अलेक्जेंड्रोवा एन.वी.गणितीय शब्दों, अवधारणाओं, पदनामों का इतिहास: संदर्भ शब्दकोश। - तीसरा संस्करण .. - एम .: एलकेआई, 2008 .-- 248 पी। - आईएसबीएन 978-5-382-00839-4।आई.वी. मितिन, रुसाकोव वी.एस. प्रयोगात्मक डेटा का विश्लेषण और प्रसंस्करण - 5 वां संस्करण - 24s।

इसका व्यापक रूप से अर्थमिति में इसके मापदंडों की स्पष्ट आर्थिक व्याख्या के रूप में उपयोग किया जाता है।

रेखीय प्रतिगमन को फॉर्म का समीकरण खोजने के लिए कम किया जाता है

या

फॉर्म का समीकरण दिए गए पैरामीटर मानों के लिए अनुमति देता है एक्सइसमें कारक के वास्तविक मूल्यों को प्रतिस्थापित करते हुए, प्रभावी संकेतक के सैद्धांतिक मूल्य हैं एक्स.

रेखीय समाश्रयण का निर्माण इसके प्राचलों के आकलन तक घटा दिया गया है - एतथा वीरैखिक प्रतिगमन के मापदंडों का अनुमान विभिन्न तरीकों से पाया जा सकता है।

रेखीय प्रतीपगमन प्राचलों के आकलन के लिए शास्त्रीय उपागम पर आधारित है कम से कम वर्ग विधि(ओएलएस)।

OLS किसी को ऐसे पैरामीटर अनुमान प्राप्त करने की अनुमति देता है एतथा वी,जिस पर परिणामी विशेषता के वास्तविक मूल्यों के विचलन के वर्गों का योग (वाई)परिकलित (सैद्धांतिक) से कम से कम:

फ़ंक्शन के न्यूनतम को खोजने के लिए, प्रत्येक पैरामीटर के संबंध में आंशिक डेरिवेटिव की गणना करना आवश्यक है एतथा बीऔर उन्हें शून्य पर सेट करें।

हम निरूपित करते हैं एस के माध्यम से, फिर:

सूत्र को बदलने से, हम मापदंडों के आकलन के लिए सामान्य समीकरणों की निम्नलिखित प्रणाली प्राप्त करते हैं: एतथा वी:

सामान्य समीकरणों की प्रणाली (3.5) को या तो चर के क्रमिक उन्मूलन की विधि द्वारा या निर्धारकों की विधि द्वारा हल करने पर, हम मापदंडों के आवश्यक अनुमान पाते हैं एतथा वी

पैरामीटर वीप्रतिगमन गुणांक कहा जाता है। इसका मान एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन को दर्शाता है।

प्रतिगमन समीकरण हमेशा रिश्ते की जकड़न के एक संकेतक द्वारा पूरक होता है। जब रैखिक प्रतिगमन का उपयोग किया जाता है, तो रैखिक सहसंबंध गुणांक ऐसे संकेतक के रूप में कार्य करता है। रैखिक सहसंबंध गुणांक सूत्र के विभिन्न संशोधन हैं। उनमें से कुछ नीचे सूचीबद्ध हैं:

जैसा कि आप जानते हैं, रैखिक सहसंबंध गुणांक सीमा में है: -1 ≤ ≤ 1.

एक रैखिक फ़ंक्शन के चयन की गुणवत्ता का आकलन करने के लिए, वर्ग की गणना की जाती है

रैखिक सहसंबंध गुणांक कहा जाता है निर्धारण का गुणांक।निर्धारण का गुणांक प्रभावी संकेतक के विचरण के अनुपात को दर्शाता है वाई,प्रतिगमन द्वारा समझाया गया, प्रभावी विशेषता के कुल विचरण में:

तदनुसार, मान 1 - फैलाव के अनुपात को दर्शाता है वाई,अन्य कारकों के प्रभाव के कारण मॉडल में ध्यान नहीं दिया गया।

आत्म-नियंत्रण के लिए प्रश्न

1. कम से कम वर्ग विधि का सार क्या है?

2. युग्मित समाश्रयण कितने चर प्रदान किए गए हैं?

3. वह कौन सा गुणांक है जो परिवर्तनों के बीच संबंधों की जकड़न को निर्धारित करता है?

4. निर्धारण का गुणांक किस सीमा के भीतर निर्धारित किया जाता है?

5. सहसंबंध-प्रतिगमन विश्लेषण में पैरामीटर बी का अनुमान?

1. क्रिस्टोफर डौघर्टी। अर्थमिति का परिचय। - एम।: इंफ्रा - एम, 2001 - 402 पी।

2.एस.ए. बोरोडिच। अर्थमिति। मिन्स्क एलएलसी "नया ज्ञान" 2001।

3. आर.यू. राखमेतोवा अर्थमिति में एक लघु पाठ्यक्रम। ट्यूटोरियल। अल्माटी। 2004. -78s।

4. आई.आई. एलिसेवा, अर्थमिति। - एम।: "वित्त और सांख्यिकी", 2002

5. मासिक सूचना और विश्लेषणात्मक पत्रिका।

गैर-रेखीय आर्थिक मॉडल। गैर-रैखिक प्रतिगमन मॉडल। चर का रूपांतरण।

गैर-रेखीय आर्थिक मॉडल।

चर का रूपांतरण।

लोच गुणांक।

यदि आर्थिक घटनाओं के बीच गैर-रैखिक संबंध हैं, तो उन्हें संबंधित गैर-रैखिक कार्यों का उपयोग करके व्यक्त किया जाता है: उदाहरण के लिए, एक समबाहु अतिपरवलय , दूसरी डिग्री के परवलय और आदि।

गैर-रेखीय प्रतिगमन के दो वर्ग हैं:

1. विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रेखीय प्रतिगमन, लेकिन अनुमानित मापदंडों के संबंध में रैखिक, उदाहरण के लिए:

विभिन्न अंशों के बहुपद - , ;

समबाहु अतिपरवलय -;

अर्ध-लघुगणक कार्य -।

2. अनुमानों में गैर-रैखिक होने वाले प्रतिगमन, उदाहरण के लिए:

शक्ति -;

सांकेतिक -;

घातीय -।

प्रभावी गुण के व्यक्तिगत मूल्यों के विचलन के वर्गों का कुल योग परऔसत से कई कारणों के प्रभाव के कारण है। आइए सशर्त रूप से कारणों के पूरे सेट को दो समूहों में विभाजित करें: अध्ययन कारक xतथा अन्य कारक।

यदि कारक परिणाम को प्रभावित नहीं करता है, तो ग्राफ पर प्रतिगमन रेखा अक्ष के समानांतर होती है ओहतथा

तब प्रभावी गुण का संपूर्ण विचरण अन्य कारकों के प्रभाव के कारण होता है और विचलन के वर्गों का कुल योग अवशिष्ट के साथ मेल खाएगा। यदि अन्य कारक परिणाम को प्रभावित नहीं करते हैं, तो तुम बंधे होसाथ एक्सकार्यात्मक रूप से और वर्गों का अवशिष्ट योग शून्य है। इस मामले में, प्रतिगमन द्वारा समझाए गए विचलन के वर्गों का योग वर्गों के कुल योग के समान है।

चूंकि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, इसलिए उनका प्रकीर्णन हमेशा कारक के प्रभाव के कारण होता है एक्स, यानी, प्रतिगमन परपर एक्स,और अन्य कारण (अस्पष्टीकृत भिन्नता)। पूर्वानुमान के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि विशेषता की कुल भिन्नता कितनी है परव्याख्या की गई भिन्नता पर पड़ता है

जाहिर है, अगर प्रतिगमन के कारण विचलन के वर्गों का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और कारक एक्सपरिणाम पर महत्वपूर्ण प्रभाव पड़ता है पर।

, वह है, सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या n की इकाइयों की संख्या और इससे निर्धारित स्थिरांक की संख्या के साथ जुड़ी हुई है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पी

समग्र रूप से समाश्रयण समीकरण के महत्व का अनुमान किसकी सहायता से दिया जाता है? एफ-फिशर की कसौटी। उसी समय, एक शून्य परिकल्पना सामने रखी जाती है कि प्रतिगमन गुणांक शून्य है, अर्थात। बी = 0, और इसलिए कारक एक्सपरिणाम को प्रभावित नहीं करता पर।

एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है। इसमें केंद्रीय स्थान चर के विचलन के वर्गों के कुल योग के अपघटन द्वारा कब्जा कर लिया गया है परऔसत से परदो भागों में - "समझा गया" और "अस्पष्टीकृत":

- विचलन के वर्गों का कुल योग;

- प्रतिगमन द्वारा समझाया गया विचलन के वर्गों का योग;

- विचलन के वर्गों का अवशिष्ट योग।

विचलन के वर्गों का कोई भी योग स्वतंत्रता की डिग्री की संख्या से संबंधित है , वह है, सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या में इकाइयों की संख्या से संबंधित है एनऔर इससे निर्धारित स्थिरांक की संख्या के साथ। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पीदिए गए वर्गों का योग बनाने के लिए संभव है।

स्वतंत्रता की प्रति डिग्री फैलावडी.

एफ-अनुपात (एफ-मानदंड):

यदि शून्य परिकल्पना सत्य है, तो भाज्य और अवशिष्ट प्रसरण एक दूसरे से भिन्न नहीं होते हैं। 0 के लिए, एक खंडन आवश्यक है ताकि भाज्य विचरण अवशिष्ट से कई गुना अधिक हो। ब्रिटिश सांख्यिकीविद् स्नेडेकोर ने महत्वपूर्ण मूल्यों की तालिका विकसित की एफ-अशक्त परिकल्पना और स्वतंत्रता के विभिन्न स्तरों के महत्व के विभिन्न स्तरों पर संबंध। तालिका मूल्य एफ-मानदंड, भिन्नताओं के अनुपात का अधिकतम मूल्य है जो एक शून्य परिकल्पना की उपस्थिति की संभावना के दिए गए स्तर के लिए उनकी यादृच्छिक विसंगति के मामले में हो सकता है। परिकलित मूल्य एफ-संबंध को विश्वसनीय माना जाता है यदि यह सारणीबद्ध से अधिक हो।

इस मामले में, संकेतों के बीच संबंध की अनुपस्थिति की शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है: एफ तथ्य> एफ टैबएच 0 खारिज कर दिया है।

यदि मान तालिका से कम है एफ तथ्य , एफ टैब, तो शून्य परिकल्पना की संभावना किसी दिए गए स्तर से अधिक है और कनेक्शन की उपस्थिति के बारे में गलत निष्कर्ष निकालने के गंभीर जोखिम के बिना इसे अस्वीकार नहीं किया जा सकता है। इस मामले में, प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वहीन माना जाता है। लेकिन यह विचलित नहीं होता है।

प्रतिगमन गुणांक मानक त्रुटि

प्रतिगमन गुणांक के महत्व का आकलन करने के लिए, इसके मूल्य की तुलना इसकी मानक त्रुटि से की जाती है, अर्थात वास्तविक मूल्य निर्धारित किया जाता है टी-छात्र की कसौटी: जो तब महत्व के एक निश्चित स्तर पर तालिका मूल्य और स्वतंत्रता की डिग्री की संख्या के साथ तुलना की जाती है ( एन- 2).

पैरामीटर मानक त्रुटि ए:

त्रुटि के परिमाण के आधार पर रैखिक सहसंबंध गुणांक के महत्व की जाँच की जाती है सहसंबंध गुणांक टी आर:

एक विशेषता का कुल विचरण एक्स:

एकाधिक रेखीय प्रतिगमन

मॉडल का निर्माण

बहु - प्रतिगमनदो या दो से अधिक कारकों के साथ एक प्रभावी गुण का प्रतिगमन है, अर्थात, प्रपत्र का एक मॉडल

यदि शोध वस्तु को प्रभावित करने वाले अन्य कारकों के प्रभाव की उपेक्षा की जा सकती है, तो प्रतिगमन मॉडलिंग में एक अच्छा परिणाम दे सकता है। व्यक्तिगत आर्थिक चर के व्यवहार को नियंत्रित नहीं किया जा सकता है, अर्थात एक जांच किए गए कारक के प्रभाव का आकलन करने के लिए अन्य सभी स्थितियों की समानता सुनिश्चित करना संभव नहीं है। इस मामले में, किसी को अन्य कारकों के प्रभाव को मॉडल में पेश करके पहचानने की कोशिश करनी चाहिए, यानी, एक बहु प्रतिगमन समीकरण का निर्माण करना चाहिए: वाई = ए + बी 1 एक्स 1 + बी 2 +… + बी पी एक्स पी + .

एकाधिक प्रतिगमन का मुख्य लक्ष्य बड़ी संख्या में कारकों के साथ एक मॉडल का निर्माण करना है, जबकि उनमें से प्रत्येक के प्रभाव को अलग-अलग निर्धारित करना है, साथ ही साथ मॉडलिंग संकेतक पर उनका संचयी प्रभाव भी है। मॉडल विनिर्देश में मुद्दों के दो क्षेत्र शामिल हैं: कारकों का चयन और प्रतिगमन समीकरण के प्रकार का चयन

यह भी पढ़ें

"खनिज पानी की संरचना का अध्ययन"

एक्सेल में कम से कम वर्ग विधि

एस्बेस्टस-सीमेंट उत्पादों का सार एस्बेस्टस-सीमेंट उत्पादों के उत्पादन के लिए कार्यशाला की योजना

प्रायश्चित संस्थाओं में एक सामाजिक कार्यकर्ता के कार्य I