रैखिक कम से कम वर्ग सन्निकटन। एक्सेल में कम से कम वर्ग विधि
3.
विधि का उपयोग करके फ़ंक्शन सन्निकटन
कम से कम वर्गों
के लिए प्रयोगात्मक परिणामों को संसाधित करते समय कम से कम वर्ग विधि का उपयोग किया जाता है अनुमान(सन्निकटन) प्रयोगात्मक डेटाविश्लेषणात्मक सूत्र। सूत्र का विशिष्ट रूप, एक नियम के रूप में, भौतिक विचारों से चुना जाता है। ऐसे सूत्र हो सकते हैं:
अन्य।
न्यूनतम वर्ग विधि का सार इस प्रकार है। माप परिणामों को तालिका में प्रस्तुत करने दें:
टेबल 4
एक्स एन
Y n
(3.1)
जहां च - ज्ञात समारोह,ए 0, ए 1, ..., ए एम - अज्ञात स्थिर पैरामीटर, जिनमें से मान मिलना चाहिए। न्यूनतम वर्ग विधि में, प्रायोगिक निर्भरता के लिए फलन (3.1) का सन्निकटन सबसे अच्छा माना जाता है यदि स्थिति
(3.2)
अर्थात् रकमएप्रयोगात्मक निर्भरता से आवश्यक विश्लेषणात्मक कार्य के विचलन के वर्ग न्यूनतम होना चाहिए.
ध्यान दें कि फ़ंक्शनक्यू बुलाया विसंगति।
शेष के बाद से
तो उसके पास न्यूनतम है। कई चरों के न्यूनतम फ़ंक्शन के लिए एक आवश्यक शर्त पैरामीटर के संबंध में इस फ़ंक्शन के सभी आंशिक डेरिवेटिव के शून्य की समानता है। इस प्रकार, सन्निकटन फ़ंक्शन (3.1) के मापदंडों के सर्वोत्तम मूल्यों की खोज करना, अर्थात्, ऐसे मान जिनके लिएक्यू = क्यू (ए 0, ए 1, ..., ए एम ) न्यूनतम है, समीकरणों की प्रणाली को हल करने के लिए कम किया गया है:
(3.3)
कम से कम वर्गों की विधि को निम्नलिखित ज्यामितीय व्याख्या दी जा सकती है: किसी दिए गए प्रकार की रेखाओं के अनंत परिवार के बीच, एक रेखा पाई जाती है जिसके लिए प्रयोगात्मक बिंदुओं के निर्देशांक और संबंधित निर्देशांक के बीच अंतर के वर्गों का योग होता है इस रेखा के समीकरण से ज्ञात बिंदु सबसे छोटे होंगे।
एक रैखिक फ़ंक्शन के पैरामीटर ढूँढना
प्रयोगात्मक डेटा को एक रेखीय फलन द्वारा निरूपित करने दें:
ऐसे मूल्यों का चयन करना आवश्यक हैए और बी जिसके लिए समारोह
(3.4)
न्यूनतम होगा। न्यूनतम फ़ंक्शन (3.4) के लिए आवश्यक शर्तें समीकरणों की प्रणाली में कम हो जाती हैं:
परिवर्तनों के बाद, हम दो अज्ञात के साथ दो रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:
(3.5)
जिसे हल करते हुए, हम मापदंडों के आवश्यक मान पाते हैंए और बी
द्विघात फलन के पैरामीटर ढूँढना
यदि सन्निकटन फलन द्विघात निर्भरता है
तो इसके पैरामीटर ए, बी, सी न्यूनतम समारोह के लिए शर्त से पाए जाते हैं:
(3.6)
न्यूनतम फ़ंक्शन (3.6) के लिए शर्तें समीकरणों की प्रणाली में कम हो जाती हैं:
परिवर्तनों के बाद, हम तीन अज्ञात के साथ तीन रैखिक समीकरणों की एक प्रणाली प्राप्त करते हैं:
(3.7)
पर जिसका समाधान हम मापदंडों के आवश्यक मान पाते हैंए, बी और सी।
उदाहरण... मान लें कि प्रयोग का परिणाम निम्न तालिका में हैएक्स और वाई:
टेबल 5
यी
0,705
0,495
0,426
0,357
0,368
0,406
0,549
0,768
प्रयोगात्मक डेटा को रैखिक और द्विघात कार्यों के साथ अनुमानित करना आवश्यक है।
समाधान।सन्निकटन फलनों के प्राचलों का पता लगाना रैखिक समीकरणों (3.5) और (3.7) की प्रणालियों को हल करने तक सीमित है। समस्या को हल करने के लिए, हम एक स्प्रेडशीट प्रोसेसर का उपयोग करेंगेएक्सेल।
1. सबसे पहले, आइए शीट 1 और 2 को लिंक करें। आइए प्रयोगात्मक मान दर्ज करेंएक्स मैं और यीकॉलम में ए और बी, दूसरी पंक्ति से शुरू (पहली पंक्ति में हम कॉलम हेडिंग रखेंगे)। फिर हम इन स्तंभों के योगों की गणना करते हैं और उन्हें दसवीं पंक्ति में रखते हैं।
कॉलम सी - जी गणना और योग क्रमशः रखें
2. चलो शीट को अलग करते हैं। शीट 1 पर रैखिक निर्भरता के लिए और शीट 2 पर द्विघात निर्भरता के लिए आगे की गणना उसी तरह की जाएगी।
3. परिणामी तालिका के तहत, गुणांक का एक मैट्रिक्स और मुक्त सदस्यों का एक कॉलम वेक्टर बनाएं। आइए निम्नलिखित एल्गोरिथम के अनुसार रैखिक समीकरणों की प्रणाली को हल करें:
व्युत्क्रम मैट्रिक्स और मैट्रिक्स गुणन की गणना करने के लिए, हम उपयोग करते हैं गुरु द्वाराकार्योंऔर कार्य भीड़तथा मोमनोझी.
4. कोशिकाओं के एक ब्लॉक में H2:एच 9 प्राप्त गुणांक के आधार पर, हम गणना करते हैं सन्निकटन का मूल्यबहुपदयीकटौती।, ब्लॉक I 2: I 9 में - विचलन डी वाई आई =
यीऍक्स्प. -
यीकटौती।, कॉलम जे - अवशिष्ट:
परिणामी टेबल और इसके साथ बनाया गया चार्ट विजार्ड्सचित्र 6, 7, 8 में रेखांकन दिखाए गए हैं।
चावल। 6. एक रैखिक फलन के गुणांकों की गणना के लिए तालिका,
अनुमान करने वालेप्रयोगात्मक डेटा।
चावल। 7. द्विघात फलन के गुणांकों की गणना के लिए तालिका,
अनुमान करने वालेप्रयोगात्मक डेटा।
चावल। 8. सन्निकटन परिणामों की चित्रमय प्रस्तुति
रैखिक और द्विघात कार्यों द्वारा प्रयोगात्मक डेटा।
उत्तर।प्रायोगिक डेटा को रैखिक निर्भरता द्वारा अनुमानित किया गया था आप = 0,07881
एक्स + 0,442262
अवशिष्ट के साथ क्यू = 0,165167
और द्विघात निर्भरता आप = 3,115476
एक्स 2
– 5,2175
एक्स+
2,529631
अवशिष्ट के साथ क्यू= 0,002103
.
कार्य।एक सारणीबद्ध, रैखिक और द्विघात फलन द्वारा दिए गए फलन का अनुमान लगाइए।
तालिका 6
№0
एक्स
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0,8
आप
3,030
3,142
3,358
3,463
3,772
3,251
3,170
3,665
№
1
3,314
3,278
3,262
3,292
3,332
3,397
3,487
3,563
№
2
1,045
1,162
1,264
1,172
1,070
0,898
0,656
0,344
№
3
6,715
6,735
6,750
6,741
6,645
6,639
6,647
6,612
№
4
2,325
2,515
2,638
2,700
2,696
2,626
2,491
2,291
№
5
1.752
1,762
1,777
1,797
1,821
1,850
1,884
1,944
№
6
1,924
1,710
1,525
1,370
1,264
1,190
1,148
1,127
№
7
1,025
1,144
1,336
1,419
1,479
1,530
1,568
1,248
№
8
5,785
5,685
5,605
5,545
5,505
5,480
5,495
5,510
№
9
4,052
4,092
4,152
4,234
4,338
4,468
4,599
पाठ्यक्रम कार्य
अनुशासन द्वारा: सूचना विज्ञान
विषय: कम से कम वर्ग समारोह सन्निकटन
परिचय
1. समस्या का विवरण
2. गणना सूत्र
Microsoft Excel का उपयोग करके बनाई गई तालिकाओं का उपयोग करके गणना
एल्गोरिथम आरेख
MathCad कार्यक्रम में गणना
रैखिक फ़ंक्शन का उपयोग करके प्राप्त परिणाम
रेखांकन के रूप में परिणामों की प्रस्तुति
परिचय
कोर्स वर्क का उद्देश्य कंप्यूटर विज्ञान के ज्ञान को गहरा करना, माइक्रोसॉफ्ट एक्सेल स्प्रेडशीट प्रोसेसर और मैथकैड सॉफ्टवेयर उत्पाद के साथ काम करने के कौशल को विकसित और समेकित करना और अनुसंधान से संबंधित विषय क्षेत्र से कंप्यूटर का उपयोग करके समस्याओं को हल करने के लिए उनका उपयोग करना है।
सन्निकटन (लैटिन "अनुमानित" - "दृष्टिकोण" से) - किसी भी गणितीय वस्तुओं की अनुमानित अभिव्यक्ति (उदाहरण के लिए, संख्याएं या कार्य) अन्य सरल, उपयोग करने के लिए अधिक सुविधाजनक, या बस बेहतर ज्ञात के माध्यम से। वैज्ञानिक अनुसंधान में, सन्निकटन का उपयोग अनुभवजन्य परिणामों का वर्णन, विश्लेषण, सामान्यीकरण और आगे उपयोग करने के लिए किया जाता है।
जैसा कि आप जानते हैं, मात्राओं के बीच एक सटीक (कार्यात्मक) संबंध हो सकता है, जब तर्क का एक मान एक विशिष्ट मान से मेल खाता है, और एक कम सटीक (सहसंबंध) संबंध, जब तर्क का एक विशिष्ट मान अनुमानित मूल्य से मेल खाता है या किसी फ़ंक्शन के मानों का एक सेट जो कमोबेश एक-दूसरे के करीब होता है। वैज्ञानिक अनुसंधान करते समय, अवलोकन या प्रयोग के परिणामों को संसाधित करते समय, आमतौर पर दूसरे विकल्प से निपटना पड़ता है।
विभिन्न संकेतकों की मात्रात्मक निर्भरता का अध्ययन करते समय, जिनमें से मूल्यों को अनुभवजन्य रूप से निर्धारित किया जाता है, एक नियम के रूप में, कुछ परिवर्तनशीलता होती है। आंशिक रूप से यह निर्जीव और विशेष रूप से, जीवित प्रकृति की अध्ययन की गई वस्तुओं की विविधता से निर्धारित होता है, आंशिक रूप से - यह अवलोकन त्रुटि और सामग्री की मात्रात्मक प्रसंस्करण के कारण होता है। अंतिम घटक को पूरी तरह से बाहर करना हमेशा संभव नहीं होता है, इसे केवल पर्याप्त शोध पद्धति और कार्य की सटीकता के सावधानीपूर्वक चयन से ही कम किया जा सकता है। इसलिए, किसी भी शोध कार्य को करते समय, अध्ययन किए गए संकेतकों की निर्भरता की वास्तविक प्रकृति की पहचान करने में समस्या उत्पन्न होती है, इस या उस डिग्री को परिवर्तनशीलता के लिए बेहिसाब द्वारा मुखौटा किया जाता है: मान। इसके लिए, एक सन्निकटन का उपयोग किया जाता है - कार्यात्मक निर्भरता के एक उपयुक्त समीकरण द्वारा चर के सहसंबंध निर्भरता का एक अनुमानित विवरण, जो निर्भरता (या इसकी "प्रवृत्ति") की मुख्य प्रवृत्ति को बताता है।
सन्निकटन चुनते समय, किसी को एक विशिष्ट शोध समस्या से आगे बढ़ना चाहिए। आमतौर पर, सन्निकटन के लिए समीकरण का उपयोग जितना सरल होता है, निर्भरता का विवरण उतना ही अधिक अनुमानित होगा। इसलिए, यह पढ़ना महत्वपूर्ण है कि परिणामी प्रवृत्ति से विशिष्ट मूल्यों के विचलन कितने महत्वपूर्ण और क्या कारण हैं। अनुभवजन्य रूप से निर्धारित मूल्यों की निर्भरता का वर्णन करते समय, कुछ अधिक जटिल, बहु-पैरामीट्रिक समीकरण का उपयोग करके बहुत अधिक सटीकता प्राप्त करना संभव है। हालांकि, अनुभवजन्य डेटा की विशिष्ट श्रृंखला में मूल्यों के यादृच्छिक विचलन को व्यक्त करने के लिए अधिकतम सटीकता के साथ प्रयास करने का कोई मतलब नहीं है। सामान्य पैटर्न को समझना बहुत अधिक महत्वपूर्ण है, जो इस मामले में सबसे तार्किक और स्वीकार्य सटीकता के साथ शक्ति फ़ंक्शन के दो-पैरामीटर समीकरण द्वारा सटीक रूप से व्यक्त किया गया है। इस प्रकार, एक सन्निकटन विधि का चयन करते हुए, शोधकर्ता हमेशा एक समझौता करता है: यह तय करता है कि इस मामले में यह किस हद तक "बलिदान" करने के लिए समीचीन और उपयुक्त है और तदनुसार, तुलना किए गए चर की निर्भरता को कितना सामान्य रूप से व्यक्त किया जाना चाहिए। सामान्य पैटर्न से अनुभवजन्य डेटा के यादृच्छिक विचलन द्वारा नकाबपोश पैटर्न की पहचान के साथ, सन्निकटन कई अन्य महत्वपूर्ण समस्याओं को हल करने की भी अनुमति देता है: पाया निर्भरता को औपचारिक बनाना; आश्रित चर के अज्ञात मूल्यों को प्रक्षेप द्वारा या, यदि लागू हो, एक्सट्रपलेशन द्वारा खोजें।
प्रत्येक कार्य में, समस्या की स्थिति, प्रारंभिक डेटा, परिणाम जारी करने का रूप तैयार किया जाता है, समस्या को हल करने के लिए मुख्य गणितीय निर्भरताएं इंगित की जाती हैं। समस्या को हल करने की विधि के अनुसार, एक समाधान एल्गोरिथ्म विकसित किया जाता है, जिसे चित्रमय रूप में प्रस्तुत किया जाता है।
1. समस्या का विवरण
1. कम से कम वर्ग विधि का उपयोग करते हुए, तालिका में दिया गया फलन अनुमानित है:
ए) पहली डिग्री का बहुपद ;
बी) दूसरी डिग्री का बहुपद;
ग) घातीय निर्भरता।
प्रत्येक निर्भरता के लिए नियतत्ववाद के गुणांक की गणना करें।
सहसंबंध गुणांक की गणना करें (केवल मामले में)।
प्रत्येक निर्भरता के लिए एक प्रवृत्ति रेखा बनाएं।
LINEST फ़ंक्शन का उपयोग करते हुए, निर्भरता की संख्यात्मक विशेषताओं की गणना करें।
LINEST का उपयोग करके प्राप्त परिणामों के साथ अपनी गणनाओं की तुलना करें।
निष्कर्ष निकालें कि प्राप्त सूत्रों में से कौन सा फ़ंक्शन फ़ंक्शन का सबसे अच्छा अनुमान लगाता है।
प्रोग्रामिंग भाषाओं में से एक में एक प्रोग्राम लिखें और ऊपर प्राप्त परिणामों के साथ गिनती के परिणामों की तुलना करें।
विकल्प 3. फ़ंक्शन तालिका में दिया गया है। एक।
तालिका नंबर एक।
2. गणना सूत्र
अक्सर, अनुभवजन्य डेटा का विश्लेषण करते समय, x और y के मूल्यों के बीच एक कार्यात्मक संबंध खोजना आवश्यक हो जाता है, जो अनुभव या माप के परिणामस्वरूप प्राप्त होता है।
Xi (स्वतंत्र मूल्य) प्रयोगकर्ता द्वारा दिया जाता है, और यी, जिसे अनुभवजन्य या प्रयोगात्मक मूल्य कहा जाता है, अनुभव के परिणामस्वरूप प्राप्त होता है।
एक्स और वाई के मूल्यों के बीच मौजूद कार्यात्मक निर्भरता का विश्लेषणात्मक रूप आमतौर पर अज्ञात है, इसलिए, एक व्यावहारिक रूप से महत्वपूर्ण कार्य उत्पन्न होता है - एक अनुभवजन्य सूत्र खोजने के लिए
, (1)
(जहां पैरामीटर हैं), जिनमें से मान, यदि संभव हो तो, प्रयोगात्मक मूल्यों से बहुत कम भिन्न होंगे।
कम से कम वर्ग विधि के अनुसार, सर्वोत्तम गुणांक वे होते हैं जिनके लिए दिए गए फ़ंक्शन के मूल्यों से पाए गए अनुभवजन्य कार्य के विचलन के वर्गों का योग न्यूनतम होता है।
कई चर के एक फ़ंक्शन के चरम के लिए आवश्यक शर्त का उपयोग करना - आंशिक डेरिवेटिव की शून्य से समानता, गुणांक का एक सेट ढूंढें जो सूत्र (2) द्वारा परिभाषित न्यूनतम फ़ंक्शन प्रदान करता है और गुणांक निर्धारित करने के लिए एक सामान्य प्रणाली प्राप्त करता है :
(3)
इस प्रकार, गुणांकों को खोजना प्रणाली (3) को हल करने के लिए कम हो गया है।
प्रणाली का प्रकार (3) इस बात पर निर्भर करता है कि हम किस वर्ग के अनुभवजन्य सूत्रों को निर्भरता (1) के लिए देख रहे हैं। एक रैखिक निर्भरता के मामले में, सिस्टम (3) रूप लेता है:
(4)
द्विघात निर्भरता के मामले में, प्रणाली (3) रूप लेती है:
(5)
कुछ मामलों में, एक अनुभवजन्य सूत्र के रूप में, एक फ़ंक्शन लिया जाता है जिसमें अपरिभाषित गुणांक अरेखीय रूप से प्रवेश करते हैं। इस मामले में, कभी-कभी समस्या को रैखिक किया जा सकता है, अर्थात। रैखिक को कम करें। इन निर्भरताओं में घातीय निर्भरता शामिल है
जहां a1 और a2 अपरिभाषित गुणांक हैं।
समानता (6) का लघुगणक लेकर रैखिककरण प्राप्त किया जाता है, जिसके बाद हम संबंध प्राप्त करते हैं
(7)
आइए हम निरूपित करें और, क्रमशः, द्वारा और, फिर निर्भरता (6) को फॉर्म में लिखा जा सकता है, जिससे ए 1 के प्रतिस्थापन के साथ सूत्र (4) को लागू करना संभव हो जाता है।
माप परिणामों (xi, yi), i = 1,2,…, n के अनुसार बहाल कार्यात्मक निर्भरता y (x) के ग्राफ को प्रतिगमन वक्र कहा जाता है। प्रयोगात्मक परिणामों के साथ निर्मित प्रतिगमन वक्र के समझौते की जांच करने के लिए, निम्नलिखित संख्यात्मक विशेषताओं को आम तौर पर पेश किया जाता है: सहसंबंध गुणांक (रैखिक निर्भरता), सहसंबंध अनुपात, और नियतत्ववाद गुणांक।
सहसंबंध गुणांक आश्रित यादृच्छिक चर के बीच रैखिक संबंध का एक उपाय है: यह दर्शाता है कि औसतन, एक चर को दूसरे के रैखिक कार्य के रूप में कितनी अच्छी तरह से दर्शाया जा सकता है।
सहसंबंध गुणांक की गणना सूत्र का उपयोग करके की जाती है:
(8)
(9)
जहाँ क्रमशः x, y का समांतर माध्य है।
निरपेक्ष मान में यादृच्छिक चर के बीच सहसंबंध गुणांक 1 से अधिक नहीं होता है। 1 के करीब, x और y के बीच रैखिक संबंध जितना करीब होगा।
एक अरेखीय सहसंबंध के मामले में, सशर्त माध्य मान वक्र रेखा के पास स्थित होते हैं। इस मामले में, सहसंबंध अनुपात का उपयोग बंधन शक्ति की विशेषता के रूप में करने की सिफारिश की जाती है, जिसकी व्याख्या अध्ययन की गई निर्भरता के प्रकार पर निर्भर नहीं करती है।
सहसंबंध अनुपात की गणना सूत्र द्वारा की जाती है:
(10)
कहाँ पे और अंश बिना शर्त औसत के आसपास सशर्त औसत के फैलाव की विशेषता है।
हमेशा से रहा है। समानता = यादृच्छिक असंबद्ध मूल्यों से मेल खाती है; = अगर और केवल अगर x और y के बीच एक सटीक कार्यात्मक संबंध है। x पर y की रैखिक निर्भरता के मामले में, सहसंबंध अनुपात सहसंबंध गुणांक के वर्ग के साथ मेल खाता है। मान का उपयोग रैखिकता से प्रतिगमन के विचलन के संकेतक के रूप में किया जाता है।
सहसंबंध अनुपात किसी भी रूप में ycx के बीच सहसंबंध का एक उपाय है, लेकिन यह एक विशेष रूप में अनुभवजन्य डेटा की निकटता की डिग्री का विचार नहीं दे सकता है। यह पता लगाने के लिए कि प्लॉट किया गया 5 वां वक्र अनुभवजन्य डेटा को कितनी सटीक रूप से दर्शाता है, एक और विशेषता पेश की जाती है - नियतत्ववाद का गुणांक।
नियतत्ववाद का गुणांक सूत्र द्वारा निर्धारित किया जाता है:
जहां Sres = वर्गों का अवशिष्ट योग है, जो सैद्धांतिक डेटा से प्रयोगात्मक डेटा के विचलन को दर्शाता है; पूर्ण वर्गों का कुल योग है, जहां औसत मान yi है।
- वर्गों का प्रतिगमन योग, जो डेटा के बिखराव की विशेषता है।
वर्गों के कुल योग की तुलना में वर्गों का अवशिष्ट योग जितना छोटा होगा, नियतत्ववाद r2 का गुणांक उतना ही अधिक होगा, जो दर्शाता है कि प्रतिगमन विश्लेषण का उपयोग करके प्राप्त समीकरण कितनी अच्छी तरह चर के बीच संबंध की व्याख्या करता है। यदि यह 1 के बराबर है, तो मॉडल के साथ पूर्ण सहसंबंध होता है, अर्थात। वास्तविक और अनुमानित y-मानों में कोई अंतर नहीं है। अन्यथा, यदि नियतत्ववाद का गुणांक 0 है, तो प्रतिगमन समीकरण y मानों की भविष्यवाणी करने में विफल रहता है।
नियतत्ववाद का गुणांक हमेशा सहसंबंध अनुपात से अधिक नहीं होता है। मामले में जब समानता संतुष्ट होती है, तो हम यह मान सकते हैं कि निर्मित अनुभवजन्य सूत्र सबसे सटीक रूप से अनुभवजन्य डेटा को दर्शाता है।
3. Microsoft Excel का उपयोग करके बनाई गई तालिकाओं का उपयोग करके गणना
गणना करने के लिए, Microsoft Excel स्प्रेडशीट प्रोसेसर के टूल का उपयोग करके डेटा को तालिका 2 के रूप में व्यवस्थित करने की सलाह दी जाती है।
तालिका 2
आइए हम बताते हैं कि तालिका 2 को कैसे संकलित किया जाता है।
चरण 1. कक्ष A1: A25 में, मान xi दर्ज करें।
चरण 2 कोशिकाओं B1: B25 में हम y का मान दर्ज करते हैं।
चरण 3 सेल C1 में, सूत्र = A1 ^ 2 दर्ज करें।
चरण 4। कक्षों C1: C25 में, इस सूत्र की प्रतिलिपि बनाई जाती है।
चरण 5 सेल D1 में, सूत्र = A1 * B1 दर्ज करें।
चरण 6 यह सूत्र कोशिकाओं D1: D25 में कॉपी किया गया है।
चरण 7 सेल F1 में, सूत्र = A1 ^ 4 दर्ज करें।
चरण 8 यह सूत्र कोशिकाओं F1: F25 में कॉपी किया गया है।
चरण 9 सेल G1 में, सूत्र = A1 ^ 2 * B1 दर्ज करें।
चरण 10 यह सूत्र कोशिकाओं G1: G25 में कॉपी किया गया है।
चरण 11 सेल H1 में, सूत्र = LN (B1) दर्ज करें।
चरण 12. कक्षों में H1: H25 इस सूत्र की प्रतिलिपि बनाई गई है।
चरण 14. कक्ष I1: I25 में, इस सूत्र की प्रतिलिपि बनाई गई है।
अगले चरण ऑटोसम एस का उपयोग करके किए जाते हैं।
चरण 15. सेल A26 में, सूत्र = SUM (A1: A25) दर्ज करें।
चरण 16. सेल B26 में, सूत्र = SUM (B1: B25) दर्ज करें।
चरण 17. सेल C26 में, सूत्र = SUM (C1: C25) दर्ज करें।
चरण 18. सेल D26 में, सूत्र = SUM (D1: D25) दर्ज करें।
चरण 19. सेल E26 में, सूत्र = SUM (E1: E25) दर्ज करें।
चरण 20. सेल F26 में, सूत्र = SUM (F1: F25) दर्ज करें।
चरण 21. सेल G26 में, सूत्र = SUM (G1: G25) दर्ज करें।
चरण 22. सेल H26 में, सूत्र = SUM (H1: H25) दर्ज करें।
चरण 23. सेल I26 में, सूत्र = SUM (I1: I25) दर्ज करें।
आइए हम एक रैखिक फ़ंक्शन द्वारा फ़ंक्शन का अनुमान लगाते हैं। गुणांक निर्धारित करने और प्रणाली (4) का उपयोग करने के लिए। सेल A26, B26, C26 और D26 में स्थित तालिका 2 के कुल योग का उपयोग करके, हम सिस्टम (4) को फॉर्म में लिखते हैं
(11)
जिसे हल करने के बाद, हम प्राप्त करते हैं तथा ।
सिस्टम को क्रैमर की विधि द्वारा हल किया गया था। जिसका सार इस प्रकार है। n अज्ञात के साथ n बीजीय रैखिक समीकरणों की एक प्रणाली पर विचार करें:
(12)
सिस्टम का निर्धारक सिस्टम के मैट्रिक्स का निर्धारक है:
(13)
हम सारणिक को निरूपित करते हैं, जो जे-वें कॉलम को कॉलम से बदलकर सिस्टम Δ के सारणिक से प्राप्त होता है
इस प्रकार, रैखिक सन्निकटन का रूप है
सिस्टम (11) को माइक्रोसॉफ्ट एक्सेल टूल्स का उपयोग करके हल किया जाता है। नतीजों को टेबल तीन में दिखाया गया है।
टेबल तीन
उलटा मैट्रिक्स
कक्ष A32 में तालिका 3: B33 में सूत्र (= MOBR (A28: B29)) है।
कक्ष E32: E33 में सूत्र लिखा जाता है (= MULTIPLE (A32: B33), (C28: C29))।
इसके बाद, हम एक द्विघात फलन द्वारा फलन का अनुमान लगाते हैं ... गुणांक a1, a2, और a3 निर्धारित करने के लिए, हम सिस्टम (5) का उपयोग करते हैं। सेल A26, B26, C26, D26, E26, F26, G26 में स्थित तालिका 2 के कुल योग का उपयोग करके, हम सिस्टम (5) को फॉर्म में लिखते हैं
(16)
जिसे हल करने पर हमें a1 = 10.663624 प्राप्त होता है। तथा
इस प्रकार, द्विघात सन्निकटन का रूप है
सिस्टम (16) को माइक्रोसॉफ्ट एक्सेल टूल्स का उपयोग करके हल किया जाता है। परिणामों को तालिका चार में दिखाया जाता है।
तालिका 4
उलटा मैट्रिक्स
तालिका 4 में, कक्ष A41: C43 में, सूत्र लिखा गया है (= MOBR (A36: C38))।
कक्ष F41: F43 में सूत्र (= MULTIPLE (A41: C43), (D36: D38)) होता है।
अब हम एक घातांकीय फलन के साथ फलन का अनुमान लगाते हैं। गुणांक निर्धारित करने के लिए और हम मानों को लघुगणक करते हैं और, कोशिकाओं A26, C26, H26 और I26 में स्थित तालिका 2 के कुल योग का उपयोग करके, हम सिस्टम प्राप्त करते हैं
(18)
हल प्रणाली (18) होने के बाद, हम प्राप्त करते हैं और।
पोटेंशिएशन के बाद हमें मिलता है।
इस प्रकार, घातीय सन्निकटन का रूप है
सिस्टम (18) को माइक्रोसॉफ्ट एक्सेल टूल्स का उपयोग करके हल किया जाता है। परिणाम तालिका 5 में दिखाए गए हैं।
तालिका 5
उलटा मैट्रिक्स
कक्ष A50: B51 में, सूत्र लिखा जाता है (= MOBR (A46: B47))।
कक्ष E49: E50 में, सूत्र लिखा जाता है (= MULTIPLE (A50: B51), (C46: C47))।
सेल E51 में सूत्र = EXP (E49) है।
आइए सूत्रों का उपयोग करके अंकगणितीय माध्य की गणना करें:
Microsoft Excel का उपयोग करते हुए गणना परिणाम तालिका 6 में प्रस्तुत किए गए हैं।
तालिका 6
सेल B54 में सूत्र = A26 / 25 है।
सेल B55 में सूत्र है = B26 / 25
तालिका 7
चरण 1 सेल J1 में, सूत्र दर्ज करें = (A1- $ B $ 54) * (B1- $ B $ 55)।
चरण 2 यह सूत्र कोशिकाओं J2: J25 में कॉपी किया गया है।
चरण 3 सेल K1 में, सूत्र दर्ज करें = (A1- $ B $ 54) ^ 2।
चरण 4 यह सूत्र कोशिकाओं k2: K25 में कॉपी किया गया है।
चरण 5 सेल L1 में, सूत्र दर्ज करें = (B1- $ B $ 55) ^ 2।
चरण 6 यह सूत्र कोशिकाओं L2: L25 में कॉपी किया गया है।
चरण 7 सेल M1 में, सूत्र = ($ E $ 32 + $ E $ 33 * A1-B1) ^ 2 दर्ज करें।
चरण 8 यह सूत्र कोशिकाओं M2: M25 में कॉपी किया गया है।
चरण 9 सेल N1 में, सूत्र दर्ज करें = ($ F $ 41 + $ F $ 42 * A1 + $ F $ 43 * A1 ^ 2-B1) ^ 2।
चरण 10. कक्षों N2: N25 में, यह सूत्र कॉपी किया जाता है।
चरण 11 सेल O1 में, सूत्र = ($ E $ 51 * EXP ($ E $ 50 * A1) -B1) ^ 2 दर्ज करें।
चरण 12 यह सूत्र कक्षों O2: O25 में कॉपी किया गया है।
अब हम सूत्र (8) (केवल रैखिक सन्निकटन के लिए) और सूत्र (10) का उपयोग करके नियतत्ववाद के गुणांक का उपयोग करके सहसंबंध गुणांक की गणना करते हैं। Microsoft Excel का उपयोग करके गणना के परिणाम तालिका 8 में प्रस्तुत किए गए हैं।
तालिका 8
सहसंबंध गुणांक
नियतत्ववाद गुणांक (रैखिक सन्निकटन)
नियतत्ववाद गुणांक (द्विघात सन्निकटन)
नियतत्ववाद गुणांक (घातीय सन्निकटन)
सेल E57 में सूत्र = J26 / (K26 * L26) ^ (1/2) है।
सेल E59 में सूत्र = 1-M26 / L26 है।
सेल E61 में सूत्र = 1-N26 / L26 है।
सेल E63 में सूत्र = 1-O26 / L26 है।
गणना परिणामों के विश्लेषण से पता चलता है कि द्विघात सन्निकटन प्रयोगात्मक डेटा का सबसे अच्छा वर्णन करता है।
एल्गोरिथम आरेख
चावल। 1. गणना कार्यक्रम के लिए एल्गोरिथ्म की योजना।
5. MathCad कार्यक्रम में गणना
रेखीय प्रतिगमन
· रेखा (x, y) - रैखिक प्रतिगमन गुणांक b + ax के दो तत्वों (b, a) का एक वेक्टर;
· एक्स - तर्क के वैध डेटा का वेक्टर;
वाई समान आकार के मान्य डेटा मानों का एक वेक्टर है।
चित्र 2।
बहुपद प्रतिगमन का अर्थ है kth डिग्री के बहुपद द्वारा डेटा (x1, y1) का अनुमान लगाना। k = i के साथ, बहुपद एक सीधी रेखा है, k = 2 के साथ - एक परवलय, k = 3 - एक घन परवलय, आदि के साथ। एक नियम के रूप में, व्यवहार में, k<5.
प्रतिगमन (x, y, k) - बहुपद डेटा प्रतिगमन के निर्माण के लिए गुणांक के वेक्टर;
इंटरप (एस, एक्स, वाई, टी) - बहुपद प्रतिगमन का परिणाम;
एस = वापसी (एक्स, वाई, के);
· एक्स - तर्क के वैध डेटा का वेक्टर, जिसके तत्वों को आरोही क्रम में व्यवस्थित किया गया है;
वाई समान आकार के मान्य डेटा मानों का एक वेक्टर है;
· के - प्रतिगमन बहुपद (सकारात्मक पूर्णांक) की डिग्री;
· टी - प्रतिगमन बहुपद के तर्क का मूल्य।
चित्र तीन
उन लोगों के अलावा, कई और प्रकार के तीन-पैरामीटर प्रतिगमन को मथकैड में बनाया गया है, उनका कार्यान्वयन उपरोक्त प्रतिगमन विकल्पों से कुछ अलग है, जिसमें डेटा सरणी के अलावा, कुछ प्रारंभिक मान सेट करने की आवश्यकता होती है उनके लिए गुणांक ए, बी, सी। उपयुक्त प्रकार के प्रतिगमन का उपयोग करें यदि आपके पास इस बात का अच्छा विचार है कि किस प्रकार की निर्भरता आपके डेटा सेट का वर्णन करती है। जब प्रतिगमन का प्रकार डेटा के अनुक्रम को अच्छी तरह से प्रतिबिंबित नहीं करता है, तो इसका परिणाम अक्सर असंतोषजनक होता है और प्रारंभिक मूल्यों की पसंद के आधार पर बहुत भिन्न भी होता है। प्रत्येक फ़ंक्शन निर्दिष्ट पैरामीटर ए, बी, सी का वेक्टर उत्पन्न करता है।
LINEST . के परिणाम
आइए LINEST फ़ंक्शन के उद्देश्य को देखें।
यह फ़ंक्शन उपलब्ध डेटा के लिए सबसे उपयुक्त सीधी रेखा की गणना करने के लिए कम से कम वर्ग विधि का उपयोग करता है।
फ़ंक्शन एक सरणी देता है जो परिणामी रेखा का वर्णन करता है। एक सीधी रेखा के लिए समीकरण इस प्रकार है:
M1x1 + m2x2 + ... + b या y = mx + b,
सारणीबद्ध माइक्रोसॉफ्ट सॉफ्टवेयर एल्गोरिथ्म
जहां आश्रित y-मान स्वतंत्र x-मान का एक फलन है। m मान प्रत्येक स्वतंत्र चर x के संगत गुणांक हैं, और b एक स्थिरांक है। ध्यान दें कि y, x और m सदिश हो सकते हैं।
परिणाम प्राप्त करने के लिए, आपको एक सारणीबद्ध सूत्र बनाना होगा जो 5 पंक्तियों और 2 स्तंभों पर कब्जा करेगा। यह अंतराल कार्यपत्रक पर कहीं भी स्थित हो सकता है। इस अंतराल पर LINEST फ़ंक्शन आवश्यक है।
परिणामस्वरूप, A65: B69 अंतराल के सभी कक्षों को भरा जाना चाहिए (जैसा कि तालिका 9 में दिखाया गया है)।
तालिका 9.
आइए तालिका 9 में कुछ मूल्यों के उद्देश्य की व्याख्या करें।
कोशिकाओं A65 और B65 में स्थित मान क्रमशः ढलान और बदलाव की विशेषता रखते हैं। - नियतत्ववाद का गुणांक। - एफ - मनाया मूल्य। - स्वतंत्रता की डिग्री की संख्या। - वर्गों का प्रतिगमन योग। - अवशिष्ट योग चौकों की।
रेखांकन के रूप में परिणामों की प्रस्तुति
चावल। 4. रैखिक सन्निकटन का ग्राफ
चावल। 5. द्विघात सन्निकटन का प्लॉट
चावल। 6. घातीय सन्निकटन का ग्राफ
निष्कर्ष
आइए प्राप्त आंकड़ों के परिणामों के आधार पर निष्कर्ष निकालें।
गणना परिणामों के विश्लेषण से पता चलता है कि द्विघात सन्निकटन प्रयोगात्मक डेटा का सबसे अच्छा वर्णन करता है, क्योंकि इसके लिए ट्रेंड लाइन इस क्षेत्र में फ़ंक्शन के व्यवहार को सबसे सटीक रूप से दर्शाती है।
LINEST फ़ंक्शन का उपयोग करके प्राप्त परिणामों की तुलना करते हुए, हम देखते हैं कि वे ऊपर की गई गणनाओं से पूरी तरह मेल खाते हैं। यह इंगित करता है कि गणना सही है।
MathCad प्रोग्राम का उपयोग करके प्राप्त परिणाम पूरी तरह से ऊपर दिए गए मानों से मेल खाते हैं। यह गणना की शुद्धता को इंगित करता है।
ग्रन्थसूची
1 बी.पी. डेमिडोविच, आई.ए. मैरून। कम्प्यूटेशनल गणित की नींव। एम: भौतिक और गणितीय साहित्य का राज्य प्रकाशन गृह।
2 सूचना विज्ञान: पाठ्यपुस्तक संस्करण। प्रो एन.वी. मकारोवा. एम: वित्त और सांख्यिकी, 2007।
3 सूचना विज्ञान: कंप्यूटर पर काम करने की तकनीक पर कार्यशाला, एड। प्रो एन.वी. मकारोवा. एम: वित्त और सांख्यिकी, 2010।
4 वी.बी. कोमागिन। विजुअल बेसिक में एक्सेल प्रोग्रामिंग। एम: रेडियो और संचार, 2007।
कंप्यूटर विज्ञान में पाठ्यक्रम कार्य के कार्यान्वयन के लिए 6 पद्धति संबंधी निर्देश (सभी विशिष्टताओं के पत्राचार छात्रों के लिए), एड। ज़ुरोवा जी.एन., एसपीबीजीजीआई (टीयू), 2011।
मैं एक सॉफ्टवेयर गणितज्ञ हूं। मेरे करियर की सबसे बड़ी छलांग तब थी जब मैंने यह कहना सीखा: "मुझे कुछ भी समझ में नहीं आता!"अब मुझे विज्ञान के प्रकाशक को यह बताने में कोई शर्म नहीं है कि वह मुझे व्याख्यान दे रहा है, मुझे समझ नहीं आ रहा है कि वह मुझे किस बारे में बता रहा था। और ये बहुत मुश्किल है। हां, अपनी अज्ञानता को स्वीकार करना कठिन और शर्मनाक है। कौन यह स्वीकार करना पसंद करता है कि वह किसी चीज की मूल बातें नहीं जानता है। अपने पेशे के कारण, मुझे बड़ी संख्या में प्रस्तुतियों और व्याख्यानों में भाग लेना पड़ता है, जहां, मैं स्वीकार करता हूं, अधिकांश मामलों में मैं सोना चाहता हूं, क्योंकि मुझे कुछ भी समझ में नहीं आता है। लेकिन मुझे समझ में नहीं आता क्योंकि विज्ञान की वर्तमान स्थिति की बड़ी समस्या गणित में है। यह मानता है कि सभी श्रोता गणित के सभी क्षेत्रों से परिचित हैं (जो कि बेतुका है)। यह स्वीकार करना शर्म की बात है कि आप नहीं जानते कि व्युत्पन्न क्या है (कि यह थोड़ी देर बाद है)।
लेकिन मैंने यह कहना सीखा कि मैं नहीं जानता कि गुणन क्या है। हाँ, मैं नहीं जानता कि लाई बीजगणित के ऊपर उप-बीजगणित क्या होता है। हां, मुझे नहीं पता कि जीवन में द्विघात समीकरणों की आवश्यकता क्यों है। वैसे, यदि आप सुनिश्चित हैं कि आप जानते हैं, तो हमारे पास बात करने के लिए कुछ है! गणित चालों की एक श्रृंखला है। गणितज्ञ जनता को भ्रमित करने और डराने की कोशिश करते हैं; जहां कोई भ्रम नहीं है, कोई प्रतिष्ठा नहीं है, कोई अधिकार नहीं है। हां, यथासंभव अमूर्त भाषा में बोलना प्रतिष्ठित है, जो अपने आप में पूर्ण बकवास है।
क्या आप जानते हैं कि व्युत्पन्न क्या है? सबसे अधिक संभावना है कि आप मुझे अंतर अनुपात सीमा के बारे में बताएंगे। सेंट पीटर्सबर्ग स्टेट यूनिवर्सिटी में गणित और यांत्रिकी के पहले वर्ष में, विक्टर पेट्रोविच खविन पहचान कीएक बिंदु पर फ़ंक्शन के टेलर श्रृंखला के पहले पद के गुणांक के रूप में व्युत्पन्न (यह डेरिवेटिव के बिना टेलर श्रृंखला निर्धारित करने के लिए एक अलग जिम्नास्टिक था)। मैं इस परिभाषा पर लंबे समय तक हंसता रहा, जब तक कि मैं अंत में समझ नहीं पाया कि यह किस बारे में है। व्युत्पन्न केवल एक माप से ज्यादा कुछ नहीं है कि हम जिस फ़ंक्शन को अलग कर रहे हैं वह फ़ंक्शन y = x, y = x ^ 2, y = x ^ 3 जैसा दिखता है।
मुझे अब उन छात्रों को व्याख्यान देने का सम्मान मिला है जो डरगणित। अगर आप गणित से डरते हैं, तो हम उसी रास्ते पर हैं। जैसे ही आप कुछ पाठ पढ़ने की कोशिश करते हैं, और आपको लगता है कि यह अत्यधिक जटिल है, तो जान लें कि यह बुरी तरह लिखा गया है। मेरा तर्क है कि गणित का एक भी क्षेत्र ऐसा नहीं है जिसके बारे में सटीकता खोए बिना "उंगलियों पर" बात नहीं की जा सकती है।
निकट भविष्य के लिए कार्य: मैंने अपने छात्रों को यह समझने का निर्देश दिया कि रैखिक-द्विघात नियामक क्या है। संकोच न करें, अपने जीवन के तीन मिनट बिताएं, लिंक का अनुसरण करें। अगर आपको कुछ समझ नहीं आ रहा है, तो हम आपके साथ रास्ते में हैं। मुझे (पेशेवर गणितज्ञ-प्रोग्रामर) भी कुछ समझ नहीं आया। और मैं आपको विश्वास दिलाता हूं कि आप इसे उंगलियों पर समझ सकते हैं। फिलहाल मैं नहीं जानता कि यह क्या है, लेकिन मैं आपको विश्वास दिलाता हूं कि हम इसका पता लगाने में सक्षम होंगे।
इसलिए, पहला व्याख्यान जो मैं अपने छात्रों को पढ़ने जा रहा हूं, जब वे डरावने रूप में मेरे पास आते हैं, तो यह शब्द मेरे पास आते हैं कि एक रैखिक-द्विघात नियामक एक भयानक बायका है जो मेरे जीवन में कभी भी महारत हासिल नहीं करेगा, यह है कम से कम वर्ग विधियां... क्या आप रैखिक समीकरणों को हल कर सकते हैं? यदि आप इस पाठ को पढ़ रहे हैं, तो शायद नहीं।
इसलिए, दो बिंदुओं (x0, y0), (x1, y1), उदाहरण के लिए, (1,1) और (3,2) दिए गए, समस्या इन दो बिंदुओं से गुजरने वाली एक सीधी रेखा के समीकरण को खोजने की है:
चित्रण
इस रेखा में निम्न जैसा समीकरण होना चाहिए:
यहाँ अल्फा और बीटा हमारे लिए अज्ञात हैं, लेकिन हम इस सीधी रेखा के दो बिंदु जानते हैं:
आप इस समीकरण को मैट्रिक्स रूप में लिख सकते हैं:
यहां एक गेय विषयांतर किया जाना चाहिए: मैट्रिक्स क्या है? एक मैट्रिक्स दो-आयामी सरणी से ज्यादा कुछ नहीं है। यह डेटा स्टोर करने का एक तरीका है; आपको इसे और अधिक महत्व नहीं देना चाहिए। यह हम पर निर्भर है कि किसी निश्चित मैट्रिक्स की व्याख्या कैसे की जाए। समय-समय पर मैं इसे एक रैखिक प्रदर्शन के रूप में, समय-समय पर द्विघात रूप के रूप में और कभी-कभी वैक्टर के एक सेट के रूप में व्याख्या करूंगा। यह सब संदर्भ में स्पष्ट किया जाएगा।
आइए विशिष्ट मैट्रिक्स को उनके प्रतीकात्मक प्रतिनिधित्व के साथ बदलें:
तब (अल्फा, बीटा) आसानी से पाया जा सकता है:
अधिक विशेष रूप से हमारे पिछले डेटा के लिए:
जो बिंदुओं (1,1) और (3,2) से गुजरने वाली सीधी रेखा के निम्नलिखित समीकरण की ओर ले जाता है:
ठीक है, यहाँ सब कुछ स्पष्ट है। आइए से गुजरने वाली सीधी रेखा का समीकरण ज्ञात करें तीनअंक: (x0, y0), (x1, y1) और (x2, y2):
ओह-ओह-ओह, लेकिन हमारे पास दो अज्ञात के लिए तीन समीकरण हैं! एक मानक गणितज्ञ कहेगा कि कोई हल नहीं है। प्रोग्रामर क्या कहेगा? शुरुआत के लिए, वह निम्नलिखित रूप में समीकरणों की पिछली प्रणाली को फिर से लिखेंगे:
हमारे मामले में, सदिश i, j, b त्रि-आयामी हैं, इसलिए, (सामान्य स्थिति में) इस प्रणाली का कोई हल नहीं है। कोई भी सदिश (अल्फा \ * i + बीटा \ * j) सदिशों (i, j) द्वारा फैले हुए तल में होता है। यदि b इस तल से संबंधित नहीं है, तो समाधान मौजूद नहीं है (समीकरण में समानता प्राप्त नहीं की जा सकती)। क्या करें? आइए एक समझौता खोजें। आइए द्वारा निरूपित करें ई (अल्फा, बीटा)हम कितनी दूर तक समानता तक नहीं पहुँच पाए हैं:
और हम इस त्रुटि को कम करने का प्रयास करेंगे:
चौकोर क्यों?
हम न केवल न्यूनतम मानदंड की तलाश कर रहे हैं, बल्कि मानदंड के न्यूनतम वर्ग की भी तलाश कर रहे हैं। क्यों? न्यूनतम बिंदु ही मेल खाता है, और वर्ग एक सुचारू कार्य देता है (तर्कों का एक द्विघात कार्य (अल्फा, बीटा)), जबकि केवल लंबाई एक शंकु जैसा कार्य देती है जो न्यूनतम बिंदु पर भिन्न नहीं होती है। भाई वर्ग अधिक सुविधाजनक है।
जाहिर है, त्रुटि कम हो जाती है जब वेक्टर इसदिशों द्वारा फैले हुए समतल के लिए ओर्थोगोनल है मैंतथा जे.
चित्रण
दूसरे शब्दों में: हम एक ऐसी रेखा की तलाश कर रहे हैं, जिसमें सभी बिंदुओं से इस रेखा तक की दूरी की चुकता लंबाई का योग न्यूनतम हो:
अद्यतन: यहाँ मेरे पास एक खिचड़ी भाषा है, सीधी रेखा की दूरी को लंबवत रूप से मापा जाना चाहिए, न कि ऑर्थोगोनल प्रक्षेपण। यह टिप्पणीकार सही है।
चित्रण
काफी अलग तरीके से (ध्यान से, खराब औपचारिक रूप से, लेकिन यह उंगलियों पर स्पष्ट होना चाहिए): हम सभी जोड़ी बिंदुओं के बीच सभी संभावित रेखाएं लेते हैं और सभी के बीच औसत रेखा की तलाश करते हैं:
चित्रण
उंगलियों पर एक और स्पष्टीकरण: हम सभी डेटा बिंदुओं (यहां हमारे पास तीन हैं) और सीधी रेखा जिसे हम ढूंढ रहे हैं, और संतुलन राज्य की सीधी रेखा बिल्कुल वही है जो हम ढूंढ रहे हैं।
न्यूनतम द्विघात रूप
तो, दिए गए वेक्टर होने बीऔर मैट्रिक्स के कॉलम वैक्टर द्वारा फैला हुआ विमान ए(इस मामले में (x0, x1, x2) और (1,1,1)), हम एक वेक्टर की तलाश कर रहे हैं इकम से कम एक वर्ग लंबाई के साथ। जाहिर है, न्यूनतम केवल वेक्टर के लिए प्राप्य है इ, मैट्रिक्स के कॉलम वैक्टर द्वारा फैले विमान के लिए ऑर्थोगोनल ए:
दूसरे शब्दों में, हम एक वेक्टर x = (अल्फा, बीटा) की तलाश कर रहे हैं जैसे:
मैं आपको याद दिला दूं कि यह वेक्टर x = (अल्फा, बीटा) द्विघात फलन का न्यूनतम है || ई (अल्फा, बीटा) || ^ 2:
यहां यह याद रखना उपयोगी होगा कि मैट्रिक्स को द्विघात रूप के रूप में व्याख्या किया जा सकता है, उदाहरण के लिए, यूनिट मैट्रिक्स ((1,0), (0,1)) को फ़ंक्शन x ^ 2 + y ^ 2 के रूप में व्याख्या किया जा सकता है। :
द्विघात रूप
यह सब जिम्नास्टिक रेखीय प्रतिगमन के रूप में जाना जाता है।
डिरिचलेट सीमा की स्थिति के साथ लैपलेस का समीकरण
अब सबसे सरल वास्तविक कार्य: एक निश्चित त्रिकोणीय सतह है, आपको इसे चिकना करने की आवश्यकता है। उदाहरण के लिए, आइए मेरा चेहरा मॉडल लोड करें:
प्रारंभिक प्रतिबद्धता उपलब्ध है। बाहरी निर्भरता को कम करने के लिए, मैंने अपने सॉफ़्टवेयर रेंडरर का कोड लिया, जो पहले से ही हैब्रे पर है। एक रैखिक प्रणाली को हल करने के लिए, मैं ओपनएनएल का उपयोग करता हूं, यह एक उत्कृष्ट सॉल्वर है, जिसे स्थापित करना बहुत मुश्किल है: आपको अपनी परियोजना के साथ दो फाइलों (.h + .c) को फ़ोल्डर में कॉपी करने की आवश्यकता है। सभी एंटी-अलियासिंग निम्नलिखित कोड के साथ किए जाते हैं:
के लिए (इंट डी = 0; डी<3; d++) {
nlNewContext();
nlSolverParameteri(NL_NB_VARIABLES, verts.size());
nlSolverParameteri(NL_LEAST_SQUARES, NL_TRUE);
nlBegin(NL_SYSTEM);
nlBegin(NL_MATRIX);
for (int i=0; i<(int)verts.size(); i++) {
nlBegin(NL_ROW);
nlCoefficient(i, 1);
nlRightHandSide(verts[i][d]);
nlEnd(NL_ROW);
}
for (unsigned int i=0; iऔर चेहरा = चेहरे [i]; के लिए (int j = 0; j<3; j++) {
nlBegin(NL_ROW);
nlCoefficient(face[ j ], 1);
nlCoefficient(face[(j+1)%3], -1);
nlEnd(NL_ROW);
}
}
nlEnd(NL_MATRIX);
nlEnd(NL_SYSTEM);
nlSolve();
for (int i=0; i<(int)verts.size(); i++) {
verts[i][d] = nlGetVariable(i);
}
}
X, Y और Z निर्देशांक वियोज्य हैं, मैं उन्हें अलग से चिकना करता हूं। यही है, मैं रैखिक समीकरणों की तीन प्रणालियों को हल करता हूं, जिनमें से प्रत्येक में मेरे मॉडल में शीर्षों की संख्या के बराबर चर की संख्या होती है। मैट्रिक्स A की पहली n पंक्तियों में प्रति पंक्ति केवल एक इकाई होती है, और वेक्टर b की पहली n पंक्तियों में मूल मॉडल निर्देशांक होते हैं। यही है, मैं नई शीर्ष स्थिति और पुरानी शीर्ष स्थिति के बीच वसंत-टाई करता हूं - नए लोगों को पुराने से बहुत दूर नहीं भटकना चाहिए।
मैट्रिक्स A की सभी बाद की पंक्तियाँ (faces.size () * 3 = ग्रिड में सभी त्रिभुजों के किनारों की संख्या) में एक घटना 1 और एक घटना -1 होती है, और वेक्टर b में शून्य घटक विपरीत होते हैं। इसका मतलब है, मैं अपने त्रिकोणीय जाल के प्रत्येक किनारे पर एक वसंत लटकाता हूं: सभी किनारों को एक ही शीर्ष को प्रारंभिक और समाप्ति बिंदु के रूप में प्राप्त करने का प्रयास करते हैं।
एक बार फिर: सभी कोने चर हैं, और वे अपनी मूल स्थिति से दूर नहीं जा सकते हैं, लेकिन साथ ही वे एक दूसरे के समान बनने की कोशिश करते हैं।
यहाँ परिणाम है:
सब कुछ ठीक हो जाएगा, मॉडल वास्तव में चिकना है, लेकिन यह अपने मूल किनारे से दूर चला गया है। आइए कोड को थोड़ा बदलें:
के लिए (int i = 0; i<(int)verts.size(); i++) {
float scale = border[i] ? 1000: 1;
nlBegin(NL_ROW);
nlCoefficient(i, scale);
nlRightHandSide(scale*verts[i][d]);
nlEnd(NL_ROW);
}
हमारे मैट्रिक्स ए में, किनारे पर स्थित कोने के लिए, मैं v_i = verts [i] [d] बिट से एक पंक्ति नहीं जोड़ता, लेकिन 1000 * v_i = 1000 * verts [i] [d]। यह क्या बदलता है? और यह हमारी वर्ग-कानून त्रुटि को बदल देता है। अब, किनारे पर शीर्ष से एक भी विचलन की लागत पहले की तरह एक इकाई नहीं, बल्कि 1000 * 1000 इकाई होगी। यही है, हमने चरम शिखर पर एक मजबूत वसंत लटका दिया, समाधान दूसरों को और अधिक फैलाना पसंद करता है। यहाँ परिणाम है:
आइए शिखर के बीच के झरनों को दोगुना करें: एनएल गुणांक (चेहरा [जे], 2); nlगुणांक (चेहरा [(j + 1)% 3], -2);
यह तर्कसंगत है कि सतह चिकनी हो गई है:
और अब यह सौ गुना मजबूत है:
यह क्या है? एक तार के छल्ले को साबुन के पानी में डुबाने की कल्पना करें। नतीजतन, गठित साबुन फिल्म सबसे छोटी वक्रता रखने की कोशिश करेगी, जितना संभव हो, सीमा को छूना - हमारी तार की अंगूठी। ठीक यही हमें सीमा तय करने और अंदर की तरफ एक चिकनी सतह की मांग करने से मिला है। बधाई हो, हमने अभी-अभी डिरिचलेट सीमा शर्तों के साथ लाप्लास समीकरण को हल किया है। अच्छा लग रहा है? लेकिन वास्तव में, हल करने के लिए रैखिक समीकरणों की केवल एक प्रणाली।
पॉइसन का समीकरण
आइए याद करते हैं एक और अच्छा नाम।
मान लीजिए मेरे पास इस तरह की एक तस्वीर है:
हर कोई अच्छा है, केवल मुझे कुर्सी पसंद नहीं है।
मैं तस्वीर को आधा काट दूंगा:
और मैं अपने हाथों से कुर्सी को उजागर करूंगा:
फिर मैं तस्वीर के बाईं ओर मुखौटा में सफेद सब कुछ खींचूंगा, और साथ ही पूरे चित्र में मैं कहूंगा कि दो पड़ोसी पिक्सल के बीच का अंतर दाएं के दो पड़ोसी पिक्सल के बीच के अंतर के बराबर होना चाहिए चित्र:
के लिए (int i = 0; i
यहाँ परिणाम है:
वास्तविक जीवन उदाहरण
मैंने जानबूझकर पॉलिश किए हुए परिणाम नहीं किए। मैं आपको केवल यह दिखाना चाहता था कि आप कम से कम वर्ग विधियों को कैसे लागू कर सकते हैं, यह एक ट्यूटोरियल कोड है। अब मैं जीवन से एक उदाहरण देता हूं:
मेरे पास इस तरह के कपड़े के नमूनों की कई तस्वीरें हैं:
मेरा काम इस गुणवत्ता की तस्वीरों से निर्बाध बनावट बनाना है। सबसे पहले, मैं (स्वचालित रूप से) दोहराए जाने वाले पैटर्न की तलाश करता हूं:
अगर मैं इस चतुर्भुज को सीधे काट दूं, तो विरूपण के कारण किनारे नहीं मिलेंगे, यहां चार बार दोहराए गए पैटर्न का एक उदाहरण है:
छिपा हुआ पाठ
यहां एक स्निपेट है जहां सीम स्पष्ट रूप से दिखाई दे रही है:
इसलिए, मैं एक सीधी रेखा के साथ नहीं कटूंगा, यहाँ कट लाइन है:
छिपा हुआ पाठ
और यहाँ एक पैटर्न चार बार दोहराया गया है:
छिपा हुआ पाठ
और इसका एक अंश, इसे स्पष्ट करने के लिए:
इससे भी बेहतर, सभी प्रकार के कर्ल को दरकिनार करते हुए, कट एक सीधी रेखा में नहीं गया, लेकिन फिर भी मूल तस्वीर में असमान प्रकाश व्यवस्था के कारण सीम दिखाई दे रही है। यह वह जगह है जहां पॉसों के समीकरण के लिए कम से कम वर्ग विधि आती है। यहाँ प्रकाश को समतल करने के बाद अंतिम परिणाम दिया गया है:
बनावट पूरी तरह से निर्बाध निकली, और यह एक बहुत ही औसत तस्वीर से स्वचालित थी। गणित से डरो मत, सरल व्याख्याओं की तलाश करो, और आपको इंजीनियरिंग की खुशी होगी।
साधारण कम से कम वर्ग (OLS)- वांछित चर से कुछ कार्यों के विचलन के वर्गों के योग को कम करने के आधार पर विभिन्न समस्याओं को हल करने के लिए उपयोग की जाने वाली गणितीय विधि। इसका उपयोग समीकरणों की अतिनिर्धारित प्रणालियों को "हल" करने के लिए किया जा सकता है (जब समीकरणों की संख्या अज्ञात की संख्या से अधिक हो जाती है), सामान्य (अतिनिर्धारित नहीं) समीकरणों के गैर-रेखीय सिस्टम के मामले में समाधान खोजने के लिए, बिंदु मानों को अनुमानित करने के लिए। किसी समारोह का। OLS नमूना डेटा के आधार पर प्रतिगमन मॉडल के अज्ञात मापदंडों का अनुमान लगाने के लिए बुनियादी प्रतिगमन विश्लेषण विधियों में से एक है।
कॉलेजिएट यूट्यूब
1
/
5
कम से कम वर्ग विधि। विषय
✪ कम से कम वर्ग पाठ 1/2। रैखिक प्रकार्य
अर्थमिति। व्याख्यान 5 कम से कम वर्ग विधि
मिटिन IV - भौतिक के परिणामों का प्रसंस्करण। प्रयोग - कम से कम वर्ग विधि (व्याख्यान 4)
अर्थमिति: कम से कम वर्गों को समझना # 2
उपशीर्षक
कहानी
19वीं सदी की शुरुआत तक। वैज्ञानिकों के पास समीकरणों की एक प्रणाली को हल करने के लिए निश्चित नियम नहीं थे जिसमें अज्ञात की संख्या समीकरणों की संख्या से कम हो; उस समय तक, विशेष विधियों का उपयोग किया जाता था जो समीकरणों के प्रकार और कैलकुलेटर की बुद्धि पर निर्भर करते थे, और इसलिए एक ही अवलोकन डेटा के आधार पर अलग-अलग कैलकुलेटर अलग-अलग निष्कर्ष पर आते थे। गॉस (1795) विधि के पहले अनुप्रयोग के लेखक थे, और लीजेंड्रे (1805) ने स्वतंत्र रूप से इसे आधुनिक नाम (fr। मेथोड डेस मोइन्ड्रेस क्वारेस) लैपलेस ने इस पद्धति को संभाव्यता के सिद्धांत से जोड़ा, और अमेरिकी गणितज्ञ एड्रेन (1808) ने इसके सैद्धांतिक और संभाव्य अनुप्रयोगों पर विचार किया। Encke, Bessel, Hansen और अन्य द्वारा आगे के शोध द्वारा इस पद्धति का प्रसार और सुधार किया गया था।
कम से कम वर्ग विधि का सार
होने देना एक्स (\ डिस्प्लेस्टाइल एक्स)- किट n (\ डिस्प्लेस्टाइल n)अज्ञात चर (पैरामीटर), एफ मैं (एक्स) (\ प्रदर्शन शैली f_ (i) (एक्स)), , एम> एन (\ डिस्प्लेस्टाइल एम> एन)- चर के इस सेट से कार्यों का एक सेट। कार्य ऐसे मूल्यों का चयन करना है एक्स (\ डिस्प्लेस्टाइल एक्स)ताकि इन कार्यों के मूल्य कुछ मूल्यों के जितना करीब हो सके y मैं (\ डिस्प्लेस्टाइल y_ (i))... संक्षेप में, हम समीकरणों की अतिनिर्धारित प्रणाली के "समाधान" के बारे में बात कर रहे हैं f i (x) = y i (\ डिस्प्लेस्टाइल f_ (i) (x) = y_ (i)), i = 1,…, m (\ डिस्प्लेस्टाइल i = 1, \ ldots, m)प्रणाली के बाएँ और दाएँ भागों की अधिकतम निकटता के संकेतित अर्थ में। एलएसएम का सार "निकटता के माप" के रूप में बाएं और दाएं पक्षों के विचलन के वर्गों के योग को चुनना है। | एफ मैं (एक्स) - वाई मैं | (\ डिस्प्लेस्टाइल | f_ (i) (x) -y_ (i) |)... इस प्रकार, ओएलएस का सार निम्नानुसार व्यक्त किया जा सकता है:
यानी 2 = ∑ मैं (yi - fi (x)) 2 → मिनट x (\ प्रदर्शन शैली \ योग _ (i) e_ (i) ^ (2) = \ योग _ (i) (y_ (i) -f_ ( i) (x)) ^ (2) \ दायां तीर \ मिनट _ (x)).
यदि समीकरणों की प्रणाली में एक समाधान है, तो वर्गों का न्यूनतम योग शून्य के बराबर होगा और समीकरणों की प्रणाली के सटीक समाधान विश्लेषणात्मक रूप से या, उदाहरण के लिए, विभिन्न संख्यात्मक अनुकूलन विधियों द्वारा पाए जा सकते हैं। यदि सिस्टम को फिर से परिभाषित किया जाता है, अर्थात, स्वतंत्र रूप से बोलना, स्वतंत्र समीकरणों की संख्या मांगी गई चर की संख्या से अधिक है, तो सिस्टम के पास सटीक समाधान नहीं है और कम से कम वर्ग विधि आपको कुछ "इष्टतम" वेक्टर खोजने की अनुमति देती है एक्स (\ डिस्प्लेस्टाइल एक्स)वैक्टर की अधिकतम निकटता के अर्थ में वाई (\ डिस्प्लेस्टाइल वाई)तथा एफ (एक्स) (\ डिस्प्लेस्टाइल एफ (एक्स))या विचलन के वेक्टर की अधिकतम निकटता ई (\ डिस्प्लेस्टाइल ई)शून्य से (निकटता को यूक्लिडियन दूरी के अर्थ में समझा जाता है)।
उदाहरण - रैखिक समीकरणों की एक प्रणाली
विशेष रूप से, कम से कम वर्ग विधि का उपयोग रैखिक समीकरणों की एक प्रणाली को "हल" करने के लिए किया जा सकता है
ए एक्स = बी (\ डिस्प्लेस्टाइल एक्स = बी),
कहाँ पे ए (\ डिस्प्लेस्टाइल ए)आयताकार आकार मैट्रिक्स एम × एन, एम> एन (\ डिस्प्लेस्टाइल एम \ टाइम्स एन, एम> एन)(अर्थात, मैट्रिक्स ए की पंक्तियों की संख्या मांगी गई चर की संख्या से अधिक है)।
सामान्य स्थिति में, समीकरणों की ऐसी प्रणाली का कोई हल नहीं होता है। इसलिए, इस प्रणाली को केवल ऐसे वेक्टर को चुनने के अर्थ में "हल" किया जा सकता है एक्स (\ डिस्प्लेस्टाइल एक्स)वैक्टर के बीच "दूरी" को कम करने के लिए एक एक्स (\ डिस्प्लेस्टाइल कुल्हाड़ी)तथा बी (\ डिस्प्लेस्टाइल बी)... ऐसा करने के लिए, आप सिस्टम के समीकरणों के बाएँ और दाएँ पक्षों के बीच अंतर के वर्गों के योग को कम करने के लिए मानदंड लागू कर सकते हैं, अर्थात, (ए एक्स - बी) टी (ए एक्स - बी) → मिनट एक्स (\ डिस्प्लेस्टाइल (एक्स-बी) ^ (टी) (एक्स-बी) \ राइटएरो \ मिनट _ (एक्स))... यह दिखाना आसान है कि इस न्यूनीकरण समस्या का समाधान समीकरणों की निम्नलिखित प्रणाली के समाधान की ओर ले जाता है
उसे वही रहने दो n (\ डिस्प्लेस्टाइल n)कुछ चर के मान वाई (\ डिस्प्लेस्टाइल वाई)(ये प्रेक्षणों, प्रयोगों आदि के परिणाम हो सकते हैं) और संगत चर एक्स (\ डिस्प्लेस्टाइल एक्स)... चुनौती यह सुनिश्चित करना है कि के बीच संबंध वाई (\ डिस्प्लेस्टाइल वाई)तथा एक्स (\ डिस्प्लेस्टाइल एक्स)कुछ अज्ञात मापदंडों तक ज्ञात किसी फ़ंक्शन द्वारा अनुमानित बी (\ डिस्प्लेस्टाइल बी), अर्थात, वास्तव में, मापदंडों के सर्वोत्तम मूल्यों का पता लगाएं बी (\ डिस्प्लेस्टाइल बी), अधिकतम अनुमानित मान एफ (एक्स, बी) (\ डिस्प्लेस्टाइल एफ (एक्स, बी))वास्तविक मूल्यों के लिए वाई (\ डिस्प्लेस्टाइल वाई)... वास्तव में, यह समीकरणों की एक अतिनिर्धारित प्रणाली के "समाधान" के मामले में कम हो जाता है बी (\ डिस्प्लेस्टाइल बी):
तदनुसार, प्रेक्षित मानों का विचलन वाई (\ डिस्प्लेस्टाइल वाई)मॉडल से एफ (एक्स, बी) (\ डिस्प्लेस्टाइल एफ (एक्स, बी))मॉडल में पहले से ही माना जाता है। OLS (साधारण, शास्त्रीय) का सार ऐसे मापदंडों को खोजना है बी (\ डिस्प्लेस्टाइल बी)जिसके लिए विचलन के वर्गों का योग (त्रुटियों, प्रतिगमन मॉडल के लिए उन्हें अक्सर प्रतिगमन अवशेष कहा जाता है) ई टी (\ डिस्प्लेस्टाइल ई_ (टी))न्यूनतम होगा:
सामान्य स्थिति में, इस समस्या को संख्यात्मक अनुकूलन (न्यूनतमीकरण) विधियों द्वारा हल किया जा सकता है। इस मामले में, वे बात करते हैं अरेखीय कम से कम वर्ग(एनएलएस या एनएलएलएस - अंग्रेजी गैर-रैखिक कम से कम वर्ग)। कई मामलों में, एक विश्लेषणात्मक समाधान प्राप्त किया जा सकता है। न्यूनीकरण समस्या को हल करने के लिए, फ़ंक्शन के स्थिर बिंदुओं को खोजना आवश्यक है आर एस एस (बी) (\ डिस्प्लेस्टाइल आरएसएस (बी)), इसे अज्ञात मापदंडों द्वारा विभेदित करना बी (\ डिस्प्लेस्टाइल बी), व्युत्पन्न को शून्य के बराबर करना और समीकरणों की परिणामी प्रणाली को हल करना:
∑ t = 1 n (yt - f (xt, b)) f (xt, b) b = 0 (\ displaystyle \ sum _ (t = 1) ^ (n) (y_ (t) -f (x_) (टी), बी)) (\ फ्रैक (\ आंशिक एफ (एक्स_ (टी), बी)) (\ आंशिक बी)) = 0).
होने देना आपचर के अवलोकनों का स्तंभ वेक्टर समझाया जा रहा है, और एक्स (\ डिस्प्लेस्टाइल एक्स)- यह (एन × के) (\ डिस्प्लेस्टाइल ((एन \ टाइम्स के)))कारकों की टिप्पणियों का मैट्रिक्स (मैट्रिक्स की पंक्तियाँ किसी दिए गए अवलोकन में कारकों के मूल्यों के वैक्टर हैं, स्तंभों द्वारा - सभी टिप्पणियों में दिए गए कारक के मूल्यों का एक वेक्टर)। रैखिक मॉडल का मैट्रिक्स प्रतिनिधित्व है:
y = X b + (\ डिस्प्लेस्टाइल y = Xb + \ varepsilon).
फिर समझाया गया चर के अनुमानों के वेक्टर और प्रतिगमन अवशिष्ट के वेक्टर बराबर होंगे
पैरामीटर वेक्टर के संबंध में इस फ़ंक्शन को अलग करना बी (\ डिस्प्लेस्टाइल बी)और डेरिवेटिव को शून्य के बराबर करते हुए, हम समीकरणों की एक प्रणाली प्राप्त करते हैं (मैट्रिक्स रूप में):
गूढ़ मैट्रिक्स रूप में, समीकरणों की यह प्रणाली इस तरह दिखती है:
(∑ एक्सटी 1 2 ∑ एक्सटी 1 एक्सटी 2 ∑ एक्सटी 1 एक्सटी 3… ∑ एक्सटी 1 एक्सटी एक्सटी 2 एक्सटी 1 ∑ एक्सटी 2 2 ∑ एक्सटी 2 एक्सटी 3… ∑ एक्सटी 2 एक्सटी ∑ एक्सटी 3 एक्सटी 1 ∑ एक्सटी 3 एक्सटी 2 xt 3 2… xt 3 xtk xtkxt 1 xtkxt 2 ∑ xtkxt 3… xtk 2) (b 1 b 2 b 3 bk) = (∑ xt 1 yt xt 2 yt xt 3 yt xtkyt), (\ डिस्प्लेस्टाइल (\ start (pmatrix) \ sum x_ (t1) ^ (2) और \ sum x_ (t1) x_ (t2) और \ sum x_ (t1) x_ (t3) और \ ldots & \ योग x_ (t1) x_ (tk) \\\ योग x_ (t2) x_ (t1) और \ योग x_ (t2) ^ (2) और \ योग x_ (t2) x_ (t3) और \ ldots & \ योग x_ (t2) x_ (tk) \\\ योग x_ (t3) x_ (t1) और \ योग x_ (t3) x_ (t2) और \ योग x_ (t3) ^ (2) और \ ldots और \ योग x_ (t3) x_ (tk) \\\ vdots और \ vdots और \ vdots और \ ddots और \ vdots \\\ योग x_ (tk) x_ (t1) और \ योग x_ (tk) x_ (t2) और \ योग x_ (tk) x_ (t3) और \ ldots और \ sum x_ (tk) ^ (2) \\\ अंत (pmatrix)) (\ start (pmatrix) b_ (1) \\ b_ (2) \\ b_ (3 ) \\\ vdots \\ b_ (k) \\\ अंत (pmatrix)) = (\ start (pmatrix) \ sum x_ (t1) y_ (t) \\\ sum x_ (t2) y_ (t) \\ \ योग x_ (t3) y_ (t) \\\ vdots \\\ योग x_ (tk) y_ (t) \\\ अंत (pmatrix)),)जहां सभी राशियों को सभी स्वीकार्य मूल्यों पर लिया जाता है टी (\ डिस्प्लेस्टाइल टी).
यदि मॉडल में एक स्थिरांक शामिल है (हमेशा की तरह), तो एक्स टी 1 = 1 (\ डिस्प्लेस्टाइल एक्स_ (टी1) = 1)सबके साथ टी (\ डिस्प्लेस्टाइल टी), इसलिए, समीकरणों की प्रणाली के मैट्रिक्स के ऊपरी बाएं कोने में, अवलोकनों की संख्या है n (\ डिस्प्लेस्टाइल n), और पहली पंक्ति और पहले कॉलम के बाकी तत्वों में - चर के मूल्यों का योग: ∑ एक्स टी जे (\ डिस्प्लेस्टाइल \ योग x_ (टीजे))और तंत्र के दायीं ओर का पहला तत्व है y t (\ डिस्प्लेस्टाइल \ योग y_ (टी)).
समीकरणों की इस प्रणाली का समाधान रैखिक मॉडल के लिए ओएलएस अनुमानों का सामान्य सूत्र देता है:
विश्लेषणात्मक उद्देश्यों के लिए, इस सूत्र का अंतिम प्रतिनिधित्व उपयोगी साबित होता है (समीकरणों की प्रणाली में जब n से विभाजित किया जाता है, तो योग के बजाय, अंकगणितीय साधन दिखाई देते हैं)। यदि प्रतिगमन मॉडल में डेटा केंद्रित, तो इस प्रतिनिधित्व में पहले मैट्रिक्स में कारकों के नमूना सहप्रसरण मैट्रिक्स का अर्थ है, और दूसरा आश्रित चर के साथ कारकों के सहप्रसरण का वेक्टर है। यदि, इसके अतिरिक्त, डेटा भी है सामान्यीकृत SKO के लिए (अर्थात, अंततः मानकीकृत), तो पहले मैट्रिक्स में कारकों के चयनात्मक सहसंबंध मैट्रिक्स का अर्थ होता है, दूसरा वेक्टर एक आश्रित चर के साथ कारकों के चयनात्मक सहसंबंधों का एक वेक्टर होता है।
मॉडलों के लिए ओएलएस अनुमानों की एक महत्वपूर्ण संपत्ति स्थिरांक के साथ- निर्मित प्रतिगमन की रेखा नमूना डेटा के गुरुत्वाकर्षण के केंद्र से होकर गुजरती है, अर्थात समानता पूरी होती है:
विशेष रूप से, चरम मामले में, जब एकमात्र प्रतिगामी स्थिर होता है, तो हम पाते हैं कि एकमात्र पैरामीटर (स्थिर स्वयं) का ओएलएस अनुमान समझाया जा रहा चर के औसत मूल्य के बराबर है। अर्थात्, अंकगणित माध्य, जो बड़ी संख्या के नियमों से अपने अच्छे गुणों के लिए जाना जाता है, एक OLS-अनुमान भी है - यह इससे विचलन के वर्गों के न्यूनतम योग की कसौटी को पूरा करता है।
सबसे सरल विशेष मामले
युग्मित रैखिक प्रतिगमन के मामले में y t = a + b x t + t (\ डिस्प्लेस्टाइल y_ (t) = a + bx_ (t) + \ varepsilon _ (t)), जब एक चर की दूसरे पर रैखिक निर्भरता का अनुमान लगाया जाता है, तो गणना सूत्र सरल हो जाते हैं (आप मैट्रिक्स बीजगणित के बिना कर सकते हैं)। समीकरणों की प्रणाली इस प्रकार है:
(1 x ¯ x ¯ x 2 ) (ab) = (y ¯ xy ) (\ डिस्प्लेस्टाइल (\ start (pmatrix) 1 और (\ bar (x)) \\ (\ bar (x)) और (\ बार (x ^ (2))) \\\ अंत (pmatrix)) (\ start (pmatrix) a \\ b \\\ end (pmatrix)) = (\ start (pmatrix) (\ bar (y)) \ \ (\ overline (xy)) \\\ अंत (pmatrix))).
इसलिए, गुणांकों का अनुमान लगाना आसान है:
(बी ^ = कोव (एक्स, वाई) वार (एक्स) = xy ¯ - x y ¯ x 2 ¯ - x ¯ 2, a ^ = y ¯ - bx । (\ डिस्प्लेस्टाइल (\ start (केस)) (\ टोपी (बी)) = (\ फ्रैक (\ मैथोप (\ टेक्स्टआरएम (कोव)) (एक्स, वाई)) (\ मैथोप (\ टेक्स्टआरएम (वार)) (एक्स))) = (\ फ्रैक ((\ ओवरलाइन) (xy)) - (\ बार (x)) (\ बार (y))) ((\ overline (x ^ (2))) - (\ overline (x)) ^ (2))), \\ ( \ टोपी (ए)) = (\ बार (वाई)) - बी (\ बार (एक्स))। \ अंत (केस)))
इस तथ्य के बावजूद कि सामान्य मामले में एक स्थिरांक वाला मॉडल बेहतर होता है, कुछ मामलों में यह सैद्धांतिक विचारों से जाना जाता है कि स्थिरांक ए (\ डिस्प्लेस्टाइल ए)शून्य होना चाहिए। उदाहरण के लिए, भौतिकी में, वोल्टेज और करंट के बीच संबंध का रूप है यू = आई ⋅ आर (\ डिस्प्लेस्टाइल यू = आई \ सीडीटी आर); वोल्टेज और वर्तमान ताकत को मापने के लिए, प्रतिरोध का अनुमान लगाना आवश्यक है। इस मामले में, हम मॉडल के बारे में बात कर रहे हैं वाई = बी एक्स (\ डिस्प्लेस्टाइल वाई = बीएक्स)... इस मामले में, समीकरणों की प्रणाली के बजाय, हमारे पास एकमात्र समीकरण है
(∑ x t 2) b = ∑ x t y t (\ displaystyle \ left (\ sum x_ (t) ^ (2) \ right) b = \ sum x_ (t) y_ (t)).
यदि डेटा को एकल चर बहुपद प्रतिगमन फ़ंक्शन के साथ फिट किया गया है f (x) = b 0 + ∑ i = 1 k b i x i (\ डिस्प्लेस्टाइल f (x) = b_ (0) + \ योग \ सीमाएं _ (i = 1) ^ (k) b_ (i) x ^ (i)), फिर, डिग्री को समझते हुए x i (\ डिस्प्लेस्टाइल x ^ (i))सभी के लिए स्वतंत्र कारक के रूप में मैं (\ डिस्प्लेस्टाइल मैं)रैखिक मॉडल के मापदंडों के आकलन के लिए सामान्य सूत्र के आधार पर मॉडल के मापदंडों का अनुमान लगाना संभव है। ऐसा करने के लिए, सामान्य सूत्र को ध्यान में रखना पर्याप्त है कि इस तरह की व्याख्या के साथ x t i x t j = x t i x t j = x t i + j (\ डिस्प्लेस्टाइल x_ (ti) x_ (tj) = x_ (t) ^ (i) x_ (t) ^ (j) = x_ (t) ^ (i + j))तथा x t j y t = x t j y t (\ displaystyle x_ (tj) y_ (t) = x_ (t) ^ (j) y_ (t))... नतीजतन, इस मामले में मैट्रिक्स समीकरण रूप ले लेंगे:
(एन एनएक्सटी… ∑ एनएक्सटीके एनएक्सटी ∑ एनएक्सटी 2… ∑ एनएक्सटीके + 1 एनएक्सटीके ∑ एनएक्सटीके + 1… ∑ एनएक्सटी 2 के) [बी 0 बी 1 ⋮ बीके] = [∑ nyt nxtyt ]. (\ डिस्प्लेस्टाइल (\ start (pmatrix) n & \ sum \ सीमाएं _ (n) x_ (t) और \ ldots और \ sum \ सीमाएं _ (n) x_ (t) ^ (k) \\\ योग \ सीमाएं _ (एन) x_ (टी) और \ योग \ सीमा _ (एन) x_ (टी) ^ (2) और \ डॉट्स और \ योग \ सीमा _ (एन) x_ (टी) ^ (के + 1) \\\ vdots और \ vdots और \ ddots और \ vdots \\\ योग \ सीमा _ (n) x_ (t) ^ (k) और \ योग \ सीमा _ (n) x_ (t) ^ (k + 1) और \ ldots & \ योग \ सीमा _ (एन) x_ (टी) ^ (2k) \ अंत (pmatrix)) (\ start (bmatrix) b_ (0) \\ b_ (1) \\\ vdots \\ b_ (k) \ अंत ( bmatrix)) = (\ start (bmatrix) \ sum \ Limits _ (n) y_ (t) \\\ sum \ Limits _ (n) x_ (t) y_ (t) \\\ vdots \\\ sum \ सीमा _ (एन) x_ (टी) ^ (के) y_ (टी) \ अंत (बीमैट्रिक्स))।)
ओएलएस अनुमानों के सांख्यिकीय गुण
सबसे पहले, हम ध्यान दें कि रैखिक मॉडल के लिए, ओएलएस अनुमान रैखिक अनुमान हैं, जैसा कि उपरोक्त सूत्र से निम्नानुसार है। ओएलएस अनुमानों की निष्पक्षता के लिए, प्रतिगमन विश्लेषण की सबसे महत्वपूर्ण शर्त को पूरा करना आवश्यक और पर्याप्त है: यादृच्छिक त्रुटि की गणितीय अपेक्षा, कारकों के संदर्भ में सशर्त, शून्य के बराबर होनी चाहिए। यह शर्त, विशेष रूप से, संतुष्ट होती है यदि
यादृच्छिक त्रुटियों की गणितीय अपेक्षा शून्य है, और
कारक और यादृच्छिक त्रुटियां स्वतंत्र यादृच्छिक चर हैं।
दूसरी शर्त - बहिर्जात कारकों की स्थिति - मौलिक है। यदि यह संपत्ति पूरी नहीं होती है, तो हम मान सकते हैं कि लगभग कोई भी अनुमान बेहद असंतोषजनक होगा: वे सुसंगत भी नहीं होंगे (अर्थात, बहुत बड़ी मात्रा में डेटा भी इस मामले में गुणात्मक अनुमान प्राप्त करने की अनुमति नहीं देता है)। शास्त्रीय मामले में, एक यादृच्छिक त्रुटि के विपरीत, कारकों के नियतत्ववाद के बारे में एक मजबूत धारणा बनाई जाती है, जिसका स्वचालित रूप से बहिर्जात स्थिति की पूर्ति का मतलब है। सामान्य मामले में, अनुमानों की स्थिरता के लिए, मैट्रिक्स के अभिसरण के साथ-साथ बहिर्जात स्थिति को संतुष्ट करने के लिए पर्याप्त है वी एक्स (\ डिस्प्लेस्टाइल वी_ (एक्स))नमूना आकार को अनंत तक बढ़ाने के साथ कुछ गैर-पतित मैट्रिक्स के लिए।
निरंतरता और निष्पक्षता के अलावा, (साधारण) कम से कम वर्गों के अनुमान प्रभावी होने के लिए (रैखिक निष्पक्ष अनुमानों के वर्ग में सर्वश्रेष्ठ), एक यादृच्छिक त्रुटि के अतिरिक्त गुणों को पूरा करना आवश्यक है:
इन मान्यताओं को यादृच्छिक त्रुटियों के वेक्टर के सहप्रसरण मैट्रिक्स के लिए तैयार किया जा सकता है वी (ε) = σ 2 मैं (\ डिस्प्लेस्टाइल वी (\ varepsilon) = \ सिग्मा ^ (2) मैं).
इन शर्तों को पूरा करने वाला एक रैखिक मॉडल कहलाता है क्लासिक... शास्त्रीय रैखिक प्रतिगमन के लिए ओएलएस अनुमान निष्पक्ष, सुसंगत और सभी रैखिक निष्पक्ष अनुमानों के वर्ग में सबसे प्रभावी अनुमान हैं (अंग्रेजी साहित्य में, संक्षेप में कभी-कभी उपयोग किया जाता है नीला (सर्वश्रेष्ठ रैखिक निष्पक्ष अनुमानक) सबसे अच्छा रैखिक निष्पक्ष अनुमान है; घरेलू साहित्य में, गॉस - मार्कोव प्रमेय को अधिक बार उद्धृत किया जाता है)। जैसा कि यह दिखाना आसान है, गुणांक अनुमानों के वेक्टर का सहप्रसरण मैट्रिक्स इसके बराबर होगा:
दक्षता का अर्थ है कि यह सहप्रसरण मैट्रिक्स "न्यूनतम" है (गुणांक का कोई भी रैखिक संयोजन, और विशेष रूप से स्वयं गुणांक, न्यूनतम विचरण है), अर्थात रैखिक निष्पक्ष अनुमानों के वर्ग में, OLS अनुमान सबसे अच्छे हैं। इस मैट्रिक्स के विकर्ण तत्व - गुणांक अनुमानों के प्रसरण - प्राप्त अनुमानों की गुणवत्ता के महत्वपूर्ण पैरामीटर हैं। हालांकि, सहप्रसरण मैट्रिक्स की गणना करना असंभव है, क्योंकि यादृच्छिक त्रुटियों का विचरण अज्ञात है। यह साबित किया जा सकता है कि निष्पक्ष और सुसंगत (शास्त्रीय रैखिक मॉडल के लिए) यादृच्छिक त्रुटियों के विचरण का अनुमान मूल्य है:
इस मान को सहप्रसरण मैट्रिक्स के सूत्र में प्रतिस्थापित करने पर हमें सहप्रसरण मैट्रिक्स का एक अनुमान प्राप्त होता है। प्राप्त अनुमान भी निष्पक्ष और सुसंगत हैं। यह भी महत्वपूर्ण है कि त्रुटियों के विचरण का अनुमान (और इसलिए गुणांकों के प्रसरण) और मॉडल मापदंडों के अनुमान स्वतंत्र यादृच्छिक चर हैं, जो किसी को मॉडल के गुणांक के बारे में परिकल्पना के परीक्षण के लिए परीक्षण के आंकड़े प्राप्त करने की अनुमति देता है।
यह ध्यान दिया जाना चाहिए कि यदि शास्त्रीय मान्यताओं को पूरा नहीं किया जाता है, तो मापदंडों के ओएलएस अनुमान सबसे कुशल नहीं हैं और जहां डब्ल्यू (\ डिस्प्लेस्टाइल डब्ल्यू)- कुछ सममित सकारात्मक निश्चित वजन मैट्रिक्स। सामान्य ओएलएस इस दृष्टिकोण का एक विशेष मामला है, जब वजन मैट्रिक्स पहचान मैट्रिक्स के समानुपाती होता है। जैसा कि ज्ञात है, सममित मैट्रिक्स (या ऑपरेटरों) के लिए एक अपघटन होता है डब्ल्यू = पी टी पी (\ डिस्प्लेस्टाइल डब्ल्यू = पी ^ (टी) पी)... इसलिए, इस कार्यात्मक को निम्नानुसार दर्शाया जा सकता है ई टीपीटीपी ई = (पी ई) टीपी ई = ई टी ई ∗ (\ डिस्प्लेस्टाइल ई ^ (टी) पी ^ (टी) पे = (पे) ^ (टी) पे = ई _ (*) ^ (टी ) ई_ (*)), अर्थात्, इस कार्यात्मक को कुछ रूपांतरित "अवशिष्ट" के वर्गों के योग के रूप में दर्शाया जा सकता है। इस प्रकार, हम कम से कम वर्ग विधियों के एक वर्ग को अलग कर सकते हैं - एलएस-विधियां (कम से कम वर्ग)।
यह साबित हो गया है (ऐटकेन का प्रमेय) कि एक सामान्यीकृत रैखिक प्रतिगमन मॉडल के लिए (जिसमें यादृच्छिक त्रुटियों के सहप्रसरण मैट्रिक्स पर कोई प्रतिबंध नहीं लगाया जाता है), सबसे प्रभावी (रैखिक निष्पक्ष अनुमानों के वर्ग में) तथाकथित अनुमान हैं सामान्यीकृत ओएलएस (ओएलएस, जीएलएस - सामान्यीकृत कम वर्ग)- यादृच्छिक त्रुटियों के व्युत्क्रम सहसंयोजक मैट्रिक्स के बराबर वजन मैट्रिक्स के साथ एलएस-विधि: डब्ल्यू = वी ε - 1 (\ डिस्प्लेस्टाइल डब्ल्यू = वी _ (\ varepsilon) ^ (- 1)).
यह दिखाया जा सकता है कि एक रैखिक मॉडल के मापदंडों के लिए ओएलएस अनुमान के सूत्र का रूप है
वास्तव में, OLS का सार मूल डेटा का एक निश्चित (रैखिक) परिवर्तन (P) है और रूपांतरित डेटा में सामान्य OLS का अनुप्रयोग है। इस परिवर्तन का लक्ष्य यह है कि रूपांतरित डेटा के लिए, यादृच्छिक त्रुटियां पहले से ही शास्त्रीय मान्यताओं को पूरा करती हैं।
भारित ओएलएस
एक विकर्ण भार मैट्रिक्स (और इसलिए यादृच्छिक त्रुटियों का एक सहप्रसरण मैट्रिक्स) के मामले में, हमारे पास तथाकथित भारित न्यूनतम वर्ग (WLS) हैं। इस मामले में, मॉडल के अवशेषों के वर्गों का भारित योग कम से कम है, अर्थात, प्रत्येक अवलोकन को इस अवलोकन में यादृच्छिक त्रुटि के विचरण के व्युत्क्रमानुपाती "वजन" प्राप्त होता है: ई TW ई = ∑ टी = 1 नेट 2 σ टी 2 (\ डिस्प्लेस्टाइल ई ^ (टी) हम = \ योग _ (टी = 1) ^ (एन) (\ फ्रैक (ई_ (टी) ^ (2)) (\ सिग्मा _ (टी) ^ (2))))... वास्तव में, डेटा को प्रेक्षणों को भारित करके (यादृच्छिक त्रुटियों के अनुमानित मानक विचलन के समानुपाती मान से विभाजित करके) रूपांतरित किया जाता है, और नियमित OLS को भारित डेटा पर लागू किया जाता है।
अलेक्जेंड्रोवा एन.वी.गणितीय शब्दों, अवधारणाओं, पदनामों का इतिहास: संदर्भ शब्दकोश। - तीसरा संस्करण .. - एम .: एलकेआई, 2008 .-- 248 पी। - आईएसबीएन 978-5-382-00839-4।आई.वी. मितिन, रुसाकोव वी.एस. प्रयोगात्मक डेटा का विश्लेषण और प्रसंस्करण - 5 वां संस्करण - 24s।
इसका व्यापक रूप से अर्थमिति में इसके मापदंडों की स्पष्ट आर्थिक व्याख्या के रूप में उपयोग किया जाता है।
रेखीय प्रतिगमन को फॉर्म का समीकरण खोजने के लिए कम किया जाता है
या
फॉर्म का समीकरण दिए गए पैरामीटर मानों के लिए अनुमति देता है एक्सइसमें कारक के वास्तविक मूल्यों को प्रतिस्थापित करते हुए, प्रभावी संकेतक के सैद्धांतिक मूल्य हैं एक्स.
रेखीय समाश्रयण का निर्माण इसके प्राचलों के आकलन तक घटा दिया गया है - एतथा वीरैखिक प्रतिगमन के मापदंडों का अनुमान विभिन्न तरीकों से पाया जा सकता है।
रेखीय प्रतीपगमन प्राचलों के आकलन के लिए शास्त्रीय उपागम पर आधारित है कम से कम वर्ग विधि(ओएलएस)।
OLS किसी को ऐसे पैरामीटर अनुमान प्राप्त करने की अनुमति देता है एतथा वी,जिस पर परिणामी विशेषता के वास्तविक मूल्यों के विचलन के वर्गों का योग (वाई)परिकलित (सैद्धांतिक) से कम से कम:
फ़ंक्शन के न्यूनतम को खोजने के लिए, प्रत्येक पैरामीटर के संबंध में आंशिक डेरिवेटिव की गणना करना आवश्यक है एतथा बीऔर उन्हें शून्य पर सेट करें।
हम निरूपित करते हैं एस के माध्यम से, फिर:
सूत्र को बदलने से, हम मापदंडों के आकलन के लिए सामान्य समीकरणों की निम्नलिखित प्रणाली प्राप्त करते हैं: एतथा वी:
सामान्य समीकरणों की प्रणाली (3.5) को या तो चर के क्रमिक उन्मूलन की विधि द्वारा या निर्धारकों की विधि द्वारा हल करने पर, हम मापदंडों के आवश्यक अनुमान पाते हैं एतथा वी
पैरामीटर वीप्रतिगमन गुणांक कहा जाता है। इसका मान एक इकाई द्वारा कारक में परिवर्तन के साथ परिणाम में औसत परिवर्तन को दर्शाता है।
प्रतिगमन समीकरण हमेशा रिश्ते की जकड़न के एक संकेतक द्वारा पूरक होता है। जब रैखिक प्रतिगमन का उपयोग किया जाता है, तो रैखिक सहसंबंध गुणांक ऐसे संकेतक के रूप में कार्य करता है। रैखिक सहसंबंध गुणांक सूत्र के विभिन्न संशोधन हैं। उनमें से कुछ नीचे सूचीबद्ध हैं:
जैसा कि आप जानते हैं, रैखिक सहसंबंध गुणांक सीमा में है: -1 ≤
≤
1.
एक रैखिक फ़ंक्शन के चयन की गुणवत्ता का आकलन करने के लिए, वर्ग की गणना की जाती है
रैखिक सहसंबंध गुणांक कहा जाता है निर्धारण का गुणांक।निर्धारण का गुणांक प्रभावी संकेतक के विचरण के अनुपात को दर्शाता है वाई,प्रतिगमन द्वारा समझाया गया, प्रभावी विशेषता के कुल विचरण में:
तदनुसार, मान 1 - फैलाव के अनुपात को दर्शाता है वाई,अन्य कारकों के प्रभाव के कारण मॉडल में ध्यान नहीं दिया गया।
आत्म-नियंत्रण के लिए प्रश्न
1. कम से कम वर्ग विधि का सार क्या है?
2. युग्मित समाश्रयण कितने चर प्रदान किए गए हैं?
3. वह कौन सा गुणांक है जो परिवर्तनों के बीच संबंधों की जकड़न को निर्धारित करता है?
4. निर्धारण का गुणांक किस सीमा के भीतर निर्धारित किया जाता है?
5. सहसंबंध-प्रतिगमन विश्लेषण में पैरामीटर बी का अनुमान?
3. आर.यू. राखमेतोवा अर्थमिति में एक लघु पाठ्यक्रम। ट्यूटोरियल। अल्माटी। 2004. -78s।
4. आई.आई. एलिसेवा, अर्थमिति। - एम।: "वित्त और सांख्यिकी", 2002
5. मासिक सूचना और विश्लेषणात्मक पत्रिका।
गैर-रेखीय आर्थिक मॉडल। गैर-रैखिक प्रतिगमन मॉडल। चर का रूपांतरण।
गैर-रेखीय आर्थिक मॉडल।
चर का रूपांतरण।
लोच गुणांक।
यदि आर्थिक घटनाओं के बीच गैर-रैखिक संबंध हैं, तो उन्हें संबंधित गैर-रैखिक कार्यों का उपयोग करके व्यक्त किया जाता है: उदाहरण के लिए, एक समबाहु अतिपरवलय ,
दूसरी डिग्री के परवलय और आदि।
गैर-रेखीय प्रतिगमन के दो वर्ग हैं:
1. विश्लेषण में शामिल व्याख्यात्मक चर के संबंध में गैर-रेखीय प्रतिगमन, लेकिन अनुमानित मापदंडों के संबंध में रैखिक, उदाहरण के लिए:
विभिन्न अंशों के बहुपद - , ;
समबाहु अतिपरवलय -;
अर्ध-लघुगणक कार्य -।
2. अनुमानों में गैर-रैखिक होने वाले प्रतिगमन, उदाहरण के लिए:
शक्ति -;
सांकेतिक -;
घातीय -।
प्रभावी गुण के व्यक्तिगत मूल्यों के विचलन के वर्गों का कुल योग परऔसत से कई कारणों के प्रभाव के कारण है। आइए सशर्त रूप से कारणों के पूरे सेट को दो समूहों में विभाजित करें: अध्ययन कारक xतथा अन्य कारक।
यदि कारक परिणाम को प्रभावित नहीं करता है, तो ग्राफ पर प्रतिगमन रेखा अक्ष के समानांतर होती है ओहतथा
तब प्रभावी गुण का संपूर्ण विचरण अन्य कारकों के प्रभाव के कारण होता है और विचलन के वर्गों का कुल योग अवशिष्ट के साथ मेल खाएगा। यदि अन्य कारक परिणाम को प्रभावित नहीं करते हैं, तो तुम बंधे होसाथ एक्सकार्यात्मक रूप से और वर्गों का अवशिष्ट योग शून्य है। इस मामले में, प्रतिगमन द्वारा समझाए गए विचलन के वर्गों का योग वर्गों के कुल योग के समान है।
चूंकि सहसंबंध क्षेत्र के सभी बिंदु प्रतिगमन रेखा पर नहीं होते हैं, इसलिए उनका प्रकीर्णन हमेशा कारक के प्रभाव के कारण होता है एक्स, यानी, प्रतिगमन परपर एक्स,और अन्य कारण (अस्पष्टीकृत भिन्नता)। पूर्वानुमान के लिए प्रतिगमन रेखा की उपयुक्तता इस बात पर निर्भर करती है कि विशेषता की कुल भिन्नता कितनी है परव्याख्या की गई भिन्नता पर पड़ता है
जाहिर है, अगर प्रतिगमन के कारण विचलन के वर्गों का योग वर्गों के अवशिष्ट योग से अधिक है, तो प्रतिगमन समीकरण सांख्यिकीय रूप से महत्वपूर्ण है और कारक एक्सपरिणाम पर महत्वपूर्ण प्रभाव पड़ता है पर।
,
वह है, सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या n की इकाइयों की संख्या और इससे निर्धारित स्थिरांक की संख्या के साथ जुड़ी हुई है। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पी
समग्र रूप से समाश्रयण समीकरण के महत्व का अनुमान किसकी सहायता से दिया जाता है? एफ-फिशर की कसौटी। उसी समय, एक शून्य परिकल्पना सामने रखी जाती है कि प्रतिगमन गुणांक शून्य है, अर्थात। बी = 0, और इसलिए कारक एक्सपरिणाम को प्रभावित नहीं करता पर।
एफ-मानदंड की प्रत्यक्ष गणना विचरण के विश्लेषण से पहले होती है। इसमें केंद्रीय स्थान चर के विचलन के वर्गों के कुल योग के अपघटन द्वारा कब्जा कर लिया गया है परऔसत से परदो भागों में - "समझा गया" और "अस्पष्टीकृत":
- विचलन के वर्गों का कुल योग;
- प्रतिगमन द्वारा समझाया गया विचलन के वर्गों का योग;
- विचलन के वर्गों का अवशिष्ट योग।
विचलन के वर्गों का कोई भी योग स्वतंत्रता की डिग्री की संख्या से संबंधित है ,
वह है, सुविधा की स्वतंत्र भिन्नता की स्वतंत्रता की संख्या के साथ। स्वतंत्रता की डिग्री की संख्या जनसंख्या में इकाइयों की संख्या से संबंधित है एनऔर इससे निर्धारित स्थिरांक की संख्या के साथ। अध्ययन के तहत समस्या के संबंध में, स्वतंत्रता की डिग्री की संख्या से पता चलता है कि कितने स्वतंत्र विचलन हैं पीदिए गए वर्गों का योग बनाने के लिए संभव है।
स्वतंत्रता की प्रति डिग्री फैलावडी.
एफ-अनुपात (एफ-मानदंड):
यदि शून्य परिकल्पना सत्य है, तो भाज्य और अवशिष्ट प्रसरण एक दूसरे से भिन्न नहीं होते हैं। 0 के लिए, एक खंडन आवश्यक है ताकि भाज्य विचरण अवशिष्ट से कई गुना अधिक हो। ब्रिटिश सांख्यिकीविद् स्नेडेकोर ने महत्वपूर्ण मूल्यों की तालिका विकसित की एफ-अशक्त परिकल्पना और स्वतंत्रता के विभिन्न स्तरों के महत्व के विभिन्न स्तरों पर संबंध। तालिका मूल्य एफ-मानदंड, भिन्नताओं के अनुपात का अधिकतम मूल्य है जो एक शून्य परिकल्पना की उपस्थिति की संभावना के दिए गए स्तर के लिए उनकी यादृच्छिक विसंगति के मामले में हो सकता है। परिकलित मूल्य एफ-संबंध को विश्वसनीय माना जाता है यदि यह सारणीबद्ध से अधिक हो।
इस मामले में, संकेतों के बीच संबंध की अनुपस्थिति की शून्य परिकल्पना को खारिज कर दिया जाता है और इस संबंध के महत्व के बारे में निष्कर्ष निकाला जाता है: एफ तथ्य> एफ टैबएच 0 खारिज कर दिया है।
यदि मान तालिका से कम है एफ तथ्य , एफ टैब, तो शून्य परिकल्पना की संभावना किसी दिए गए स्तर से अधिक है और कनेक्शन की उपस्थिति के बारे में गलत निष्कर्ष निकालने के गंभीर जोखिम के बिना इसे अस्वीकार नहीं किया जा सकता है। इस मामले में, प्रतिगमन समीकरण को सांख्यिकीय रूप से महत्वहीन माना जाता है। लेकिन यह विचलित नहीं होता है।
प्रतिगमन गुणांक मानक त्रुटि
प्रतिगमन गुणांक के महत्व का आकलन करने के लिए, इसके मूल्य की तुलना इसकी मानक त्रुटि से की जाती है, अर्थात वास्तविक मूल्य निर्धारित किया जाता है टी-छात्र की कसौटी: जो तब महत्व के एक निश्चित स्तर पर तालिका मूल्य और स्वतंत्रता की डिग्री की संख्या के साथ तुलना की जाती है ( एन- 2).
पैरामीटर मानक त्रुटि ए:
त्रुटि के परिमाण के आधार पर रैखिक सहसंबंध गुणांक के महत्व की जाँच की जाती है सहसंबंध गुणांकटी आर:
एक विशेषता का कुल विचरण एक्स:
एकाधिक रेखीय प्रतिगमन
मॉडल का निर्माण
बहु - प्रतिगमनदो या दो से अधिक कारकों के साथ एक प्रभावी गुण का प्रतिगमन है, अर्थात, प्रपत्र का एक मॉडल
यदि शोध वस्तु को प्रभावित करने वाले अन्य कारकों के प्रभाव की उपेक्षा की जा सकती है, तो प्रतिगमन मॉडलिंग में एक अच्छा परिणाम दे सकता है। व्यक्तिगत आर्थिक चर के व्यवहार को नियंत्रित नहीं किया जा सकता है, अर्थात एक जांच किए गए कारक के प्रभाव का आकलन करने के लिए अन्य सभी स्थितियों की समानता सुनिश्चित करना संभव नहीं है। इस मामले में, किसी को अन्य कारकों के प्रभाव को मॉडल में पेश करके पहचानने की कोशिश करनी चाहिए, यानी, एक बहु प्रतिगमन समीकरण का निर्माण करना चाहिए: वाई = ए + बी 1 एक्स 1 + बी 2 +… + बी पी एक्स पी +.
एकाधिक प्रतिगमन का मुख्य लक्ष्य बड़ी संख्या में कारकों के साथ एक मॉडल का निर्माण करना है, जबकि उनमें से प्रत्येक के प्रभाव को अलग-अलग निर्धारित करना है, साथ ही साथ मॉडलिंग संकेतक पर उनका संचयी प्रभाव भी है। मॉडल विनिर्देश में मुद्दों के दो क्षेत्र शामिल हैं: कारकों का चयन और प्रतिगमन समीकरण के प्रकार का चयन