NVIDIA: रास्ते में नए पास्कल जीपीयू। NVIDIA पास्कल: वास्तुकला अवलोकन एनवीडिया ने पास्कल वास्तुकला के आधार पर पहले GPU की घोषणा की

GeForce GTX 1080 Ti में 11GB GDDR5X मेमोरी, एक 1583MHz GPU (स्टॉक कूलिंग सिस्टम के साथ 2000MHz तक ओवरक्लॉक किया गया), 11GHz QDR मेमोरी और GeForce GTX 1080 की तुलना में 35% बेहतर प्रदर्शन है। और यह $ 699 की रियायती कीमत पर है।

नया ग्राफिक्स कार्ड GeForce GTX 1080 को GeForce लाइनअप में प्रमुख स्थान से विस्थापित कर देता है और बन जाता है सबसे तेजग्राफिक्स कार्ड आज अस्तित्व में है, साथ ही पास्कल वास्तुकला पर सबसे शक्तिशाली कार्ड है।

सबसे शक्तिशाली NVIDIA GeForce GTX 1080 Ti गेमिंग कार्ड

NVIDIA GeForce GTX 1080 Ti is एक गेमर का सपनाजो अंत में नवीनतम एएए गेम्स का आनंद ले सकते हैं, हाई डेफिनिशन वर्चुअल रियलिटी हेडसेट्स में खेल सकते हैं, ग्राफिक्स की स्पष्टता और सटीकता का आनंद ले सकते हैं।

GTX 1080 Ti को 4K गेमिंग के लिए पहले पूर्ण ग्राफिक्स कार्ड के रूप में डिजाइन किया गया था। यह नवीनतम और सबसे तकनीकी रूप से उन्नत हार्डवेयर से लैस है जिसे आज कोई अन्य वीडियो कार्ड दावा नहीं कर सकता है।

यहां आधिकारिक प्रस्तुति NVIDIA GeForce GTX 1080 Ti

"यह कुछ नया करने का समय है। वह जो GTX 1080 से 35% तेज है। वह जो Titan X से तेज है। आइए इसे अधिकतम कहते हैं ...

वीडियो गेम हर साल अधिक से अधिक सुंदर हो गए हैं, इसलिए हम अगली पीढ़ी के शीर्ष उत्पाद पेश कर रहे हैं ताकि आप अगली पीढ़ी के खेलों का आनंद उठा सकें।"

जेन-ज़ुन

NVIDIA GeForce GTX 1080 Ti विनिर्देशों

NVIDIA ने अपने नए और अल्ट्रा-शक्तिशाली ग्राफिक्स कार्ड के लिए हार्डवेयर पर कंजूसी नहीं की।

यह उसी से लैस है जीपीयूपास्कल GP102 GPU टाइटन X (P) के समान ही है, लेकिन सभी मामलों में बाद वाले से बेहतर प्रदर्शन करता है।

प्रोसेसर 12 बिलियन ट्रांजिस्टर से लैस है और इसमें छह ग्राफिक्स प्रोसेसिंग क्लस्टर हैं, जिनमें से दो ब्लॉक हैं। यह कुल देता है 28 बहु-थ्रेडेड प्रोसेसर 128 कोर प्रत्येक।

इस प्रकार, GeForce GTX 1080 Ti वीडियो कार्ड में 3584 CUDA कोर, 224 बनावट मानचित्रण इकाइयां और 88 ROP (z-बफरिंग, एंटी-अलियासिंग, वीडियो मेमोरी के फ्रेम बफर में अंतिम छवि रिकॉर्ड करने के लिए जिम्मेदार इकाइयां) हैं।

ओवरक्लॉकिंग रेंज 1582 मेगाहर्ट्ज से 2 गीगाहर्ट्ज तक शुरू होती है। पास्कल की वास्तुकला मुख्य रूप से संदर्भ में ओवरक्लॉकिंग और गैर-मानक मॉडल में अधिक चरम ओवरक्लॉकिंग के लिए बनाई गई थी।

GeForce GTX 1080 Ti में भी विशेषताएं हैं 11GB GDDR5X मेमोरी 352-बिट बस पर काम कर रहा है। फ्लैगशिप अब तक के सबसे तेज़ G5X समाधान से भी लैस है।

नए संपीड़न और टाइल कैशिंग सिस्टम के साथ, जीटीएक्स 1080 टीआई की बैंडविड्थ को एएमडी की एचबीएम 2 तकनीक को पार करते हुए 1200GB / s तक बढ़ाया जा सकता है।

NVIDIA GeForce GTX 1080 Ti विशिष्टता:

विशेष विवरण जीटीएक्स टाइटन एक्स पास्कल जीटीएक्स 1080 Ti जीटीएक्स 1080
तकनीकी प्रक्रिया 16 एनएम १६एनएम 16 एनएम
ट्रांजिस्टर 12 अरब 12 अरब 7.2 अरब
क्रिस्टल क्षेत्र 471mm² 471mm² 314 मिमी²
याद 12 जीबी GDDR5X 11 जीबी GDDR5X 8 जीबी GDDR5X
मेमोरी स्पीड 10 जीबी / एस 11 जीबी / एस 11 जीबी / एस
मेमोरी इंटरफ़ेस ३८४-बिट 352-बिट 256-बिट
बैंडविड्थ 480GB / s ४८४ जीबी / एस 320GB / s
CUDA कोर 3584 3584 2560
आधार आवृत्ति 1417 1607
ओवरक्लॉकिंग आवृत्ति 1530 मेगाहर्ट्ज 1583 मेगाहर्ट्ज 1730 मेगाहर्ट्ज
संगणन शक्ति 11 टेराफ्लॉप्स ११.५ टेराफ्लॉप्स 9 टेराफ्लॉप्स
तापीय उर्जा 250W 250W 180W
कीमत 1200$ यूएस $ 699 499$

NVIDIA GeForce GTX 1080 Ti ग्राफिक्स कार्ड को ठंडा करना

GeForce GTX 1080 Ti फाउंडर्स में एक नया एयरफ्लो प्रबंधन समाधान है जो बेहतर बोर्ड कूलिंग की अनुमति देता है और पिछले डिजाइनों की तुलना में शांत भी है। यह सब वीडियो कार्ड को अधिक ओवरक्लॉक करना और इससे भी अधिक गति प्राप्त करना संभव बनाता है। इसके अलावा, शीतलन दक्षता में सुधार होता है 7-चरण बिजली की आपूर्ति 14 उच्च दक्षता वाले डुअलएफईटी ट्रांजिस्टर पर।

GeForce GTX 1080 Ti नवीनतम NVTTM डिज़ाइन के साथ आता है, जो एक नया वाष्प शीतलन कक्ष पेश करता है जिसमें टाइटन X (P) के शीतलन क्षेत्र का दोगुना है। यह नया थर्मल डिज़ाइन इष्टतम कूलिंग प्राप्त करने में मदद करता है और GPU बूस्ट 3.0 तकनीक के साथ आपके ग्राफिक्स कार्ड के GPU को विनिर्देश से परे बढ़ा देता है।

NVIDIA GeForce GTX 1080 Ti एक ओवरक्लॉकर का सपना है

तो हम इस प्रभावशाली ग्राफिक्स कार्ड शक्ति के साथ क्या करते हैं? उत्तर स्पष्ट है - सीमा तक ओवरक्लॉक करना। आयोजन के दौरान, NVIDIA ने अपने GTX 1080 Ti ग्राफिक्स कार्ड की उत्कृष्ट ओवरक्लॉकिंग क्षमता का प्रदर्शन किया। याद रखें कि वे 60 एफपीएस लॉक पर 2.03GHz की प्रोसेसर आवृत्ति तक पहुंचने में कामयाब रहे।

२०१६ पहले से ही करीब आ रहा है, लेकिन गेमिंग उद्योग में उनका योगदान लंबे समय तक हमारे साथ रहेगा। सबसे पहले, रेड कैंप के वीडियो कार्ड को मिड-प्राइस रेंज में अप्रत्याशित रूप से सफल अपडेट मिला, और दूसरी बात, NVIDIA ने एक बार फिर साबित कर दिया कि यह व्यर्थ नहीं है कि यह 70% बाजार पर कब्जा कर लेता है। मैक्सवेल अच्छे थे, जीटीएक्स 970 को पैसे के लिए सबसे अच्छे कार्डों में से एक माना जाता था, लेकिन पास्कल पूरी तरह से एक और मामला है।

जीटीएक्स 1080 और 1070 के व्यक्ति में हार्डवेयर की नई पीढ़ी ने पिछले साल के सिस्टम और फ्लैगशिप प्रयुक्त हार्डवेयर के बाजार के परिणामों को सचमुच दफन कर दिया, और जीटीएक्स 1060 और 1050 के व्यक्ति में "युवा" लाइनों ने अपनी सफलता को और अधिक समेकित किया किफायती खंड। GTX980Ti और अन्य टाइटन्स के मालिक मगरमच्छ के आँसू रोते हैं: कई हज़ार रूबल के लिए उनके uber-गनों ने अपने मूल्य का 50% और शो-ऑफ का 100% एक ही बार में खो दिया। NVIDIA खुद दावा करता है कि 1080 पिछले साल के TitanX से तेज है, 1070 आसानी से 980Ti पर ढेर हो जाता है, और अपेक्षाकृत बजट 1060 अन्य सभी कार्डधारकों को नुकसान पहुंचाएगा।

क्या ऐसा है, जहां उच्च प्रदर्शन के पैर बढ़ते हैं और छुट्टियों की पूर्व संध्या और अचानक वित्तीय खुशियों के साथ क्या करना है, साथ ही साथ खुद को खुश करने के लिए क्या करना है, आप इस लंबे और थोड़े समय में पता लगा सकते हैं उबाऊ लेख।

आप कंपनी एनवीडिया से प्यार कर सकते हैं या ... प्यार नहीं, लेकिन इस बात से इनकार करने के लिए कि यह वह है जो इस समय वीडियो कार्ड निर्माण के क्षेत्र में अग्रणी है, केवल एक वैकल्पिक ब्रह्मांड से अजनबी बन जाएगी। चूंकि एएमडी के वेगा की अभी तक घोषणा नहीं की गई है, हमने पोलारिस पर फ्लैगशिप आरएक्स नहीं देखा है, और आरएक्सएनएक्सएक्स फ्यूरी को इसकी एक्सएनएनएक्स जीबी प्रयोगात्मक मेमोरी के साथ एक आशाजनक कार्ड नहीं माना जा सकता है (वीआर और एक्सएनएनएक्सके, फिर भी, इससे थोड़ा अधिक चाहते हैं उसके पास है) - हमारे पास वह है जो हमारे पास है। जबकि 1080 Ti और सशर्त RX 490, RX Fury और RX 580 केवल अफवाहें और उम्मीदें हैं, हमारे पास वर्तमान NVIDIA लाइनअप को सुलझाने और यह देखने का समय है कि कंपनी ने हाल के वर्षों में क्या हासिल किया है।

पास्कल की उत्पत्ति की गड़बड़ी और इतिहास

NVIDIA नियमित रूप से "खुद को नापसंद" करने के लिए कारण देता है। जीटीएक्स 970 की कहानी और इसकी "3.5 जीबी मेमोरी", "एनवीआईडीआईए, भाड़ में जाओ!" लिनुस टॉर्वाल्ड्स से, डेस्कटॉप ग्राफिक्स लाइनों में पूर्ण पोर्नोग्राफ़ी, अपने स्वामित्व के पक्ष में मुक्त और अधिक व्यापक फ्रीसिंक सिस्टम के साथ काम करने से इनकार करना ... सामान्य तौर पर, पर्याप्त कारण हैं। मेरे लिए व्यक्तिगत रूप से सबसे अधिक कष्टप्रद वीडियो कार्ड की पिछली दो पीढ़ियों के साथ क्या हुआ है। यदि हम एक मोटा विवरण लें, तो "आधुनिक" ग्राफिक्स प्रोसेसर DX10 समर्थन के दिनों से चले गए हैं। और यदि आप आज 10वीं श्रृंखला के "दादा" की तलाश करते हैं, तो आधुनिक वास्तुकला की शुरुआत 400 वीं श्रृंखला के वीडियो त्वरक और फर्मी वास्तुकला के क्षेत्र में होगी। यह उसमें था कि तथाकथित से "ब्लॉक" निर्माण का विचार। NVIDIA शब्दावली में "CUDA कोर"।

फर्मी

यदि 8000 वीं, 9000 वीं और 200 वीं श्रृंखला के वीडियो कार्ड सार्वभौमिक शेडर प्रोसेसर (जैसे एएमडी, हाँ) के साथ "आधुनिक वास्तुकला" की अवधारणा में महारत हासिल करने के लिए पहला कदम थे, तो 400 वीं श्रृंखला पहले से ही जितनी संभव हो उतनी करीब थी जो हम देखते हैं। कुछ १०७० में। हाँ, फ़र्मी के पास अभी भी पिछली पीढ़ियों की एक छोटी लिगेसी बैसाखी है: शेडर इकाई ने कोर की आवृत्ति से दोगुने पर काम किया, जो ज्यामिति की गणना के लिए जिम्मेदार था, लेकिन कुछ GTX ४८० की समग्र तस्वीर इससे बहुत भिन्न नहीं है। कोई भी 780, एसएम मल्टीप्रोसेसरों को क्लस्टर में जोड़ा जाता है, क्लस्टर मेमोरी नियंत्रकों के साथ साझा कैश के माध्यम से संचार करते हैं, और काम के परिणाम क्लस्टर के लिए एक सामान्य रास्टरराइजेशन इकाई द्वारा आउटपुट होते हैं:


GTX 480 में प्रयुक्त GF100 प्रोसेसर का ब्लॉक आरेख।

500 वीं श्रृंखला में, वही फर्मी थी, "अंदर" और कम दोषों के साथ थोड़ा सुधार हुआ, इसलिए शीर्ष समाधानों को पिछली पीढ़ी से 480 के बजाय 512 CUDA कोर प्राप्त हुए। नेत्रहीन, फ़्लोचार्ट आमतौर पर जुड़वाँ लगते हैं:


GF110 GTX 580 का दिल है।

कुछ जगहों पर हमने फ़्रीक्वेंसी बढ़ाई, चिप के डिज़ाइन को थोड़ा बदल दिया, कोई क्रांति नहीं हुई। ३८४-बिट बस में सभी समान ४० एनएम प्रक्रिया प्रौद्योगिकी और १.५ जीबी वीडियो मेमोरी।

केपलर

केपलर वास्तुकला के आगमन के साथ, बहुत कुछ बदल गया है। हम कह सकते हैं कि यह वह पीढ़ी थी जिसने NVIDIA वीडियो कार्ड को विकास वेक्टर दिया जिससे वर्तमान मॉडलों का उदय हुआ। न केवल GPU का आर्किटेक्चर बदल गया है, बल्कि NVIDIA के अंदर नए हार्डवेयर विकसित करने का किचन भी बदल गया है। जबकि फर्मी एक ऐसे समाधान की तलाश में था जो उच्च प्रदर्शन प्रदान करता हो, केप्लर ऊर्जा दक्षता, संसाधन दक्षता, उच्च आवृत्तियों और उच्च प्रदर्शन वास्तुकला के लिए गेम इंजन को अनुकूलित करने में आसानी पर निर्भर था।

GPU डिज़ाइन में गंभीर परिवर्तन किए गए थे: उन्होंने "फ्लैगशिप" GF100 / GF110 नहीं, बल्कि "बजट" GF104 / GF114 लिया, जिसका उपयोग उस समय के सबसे लोकप्रिय कार्डों में से एक - GTX 460 में किया गया था।


चार एकीकृत शेडर मल्टीप्रोसेसर इकाइयों के साथ केवल दो बड़े ब्लॉक का उपयोग करके समग्र प्रोसेसर आर्किटेक्चर को सरल बनाया गया है। नए फ़्लैगशिप का लेआउट इस तरह दिखता था:


GK104 GTX 680 में स्थापित है।

जैसा कि आप देख सकते हैं, प्रत्येक कम्प्यूटेशनल इकाइयों ने पिछले आर्किटेक्चर के सापेक्ष वजन में काफी वृद्धि की है, और इसे एसएमएक्स नाम दिया गया था। ब्लॉक संरचना की तुलना फर्मी सेक्शन में ऊपर दिखाए गए से करें।


GK104 GPU SMX मल्टीप्रोसेसर

छह सौवीं श्रृंखला में एक पूर्ण प्रोसेसर पर वीडियो कार्ड नहीं थे जिसमें कम्प्यूटेशनल मॉड्यूल के छह ब्लॉक थे, फ्लैगशिप GTX 680 स्थापित GK104 के साथ था, और इससे कूलर केवल "दो-सिर वाला" 690 था, जिस पर बस सभी आवश्यक हार्नेस और मेमोरी वाले दो प्रोसेसर तलाकशुदा थे। एक साल बाद, मामूली बदलाव के साथ फ्लैगशिप GTX 680 GTX 770 में बदल गया, और केपलर आर्किटेक्चर के विकास का ताज GK110 क्रिस्टल पर आधारित वीडियो कार्ड था: GTX टाइटन और टाइटन Z, 780Ti और सामान्य 780। अंदर - वही 28 नैनोमीटर, एकमात्र गुणात्मक सुधार (जो GK110 पर आधारित उपभोक्ता वीडियो कार्ड में नहीं गया है) - दोहरे सटीक संचालन के साथ प्रदर्शन।

मैक्सवेल

मैक्सवेल आर्किटेक्चर पर आधारित पहला ग्राफिक्स कार्ड था ... NVIDIA GTX 750Ti। थोड़ी देर बाद, इसकी ट्रिमिंग जीटीएक्स 750 और 745 के चेहरे पर दिखाई दी (इसे केवल एक एकीकृत समाधान के रूप में आपूर्ति की गई थी), और उपस्थिति के समय, छोटे कार्डों ने वास्तव में सस्ती वीडियो त्वरक के लिए बाजार को हिलाकर रख दिया। GK107 चिप पर नए आर्किटेक्चर का परीक्षण किया गया था: भविष्य के फ़्लैगशिप का एक छोटा सा टुकड़ा जिसमें विशाल हीट सिंक और एक भयावह कीमत है। यह कुछ इस तरह दिखता था:


हां, केवल एक कंप्यूटिंग इकाई है, लेकिन यह अपने पूर्ववर्ती की तुलना में कितनी अधिक जटिल है, अपने लिए तुलना करें:


GPU के निर्माण में मूल बिल्डिंग ब्लॉक के रूप में उपयोग किए गए बड़े SMX ब्लॉक के बजाय, नए, अधिक कॉम्पैक्ट SMM ब्लॉक का उपयोग किया जाता है। केप्लर की बुनियादी कंप्यूटिंग इकाइयाँ अच्छी थीं, लेकिन खराब क्षमता उपयोग से पीड़ित थीं - निर्देशों के लिए एक सामान्य भूख: सिस्टम बड़ी संख्या में कार्यकारी तत्वों पर निर्देशों को बिखेर नहीं सकता था। पेंटियम 4 में लगभग समान समस्याएं थीं: बिजली निष्क्रिय थी, और शाखा भविष्यवाणी में त्रुटि बहुत महंगी थी। मैक्सवेल में, प्रत्येक कम्प्यूटेशनल मॉड्यूल को चार भागों में विभाजित किया गया था, जिनमें से प्रत्येक को अपने स्वयं के निर्देश बफर और एक वार्प शेड्यूलर आवंटित किया गया था - धागे के समूह पर एक ही प्रकार का संचालन। नतीजतन, दक्षता में वृद्धि हुई है, और ग्राफिक्स प्रोसेसर स्वयं अपने पूर्ववर्तियों की तुलना में अधिक लचीले हो गए हैं, और सबसे महत्वपूर्ण बात यह है कि, थोड़े से रक्त और काफी सरल क्रिस्टल की कीमत पर, उन्होंने एक नई वास्तुकला पर काम किया। कहानी एक सर्पिल में विकसित होती है, हे।

नवाचारों से मोबाइल समाधानों को सबसे अधिक लाभ हुआ है: मरने का क्षेत्र एक चौथाई बढ़ गया है, और मल्टीप्रोसेसरों की निष्पादन इकाइयों की संख्या लगभग दोगुनी हो गई है। भाग्य के रूप में, यह 700 वीं और 800 वीं श्रृंखला थी जिसने वर्गीकरण में मुख्य गड़बड़ी की। अकेले 700 के अंदर, केप्लर, मैक्सवेल और यहां तक ​​कि फर्मी आर्किटेक्चर पर आधारित वीडियो कार्ड थे! यही कारण है कि डेस्कटॉप मैक्सवेल, पिछली पीढ़ियों में गड़बड़ी से दूर जाने के लिए, एक सामान्य 900 श्रृंखला प्राप्त की, जिसमें से मोबाइल जीटीएक्स 9xx एम कार्ड बाद में बंद हो गए।

पास्कल - मैक्सवेल वास्तुकला का तार्किक विकास

केप्लर में जो रखा गया था और मैक्सवेल पीढ़ी में जारी रहा वह पास्कल में भी बना रहा: पहला उपभोक्ता वीडियो कार्ड बहुत बड़ी GP104 चिप के आधार पर जारी नहीं किया गया था, जिसमें चार ग्राफिक्स प्रोसेसिंग क्लस्टर होते हैं। पूर्ण आकार, छह-क्लस्टर GP100 TITAN X ब्रांड नाम के तहत एक महंगे अर्ध-पेशेवर GPU के पास गया। हालाँकि, "कट-ऑफ" 1080 भी इतना प्रज्वलित करता है कि पिछली पीढ़ियों को बुरा लगता है।

प्रदर्शन में सुधार

मूल बातें की नींव

मैक्सवेल नई वास्तुकला की नींव बन गया, तुलनीय प्रोसेसर (GM104 और GP104) का आरेख लगभग समान दिखता है, मुख्य अंतर क्लस्टर में पैक किए गए मल्टीप्रोसेसरों की संख्या है। केप्लर (700वीं पीढ़ी) में दो बड़े एसएमएक्स मल्टीप्रोसेसर थे, जिन्हें मैक्सवेल में प्रत्येक 4 भागों में विभाजित किया गया था, जो आवश्यक हार्नेस (नाम बदलकर एसएमएम) से लैस थे। पास्कल में, ब्लॉक में मौजूदा आठ में दो और जोड़े गए, इसलिए उनमें से 10 थे, और संक्षिप्त नाम एक बार फिर बाधित हो गया था: अब एकल मल्टीप्रोसेसरों को फिर से एसएम कहा जाता है।


बाकी एक पूर्ण दृश्य समानता है। सच है, अंदर और भी बदलाव हैं।

प्रगति का इंजन

मल्टीप्रोसेसर के ब्लॉक के अंदर बहुत सारे बदलाव होते हैं। क्या किया गया था, इसे कैसे अनुकूलित किया गया था और यह पहले कैसे था, इसके बारे में बहुत उबाऊ विवरण में नहीं जाने के लिए, मैं परिवर्तनों का संक्षेप में वर्णन करूंगा, अन्यथा कुछ पहले से ही जम्हाई ले रहे हैं।

सबसे पहले, पास्कल ने उस हिस्से को ठीक किया जो चित्र के ज्यामितीय घटक के लिए जिम्मेदार है। मल्टी-मॉनिटर कॉन्फ़िगरेशन और वीआर हेडसेट के साथ काम करने के लिए यह आवश्यक है: गेम इंजन से उचित समर्थन के साथ (और एनवीआईडीआईए के प्रयासों के लिए धन्यवाद, यह समर्थन जल्द ही दिखाई देगा), एक वीडियो कार्ड एक बार ज्यामिति की गणना कर सकता है और प्रत्येक के लिए कई ज्यामिति अनुमान प्राप्त कर सकता है। स्क्रीन के। यह वीआर में लोड को काफी कम करता है, न केवल त्रिकोण के साथ काम करने के क्षेत्र में (यहां लाभ सिर्फ दो गुना है), बल्कि पिक्सेल घटक के साथ काम करने में भी।

सशर्त 980Ti ज्यामिति को दो बार (प्रत्येक आंख के लिए) पढ़ेगा, और फिर इसे बनावट से भर देगा और प्रत्येक छवि के लिए पोस्ट-प्रोसेसिंग करेगा, कुल 4.2 मिलियन अंक संसाधित करेगा, जिसमें से लगभग 70% वास्तव में उपयोग किया जाएगा, बाकी काट दिया जाएगा या उस क्षेत्र में गिर जाएगा, जो बस प्रत्येक आंख के लिए प्रदर्शित नहीं होता है।

1080 एक बार ज्यामिति को संसाधित करेगा, और अंतिम छवि में शामिल नहीं किए जाने वाले पिक्सेल की गणना नहीं की जाएगी।


पिक्सेल घटक के साथ, सब कुछ वास्तव में और भी ठंडा है। चूंकि मेमोरी बैंडविड्थ में वृद्धि केवल दो मोर्चों (प्रति घड़ी आवृत्ति और बैंडविड्थ में वृद्धि) पर की जा सकती है, और दोनों तरीकों में पैसा खर्च होता है, और मेमोरी के लिए GPU "भूख" वृद्धि के कारण वर्षों से अधिक स्पष्ट है। संकल्प और वीआर के विकास में बैंडविड्थ बढ़ाने के "मुक्त" तरीकों में सुधार होता है। यदि आप बस का विस्तार और आवृत्ति नहीं बढ़ा सकते हैं, तो आपको डेटा को संपीड़ित करने की आवश्यकता है। पिछली पीढ़ियों में, हार्डवेयर संपीड़न पहले से ही लागू किया गया था, लेकिन पास्कल इसे अगले स्तर पर ले गया है। फिर से, हम बिना उबाऊ गणित के कर सकते हैं और NVIDIA से तैयार उदाहरण ले सकते हैं। बाईं ओर - मैक्सवेल, दाईं ओर - पास्कल, वे बिंदु, जिनके रंग घटक गुणवत्ता के नुकसान के बिना संकुचित थे, गुलाबी रंग से भरे हुए हैं।


8x8 अंक की विशिष्ट टाइलों को स्थानांतरित करने के बजाय, मेमोरी में "औसत" रंग + इससे विचलन का एक मैट्रिक्स होता है, ऐसा डेटा प्रारंभिक मात्रा के ½ से तक होता है। वास्तविक कार्यों में, स्क्रीन पर जटिल दृश्यों में ग्रेडिएंट की संख्या और भरण की एकरूपता के आधार पर, मेमोरी सबसिस्टम पर लोड 10 से 30% तक कम हो जाता है।


यह इंजीनियरों के लिए पर्याप्त नहीं था, और फ्लैगशिप वीडियो कार्ड (GTX 1080) के लिए, बढ़ी हुई बैंडविड्थ के साथ मेमोरी का उपयोग किया गया था: GDDR5X प्रति घड़ी दो बार कई डेटा बिट्स (निर्देश नहीं) प्रसारित करता है, और 10 Gbit / s से अधिक आउटपुट करता है। शिखर। इतनी तेज गति से डेटा ट्रांसफर करने के लिए बोर्ड पर मेमोरी लेआउट के पूरी तरह से नए लेआउट की आवश्यकता होती है, और कुल मिलाकर, पिछली पीढ़ी के फ़्लैगशिप की तुलना में मेमोरी के साथ काम करने की दक्षता में 60-70% की वृद्धि हुई है।

कम विलंबता और क्षमता डाउनटाइम

वीडियो कार्ड लंबे समय से न केवल ग्राफिक्स प्रसंस्करण, बल्कि संबंधित गणनाओं में भी शामिल हैं। भौतिकी अक्सर एनीमेशन फ्रेम से जुड़ी होती है और उल्लेखनीय रूप से समानांतर होती है, जिसका अर्थ है कि इसकी गणना GPU पर अधिक कुशलता से की जाती है। लेकिन हाल के वर्षों में वीआर उद्योग समस्याओं का सबसे बड़ा जनरेटर बन गया है। कई गेम इंजन, विकास के तरीके और ग्राफिक्स के साथ काम करने के लिए उपयोग की जाने वाली अन्य तकनीकों का एक समूह केवल वीआर के लिए डिज़ाइन नहीं किया गया था, कैमरा आंदोलन या रेंडरिंग प्रक्रिया के दौरान उपयोगकर्ता के सिर की स्थिति में परिवर्तन का मामला बस संभाला नहीं गया था। यदि आप सब कुछ वैसे ही छोड़ देते हैं, तो वीडियो स्ट्रीम और आपके आंदोलनों के डिसिंक्रनाइज़ेशन से समुद्री हमले होंगे और खेल की दुनिया में विसर्जन में बाधा उत्पन्न होगी, जिसका अर्थ है कि आपको ड्राइंग और शुरू करने के बाद बस "गलत" फ्रेम को बाहर निकालना होगा। ऊपर। और डिस्प्ले पर छवियों को प्रदर्शित करने में ये नई देरी हैं। इसका प्रदर्शन पर सकारात्मक प्रभाव नहीं पड़ता है।

पास्कल ने इस समस्या को ध्यान में रखा और डायनेमिक लोड बैलेंसिंग और एसिंक्रोनस इंटरप्ट की संभावना को पेश किया: अब निष्पादन इकाइयाँ या तो वर्तमान कार्य को बाधित कर सकती हैं (कैश में काम के परिणामों को सहेजना) अधिक जरूरी कार्यों को संसाधित करने के लिए, या बस अंडर-रेंडर को छोड़ दें फ्रेम करें और एक नई शुरुआत करें, छवि निर्माण में विलंबता को काफी कम कर दें। यहां मुख्य लाभार्थी, निश्चित रूप से, वीआर और गेम हैं, लेकिन सामान्य-उद्देश्य की गणना के साथ भी, यह तकनीक मदद कर सकती है: कण टकराव के अनुकरण ने 10-20% की प्रदर्शन वृद्धि प्राप्त की है।

बूस्ट 3.0

NVIDIA वीडियो कार्ड की स्वचालित ओवरक्लॉकिंग बहुत पहले प्राप्त हुई थी, केपलर वास्तुकला पर आधारित 700 वीं पीढ़ी में। मैक्सवेल में ओवरक्लॉकिंग में सुधार किया गया था, लेकिन इसे अभी भी हल्के ढंग से रखना था: हां, वीडियो कार्ड ने थोड़ी तेजी से काम किया, जब तक कि गर्मी पैकेज ने इसकी अनुमति दी, कारखाने से अतिरिक्त 20-30 मेगाहर्ट्ज़ कोर में तारित और स्मृति में 50-100 ने वृद्धि दी, लेकिन ज्यादा नहीं ... यह इस तरह काम किया:


जीपीयू तापमान में अंतर होने पर भी प्रदर्शन में वृद्धि नहीं हुई। पास्कल के आने से इंजीनियरों ने इस धूल भरे दलदल को झकझोर कर रख दिया है. बूस्ट 3.0 तीन मोर्चों पर काम करता है: तापमान विश्लेषण, ओवरक्लॉकिंग और ऑन-चिप वोल्टेज बूस्ट। अब सभी रस GPU से बाहर निकल गए हैं: मानक NVIDIA ड्राइवर ऐसा नहीं करते हैं, लेकिन विक्रेता का सॉफ़्टवेयर आपको एक क्लिक में प्रोफाइलिंग कर्व बनाने की अनुमति देता है, जो आपके विशेष वीडियो कार्ड की गुणवत्ता को ध्यान में रखेगा।

इस क्षेत्र में सबसे पहले में से एक ईवीजीए था, इसकी प्रेसिजन एक्सओसी उपयोगिता में एक प्रमाणित एनवीआईडीआईए स्कैनर है, जो लगातार तापमान, आवृत्तियों और वोल्टेज की पूरी श्रृंखला से गुजरता है, सभी मोड में अधिकतम प्रदर्शन प्राप्त करता है।

इसमें एक नई तकनीकी प्रक्रिया, हाई-स्पीड मेमोरी, सभी प्रकार के अनुकूलन और चिप्स के थर्मल पैकेज में कमी जोड़ें, और परिणाम केवल अशोभनीय होगा। GTX 1060 में 1500 "बेस" मेगाहर्ट्ज से, आप 2000 मेगाहर्ट्ज से अधिक निचोड़ सकते हैं, अगर आपको एक अच्छी कॉपी मिलती है, और विक्रेता कूलिंग के साथ खराब नहीं होता है।

खेल की दुनिया की तस्वीर की गुणवत्ता और धारणा में सुधार

सभी मोर्चों पर प्रदर्शन में वृद्धि हुई है, लेकिन ऐसे कई बिंदु हैं जिनमें कई वर्षों से कोई गुणात्मक परिवर्तन नहीं हुआ है: प्रदर्शित छवि की गुणवत्ता। और हम ग्राफिक प्रभावों के बारे में बात नहीं कर रहे हैं, वे गेम डेवलपर्स द्वारा प्रदान किए जाते हैं, लेकिन हम मॉनिटर पर वास्तव में क्या देखते हैं और अंतिम उपभोक्ता के लिए गेम कैसा दिखता है।

तेज़ लंबवत सिंक

पास्कल की सबसे महत्वपूर्ण विशेषता ट्रिपल फ्रेम आउटपुट बफर है, जो एक साथ रेंडरिंग में अल्ट्रा-लो लेटेंसी प्रदान करता है और वर्टिकल सिंक्रोनाइज़ेशन सुनिश्चित करता है। एक बफर आउटपुट इमेज को स्टोर करता है, दूसरा - अंतिम रेंडर फ्रेम, तीसरा - करंट वाला। अलविदा क्षैतिज धारियों और फाड़, हैलो उच्च प्रदर्शन। इसमें कोई देरी नहीं है कि क्लासिक वी-सिंक यहां सूट करता है (चूंकि कोई भी वीडियो कार्ड के प्रदर्शन को रोक नहीं रहा है और यह हमेशा उच्चतम संभव फ्रेम दर पर खींचता है), और केवल पूरी तरह से गठित फ्रेम मॉनिटर को भेजे जाते हैं। मुझे लगता है कि नए साल के बाद मैं वी-सिंक, जी-सिंक, फ्री-सिंक और एनवीडिया के इस नए फास्ट सिंक एल्गोरिदम के बारे में एक अलग बड़ी पोस्ट लिखूंगा, बहुत सारे विवरण।

सामान्य स्क्रीनशॉट

नहीं, वे स्क्रीनशॉट जो अब केवल शर्म की बात हैं। लगभग सभी गेम तस्वीरों को गतिमान और लुभावनी बनाने के लिए तकनीकों के एक समूह का उपयोग करते हैं, और स्क्रीनशॉट एक वास्तविक दुःस्वप्न बन जाते हैं: आश्चर्यजनक यथार्थवादी तस्वीर के बजाय, जिसमें एनीमेशन, विशेष प्रभाव होते हैं जो मानव दृष्टि की विशेषताओं का फायदा उठाते हैं, आप कुछ देखते हैं अजीब रंगों और पूरी तरह से बेजान तस्वीर के साथ कोणीय नेपोनी की तरह।

नई NVIDIA Ansel तकनीक स्क्रीन के साथ समस्या का समाधान करती है। हां, इसके कार्यान्वयन के लिए गेम डेवलपर्स से विशेष कोड के एकीकरण की आवश्यकता होती है, लेकिन कम से कम वास्तविक जोड़तोड़ होते हैं, लेकिन लाभ बहुत बड़ा होता है। Ansel खेल को रोक सकता है, कैमरा नियंत्रण आपके हाथों में स्थानांतरित कर सकता है, और फिर रचनात्मकता की गुंजाइश है। आप बिना GUI और अपनी पसंद के कोण के बिना बस एक शॉट ले सकते हैं।


आप मौजूदा दृश्य को अल्ट्रा-हाई रेजोल्यूशन में प्रस्तुत कर सकते हैं, 360-डिग्री पैनोरमा शूट कर सकते हैं, उन्हें एक प्लेन में सिलाई कर सकते हैं, या उन्हें VR हेडसेट में देखने के लिए 3D में छोड़ सकते हैं। 16 बिट प्रति चैनल के साथ एक फोटो लें, इसे एक तरह की रॉ फाइल में सेव करें, और फिर एक्सपोजर, व्हाइट बैलेंस और अन्य सेटिंग्स के साथ खेलें ताकि स्क्रीनशॉट फिर से आकर्षक हो जाएं। हम एक या दो साल में खेल प्रशंसकों से ढेर सारी शानदार सामग्री की प्रतीक्षा कर रहे हैं।

वीडियो कार्ड पर ध्वनि प्रसंस्करण

नई NVIDIA Gameworks लाइब्रेरी डेवलपर्स के लिए उपलब्ध कई सुविधाएँ जोड़ती हैं। वे मुख्य रूप से वीआर और विभिन्न गणनाओं के त्वरण के साथ-साथ तस्वीर की गुणवत्ता में सुधार के उद्देश्य से हैं, लेकिन सुविधाओं में से एक सबसे दिलचस्प और उल्लेख के योग्य है। VRWorks ऑडियो ध्वनि के साथ काम को मौलिक रूप से नए स्तर पर ले जाता है, ध्वनि को बाधा की दूरी और मोटाई के आधार पर, सामान्य औसत सूत्रों के अनुसार नहीं माना जाता है, लेकिन ध्वनि सिग्नल का एक पूरा ट्रेस करता है, पर्यावरण से सभी प्रतिबिंबों के साथ, पुनर्संयोजन और विभिन्न सामग्रियों में ध्वनि अवशोषण। NVIDIA का एक अच्छा वीडियो उदाहरण है कि यह तकनीक कैसे काम करती है:


हेडफ़ोन के साथ बेहतर दिखें

विशुद्ध रूप से सैद्धांतिक रूप से, कुछ भी आपको मैक्सवेल पर इस तरह के सिमुलेशन को चलाने से नहीं रोकता है, लेकिन अतुल्यकालिक निर्देश निष्पादन के लिए अनुकूलन और पास्कल में निर्मित नई इंटरप्ट सिस्टम आपको फ्रेम दर को प्रभावित किए बिना गणना करने की अनुमति देता है।

कुल मिलाकर पास्कल

वास्तव में, और भी बदलाव हैं, और उनमें से कई वास्तुकला में इतने गहरे हैं कि आप उनमें से प्रत्येक पर एक बड़ा लेख लिख सकते हैं। प्रमुख नवाचारों में स्वयं चिप्स का बेहतर डिज़ाइन, ज्यामिति के मामले में निम्नतम स्तर पर अनुकूलन और पूर्ण रुकावट से निपटने के साथ अतुल्यकालिक कार्य, उच्च रिज़ॉल्यूशन और वीआर के साथ काम करने के लिए तैयार की गई कई विशेषताएं हैं, और निश्चित रूप से, पागल आवृत्तियों का सपना नहीं देखा गया था वीडियो कार्ड की पिछली पीढ़ियों द्वारा। दो साल पहले, 780 तिवारी ने मुश्किल से 1 गीगाहर्ट्ज़ लाइन को पार किया था, आज 1080 कई मामलों में दो पर काम करता है: और यहाँ योग्यता केवल 28 एनएम से 16 या 14 एनएम तक कम प्रक्रिया प्रौद्योगिकी में नहीं है: कई चीजें अनुकूलित हैं सबसे निचले स्तर पर, ट्रांजिस्टर के डिजाइन से शुरू होकर, उनकी टोपोलॉजी के साथ समाप्त होता है और चिप के अंदर ही स्ट्रैपिंग होता है।

प्रत्येक व्यक्तिगत मामले के लिए

NVIDIA 10-श्रृंखला वीडियो कार्ड की लाइन वास्तव में संतुलित निकली, और "प्ले इन स्ट्रैटेजी एंड डायब्लो" से "आई वांट टॉप गेम्स इन 4k" तक, सभी गेमिंग उपयोग के मामलों को काफी कसकर कवर करती है। खेल परीक्षणों को एक सरल तकनीक के अनुसार चुना गया था: परीक्षणों के सबसे छोटे संभव सेट के साथ यथासंभव बड़े परीक्षणों को कवर करने के लिए। BF1 अच्छे अनुकूलन का एक बेहतरीन उदाहरण है और आपको समान परिस्थितियों में DX12 के विरुद्ध DX11 के प्रदर्शन की तुलना करने की अनुमति देता है। DOOM को उसी कारण से चुना गया है, केवल यह आपको OpenGL और Vulkan की तुलना करने की अनुमति देता है। यहां तीसरा "विचर" एक इतने अनुकूलित खिलौने के रूप में कार्य करता है, जिसमें अधिकतम ग्राफिक्स सेटिंग्स किसी भी फ्लैगशिप को केवल शिट कोड की शक्ति से खराब करने की अनुमति देती हैं। यह क्लासिक DX11 का उपयोग करता है, जो समय-परीक्षण है और ड्राइवरों में पूरी तरह से काम करता है और गेम डेवलपर्स से परिचित है। ओवरवॉच सभी "टूर्नामेंट" खेलों के लिए उड़ा दिया गया है जिसमें कोड अच्छी तरह से अनुकूलित है, वास्तव में यह दिलचस्प है कि औसत एफपीएस कितना अधिक ग्राफिक रूप से भारी गेम में नहीं है, जो "औसत" कॉन्फ़िगरेशन में काम करने के लिए तेज है। दुनिया।

मैं तुरंत कुछ सामान्य टिप्पणियां दूंगा: वीडियो मेमोरी के मामले में वल्कन बहुत पेटू है, इसके लिए यह विशेषता मुख्य संकेतकों में से एक है, और आप इस थीसिस को बेंचमार्क में परिलक्षित देखेंगे। AMD कार्ड पर DX12 NVIDIA कार्ड की तुलना में बहुत बेहतर व्यवहार करता है, यदि "ग्रीन" वाले नए API पर FPS में औसतन गिरावट दिखाते हैं, तो "लाल" वाले, इसके विपरीत, वृद्धि दिखाते हैं।

जूनियर डिवीजन

जीटीएक्स 1050

छोटा NVIDIA (Ti अक्षरों के बिना) उतना दिलचस्प नहीं है, जितना कि Ti अक्षर वाली इसकी चार्ज बहन। इसका भाग्य MOBA गेम्स, रणनीतियों, टूर्नामेंट निशानेबाजों और अन्य खेलों के लिए एक गेमिंग समाधान है, जहां तस्वीर का विवरण और गुणवत्ता किसी के लिए बहुत कम रुचिकर है, और न्यूनतम पैसे के लिए एक स्थिर फ्रेम दर वह है जो डॉक्टर ने आदेश दिया था।


सभी चित्रों में मूल आवृत्ति का अभाव होता है, क्योंकि यह प्रत्येक उदाहरण के लिए अलग-अलग होता है: अतिरिक्त के बिना 1050। बिजली की आपूर्ति का पीछा नहीं हो सकता है, और उसकी बहन 6-पिन कनेक्टर के साथ आसानी से सशर्त 1.9 गीगाहर्ट्ज ले सकती है। बिजली की आपूर्ति और लंबाई के संदर्भ में, सबसे लोकप्रिय विकल्प दिखाए जाते हैं, आप हमेशा एक अलग सर्किट या अन्य शीतलन के साथ एक वीडियो कार्ड पा सकते हैं जो निर्दिष्ट "मानकों" में फिट नहीं होता है।

कयामत २०१६ (१०८०पी, अल्ट्रा): ओपनजीएल - ६८ एफपीएस, वल्कन - ५५ एफपीएस;
द विचर 3: वाइल्ड हंट (1080p, MAX, हेयरवर्क्स ऑफ): DX11 - 38 FPS;
बैटलफील्ड 1 (1080p, ULTRA): DX11 - 49 FPS, DX12 - 40 FPS;
ओवरवॉच (1080p, ULTRA): DX11 - 93 FPS;

GTX 1050 में GP107 ग्राफिक्स प्रोसेसर है, जो पुराने कार्ड से विरासत में मिला है जिसमें कार्यात्मक ब्लॉक का एक छोटा सा कट है। 2 जीबी की वीडियो मेमोरी आपको घूमने की अनुमति नहीं देगी, लेकिन ई-स्पोर्ट्स विषयों और किसी प्रकार के टैंक खेलने के लिए, यह एकदम सही है, क्योंकि जूनियर कार्ड की कीमत 9.5 हजार रूबल से शुरू होती है। अतिरिक्त शक्ति की आवश्यकता नहीं है, पीसीआई-एक्सप्रेस स्लॉट के माध्यम से वीडियो कार्ड को मदरबोर्ड से 75 वाट की आवश्यकता होती है। सच है, इस मूल्य खंड में एक AMD Radeon RX460 भी है, जो समान 2 GB मेमोरी के साथ सस्ता है, और काम की गुणवत्ता लगभग हीन नहीं है, और उसी पैसे के लिए आप RX460 प्राप्त कर सकते हैं, लेकिन एक में 4 जीबी संस्करण। ऐसा नहीं है कि उन्होंने उसकी बहुत मदद की, लेकिन भविष्य के लिए किसी तरह का रिजर्व। विक्रेता की पसंद इतनी महत्वपूर्ण नहीं है, आप जो उपलब्ध है उसे ले सकते हैं और अतिरिक्त हजार रूबल के साथ अपनी जेब में देरी नहीं करते हैं, जो कि पोषित पत्रों पर बेहतर खर्च किया जाता है।

GTX 1050 Ti

सामान्य 1050 के लिए लगभग 10 हजार बुरा नहीं है, लेकिन चार्ज किए गए (या पूर्ण रूप से, इसे जो आप चाहते हैं उसे कॉल करें) संस्करण के लिए वे बहुत अधिक नहीं (औसतन, 1-1.5 हजार अधिक) मांगते हैं, लेकिन इसकी फिलिंग बहुत अधिक है अधिक दिलचस्प। वैसे, पूरी 1050 श्रृंखला "बड़े" चिप्स को काटने / अस्वीकार करने से नहीं बनती है, जो 1060 के लिए उपयुक्त नहीं हैं, बल्कि पूरी तरह से स्वतंत्र उत्पाद के रूप में हैं। इसमें एक कम प्रक्रिया प्रौद्योगिकी (14 एनएम), एक अलग संयंत्र (सैमसंग कारखाने द्वारा क्रिस्टल उगाए जाते हैं), और अतिरिक्त के साथ बेहद दिलचस्प नमूने हैं। बिजली की आपूर्ति: थर्मल पैकेज और बुनियादी खपत अभी भी वही 75 डब्ल्यू है, लेकिन ओवरक्लॉकिंग क्षमता और जो अनुमति दी गई है उससे आगे जाने की क्षमता पूरी तरह से अलग है।


यदि आप फुलएचडी (1920x1080) रिज़ॉल्यूशन पर खेलना जारी रखते हैं, तो अपग्रेड करने की योजना न बनाएं, और 3-5 साल पहले का आपका बचा हुआ हार्डवेयर थोड़े से खून वाले खिलौनों में प्रदर्शन बढ़ाने का एक शानदार तरीका है। आपको अतिरिक्त 6-पिन बिजली की आपूर्ति के साथ ASUS और MSI समाधानों पर ध्यान केंद्रित करना चाहिए, गीगाबाइट के विकल्प खराब नहीं हैं, लेकिन कीमत इतनी सुखद नहीं है।

कयामत २०१६ (१०८०पी, अल्ट्रा): ओपनजीएल - ८३ एफपीएस, वल्कन - ७८ एफपीएस;
द विचर 3: वाइल्ड हंट (1080p, MAX, हेयरवर्क्स ऑफ): DX11 - 44 FPS;
बैटलफील्ड 1 (1080p, ULTRA): DX11 - 58 FPS, DX12 - 50 FPS;
ओवरवॉच (1080p, ULTRA): DX11 - 104 FPS।

मध्य विभाजन

60 वीं पंक्ति के वीडियो कार्ड को लंबे समय से उन लोगों के लिए सबसे अच्छा विकल्प माना जाता है जो बहुत सारा पैसा खर्च नहीं करना चाहते हैं और साथ ही अगले कुछ वर्षों में जारी होने वाली हर चीज में उच्च ग्राफिक्स सेटिंग्स पर खेलते हैं। यह GTX 260 के दिनों में वापस शुरू हुआ, जिसके दो संस्करण थे (सरल, 192 स्ट्रीम प्रोसेसर, और मोटा, 216 "स्टोन्स"), 400, 500 और 700 पीढ़ियों में जारी रहा, और अब NVIDIA फिर से लगभग पूर्ण हो गया। संयोजन मूल्य और गुणवत्ता। "मिड्रेंज" के दो संस्करण फिर से उपलब्ध हैं: जीटीएक्स 1060 3 और 6 जीबी वीडियो मेमोरी के साथ न केवल उपलब्ध रैम की मात्रा में, बल्कि प्रदर्शन में भी भिन्न है।

जीटीएक्स 1060 3 जीबी

एस्पोर्ट्स की रानी। उचित मूल्य, फुलएचडी के लिए अद्भुत प्रदर्शन (और ई-स्पोर्ट्स में वे शायद ही कभी उच्च रिज़ॉल्यूशन का उपयोग करते हैं: परिणाम वहां अधिक महत्वपूर्ण होते हैं), उचित मात्रा में मेमोरी (एक मिनट के लिए 3 जीबी, दो साल पहले फ्लैगशिप जीटीएक्स 780 टीआई में थी, जिसमें अशोभनीय पैसा खर्च होता है)। प्रदर्शन के मामले में, छोटा 1060 आसानी से पिछले साल के जीटीएक्स 970 पर हमेशा यादगार 3.5 जीबी मेमोरी के साथ ढेर हो जाता है, और कानों से 780 टीआई सुपरफ्लैगमैन को आसानी से खींच लेता है।


कयामत 2016 (1080p, अल्ट्रा): ओपनजीएल - 117 एफपीएस, वल्कन - 87 एफपीएस;
द विचर 3: वाइल्ड हंट (1080p, MAX, हेयरवर्क्स ऑफ): DX11 - 70 FPS;
बैटलफील्ड 1 (1080p, ULTRA): DX11 - 92 FPS, DX12 - 85 FPS;
ओवरवॉच (1080p, ULTRA): DX11 - 93 FPS।

यहां मूल्य-से-उत्सर्जन अनुपात के मामले में निर्विवाद पसंदीदा एमएसआई का संस्करण है। सभ्य आवृत्तियों, शांत शीतलन प्रणाली और समझदार आयाम। वे 15 हजार रूबल के क्षेत्र में कुछ भी नहीं मांगते हैं।

जीटीएक्स १०६० ६जीबी

6GB संस्करण VR और उच्च रिज़ॉल्यूशन के लिए एक बजट टिकट है। यह स्मृति में भूखा नहीं रहेगा, यह सभी परीक्षणों में थोड़ा तेज होगा और निश्चित रूप से जीटीएक्स 980 से बेहतर प्रदर्शन करेगा जहां पिछले साल के वीडियो कार्ड के लिए 4 जीबी वीडियो मेमोरी पर्याप्त नहीं है।


कयामत 2016 (1080p, अल्ट्रा): ओपनजीएल - 117 एफपीएस, वल्कन - 121 एफपीएस;
द विचर 3: वाइल्ड हंट (1080p, MAX, हेयरवर्क्स ऑफ): DX11 - 73 FPS;
बैटलफील्ड 1 (1080p, ULTRA): DX11 - 94 FPS, DX12 - 90 FPS;
ओवरवॉच (1080p, ULTRA): DX11 - 166 FPS।

वल्कन एपीआई का उपयोग करते समय मैं एक बार फिर वीडियो कार्ड के व्यवहार को नोट करना चाहूंगा। 1050 2 जीबी मेमोरी के साथ - एफपीएस ड्रॉडाउन। 4GB के साथ 1050 Ti लगभग बराबर है। १०६० ३ जीबी - ड्रॉडाउन। 1060 6 जीबी - परिणामों की वृद्धि। मुझे लगता है कि प्रवृत्ति स्पष्ट है: वल्कन के लिए आपको 4+ जीबी वीडियो मेमोरी की आवश्यकता है।

परेशानी यह है कि दोनों 1060 छोटे ग्राफिक्स कार्ड नहीं हैं। ऐसा लगता है कि गर्मी पैकेज उचित है, और बोर्ड वास्तव में छोटा है, लेकिन कई विक्रेताओं ने केवल 1080, 1070 और 1060 के बीच शीतलन प्रणाली को एकीकृत करने का निर्णय लिया है। किसी के पास वीडियो कार्ड 2 स्लॉट ऊंचाई में है, लेकिन 28+ सेंटीमीटर लंबा है, किसी ने उन्हें छोटा कर दिया, लेकिन मोटा (2.5 स्लॉट)। सावधानी से चुनें।

दुर्भाग्य से, अतिरिक्त 3 जीबी वीडियो मेमोरी और एक अनलॉक कंप्यूटिंग यूनिट की कीमत आपको 3-गीग संस्करण की कीमत से ~ 5-6 हजार रूबल अधिक होगी। ऐसे में कीमत और गुणवत्ता के मामले में पलित के पास सबसे दिलचस्प विकल्प हैं। ASUS ने राक्षसी 28-सेंटीमीटर कूलिंग सिस्टम जारी किए हैं जो 1080, 1070 और 1060 में ढल जाते हैं, और ऐसा वीडियो कार्ड ज्यादा फिट नहीं होता है, फैक्ट्री ओवरक्लॉकिंग के बिना संस्करणों की लागत लगभग समान होती है, और निकास कम होता है, और अपेक्षाकृत कॉम्पैक्ट MSI के लिए वे लगभग समान गुणवत्ता स्तर और फ़ैक्टरी ओवरक्लॉकिंग पर प्रतिस्पर्धा से अधिक माँगें।

मुख्य लीग

2016 में सारे पैसे के लिए खेलना मुश्किल है। हां, 1080 बहुत अच्छा है, लेकिन पूर्णतावादी और हार्डवेयर विशेषज्ञ जानते हैं कि एनवीआईडीआईए सुपर-फ्लैगशिप 1080 टीआई के अस्तित्व को छुपाता है, जो अविश्वसनीय रूप से अच्छा होना चाहिए। पहले स्पेक्स पहले से ही ऑनलाइन लीक हो रहे हैं, और यह स्पष्ट है कि ग्रीन्स लाल और सफेद से एक कदम दूर इंतजार कर रहे हैं: किसी प्रकार की उबेर-गन जिसे तुरंत 3 डी ग्राफिक्स के नए राजा द्वारा रखा जा सकता है, महान और शक्तिशाली GTX 1080 Ti। इस बीच, हमारे पास वही है जो हमारे पास है।

जीटीएक्स 1070

पिछले साल के मेगा-लोकप्रिय GTX 970 के कारनामों और इसकी गैर-ईमानदार-4-गीगाबाइट मेमोरी को सक्रिय रूप से हल किया गया और पूरे इंटरनेट पर चूसा गया। इसने इसे दुनिया में सबसे लोकप्रिय गेमिंग वीडियो कार्ड बनने से नहीं रोका। कैलेंडर पर वर्ष के परिवर्तन की प्रत्याशा में, यह स्टीम हार्डवेयर और सॉफ्टवेयर सर्वेक्षण में पहला स्थान रखता है। यह समझ में आता है: कीमत और प्रदर्शन का संयोजन एकदम सही था। और अगर आप पिछले साल के अपग्रेड से चूक गए हैं और 1060 आपके लिए पर्याप्त अच्छा नहीं है, तो GTX 1070 आपकी पसंद है।

संकल्प 2560x1440 और 3840x2160, वीडियो कार्ड एक धमाके के साथ पचता है। बूस्ट 3.0 ओवरक्लॉकिंग सिस्टम GPU पर लोड बढ़ने पर जलाऊ लकड़ी फेंकने की कोशिश करेगा (अर्थात, सबसे कठिन दृश्यों में, जब FPS विशेष प्रभावों के हमले के तहत बंद हो जाता है), वीडियो कार्ड प्रोसेसर को एक दिमागी उड़ाने के लिए ओवरक्लॉकिंग २१०० + मेगाहर्ट्ज। फ़ैक्टरी सेटिंग्स पर मेमोरी आसानी से प्रभावी आवृत्ति का 15-18% प्राप्त करती है। राक्षसी बात।


ध्यान दें, सभी परीक्षण 2.5k (2560x1440) में किए गए थे:

कयामत 2016 (1440पी, अल्ट्रा): ओपनजीएल - 91 एफपीएस, वल्कन - 78 एफपीएस;
द विचर 3: वाइल्ड हंट (1440p, MAX, हेयरवर्क्स ऑफ): DX11 - 73 FPS;
बैटलफील्ड 1 (1440p, ULTRA): DX11 - 91 FPS, DX12 - 83 FPS;
ओवरवॉच (1440p, ULTRA): DX11 - 142 FPS।

जाहिर है, 4k में अल्ट्रा-सेटिंग्स को खींचना और 60 फ्रेम प्रति सेकंड से नीचे कभी भी सैगिंग नहीं करना इस कार्ड या 1080 की शक्ति से परे है, लेकिन आप पूर्ण रिज़ॉल्यूशन में सबसे प्रचंड सुविधाओं को बंद या थोड़ा कम करके सशर्त "उच्च" सेटिंग्स पर खेल सकते हैं। , और वास्तविक प्रदर्शन के संदर्भ में, वीडियो कार्ड आसानी से पिछले साल के 980 Ti तक भी गर्मी सेट कर देता है, जिसकी कीमत लगभग दोगुनी है। गीगाबाइट के पास सबसे दिलचस्प विकल्प है: वे एक आईटीएक्स-मानक मामले में एक पूर्ण 1070 को रटने में कामयाब रहे। विनम्र थर्मल पैकेज और ऊर्जा कुशल डिजाइन के लिए धन्यवाद। स्वादिष्ट विकल्पों के लिए कार्ड की कीमतें 29-30 हजार रूबल से शुरू होती हैं।

जीटीएक्स 1080

हां, फ्लैगशिप में कोई Ti अक्षर नहीं है। हां, यह NVIDIA से उपलब्ध सबसे बड़े GPU का उपयोग नहीं करता है। हां, कोई बेहतरीन एचबीएम 2 मेमोरी नहीं है, और वीडियो कार्ड डेथ स्टार की तरह नहीं दिखता है या चरम मामलों में इंपीरियल स्टार डिस्ट्रॉयर-क्लास क्रूजर नहीं दिखता है। और हाँ, यह सबसे बढ़िया गेमिंग ग्राफिक्स कार्ड है। अल्ट्रा सेटिंग्स पर 60 फ्रेम प्रति सेकंड के साथ 5k3k रिज़ॉल्यूशन में DOOM लेता है और चलाता है। सभी नए खिलौने इसके अधीन हैं, और अगले एक या दो साल के लिए यह समस्याओं का अनुभव नहीं करेगा: जबकि पास्कल में शामिल नई प्रौद्योगिकियां व्यापक हो जाती हैं, जबकि गेम इंजन उपलब्ध संसाधनों को कुशलता से लोड करना सीखते हैं ... हां, कुछ में साल हम कहेंगे: "यहां, जीटीएक्स 1260 को देखें, कुछ साल पहले आपको इन सेटिंग्स के साथ खेलने के लिए एक फ्लैगशिप की आवश्यकता थी", लेकिन अभी के लिए - सबसे अच्छे वीडियो कार्ड नए साल से पहले बहुत ही उचित पर उपलब्ध हैं कीमत।


ध्यान दें, सभी परीक्षण 4k (3840x2160) में किए गए थे:

कयामत २०१६ (२१६०पी, अल्ट्रा): ओपनजीएल - ५४ एफपीएस, वल्कन - ७८ एफपीएस;
द विचर 3: वाइल्ड हंट (2160p, MAX, हेयरवर्क्स ऑफ): DX11 - 55 FPS;
बैटलफील्ड 1 (2160p, ULTRA): DX11 - 65 FPS, DX12 - 59 FPS;
ओवरवॉच (2160p, ULTRA): DX11 - 93 FPS।

यह केवल तय करने के लिए रहता है: आपको इसकी आवश्यकता है, या आप पैसे बचा सकते हैं और 1070 ले सकते हैं। "अल्ट्रा" या "उच्च" सेटिंग्स पर खेलने में बहुत अंतर नहीं है, क्योंकि आधुनिक इंजन मध्यम सेटिंग्स पर भी उच्च रिज़ॉल्यूशन में पूरी तरह से एक तस्वीर खींचते हैं। : आखिरकार, हमारे पास आप ऐसे साबुन कंसोल नहीं हैं जो ईमानदार 4k और स्थिर 60fps के लिए पर्याप्त प्रदर्शन प्रदान नहीं कर सकते।

यदि हम सबसे सस्ते विकल्पों की उपेक्षा करते हैं, तो गेमरॉक संस्करण (लगभग 43-45 हजार रूबल) में पलिट के पास फिर से कीमत और गुणवत्ता का सबसे अच्छा संयोजन होगा: हाँ, शीतलन प्रणाली "मोटी", 2.5 स्लॉट है, लेकिन वीडियो कार्ड प्रतिस्पर्धियों की तुलना में छोटा है, और 1080 की एक जोड़ी शायद ही कभी स्थापित की जाती है ... एसएलआई धीरे-धीरे मर रहा है, और यहां तक ​​कि उच्च गति वाले पुलों का जीवनदायी इंजेक्शन भी वास्तव में इसमें मदद नहीं करता है। यदि आपके पास बहुत सारे ऐड-ऑन स्थापित हैं, तो ASUS ROG विकल्प खराब नहीं है। डिवाइस और आप अतिरिक्त विस्तार स्लॉट को ओवरलैप नहीं करना चाहते हैं: उनका वीडियो कार्ड बिल्कुल 2 स्लॉट मोटा है, लेकिन इसके लिए पिछली दीवार से टोकरी तक हार्ड ड्राइव के साथ 29 सेंटीमीटर खाली जगह की आवश्यकता होती है। मुझे आश्चर्य है कि क्या गीगाबाइट आईटीएक्स प्रारूप में इस राक्षस की रिहाई में महारत हासिल करेगा?

परिणामों

नए NVIDIA ग्राफिक्स कार्ड ने केवल प्रयुक्त हार्डवेयर बाजार को दफन कर दिया है। इस पर केवल GTX 970 बचता है, जिसे 10-12 हजार रूबल के लिए छीन लिया जा सकता है। उपयोग किए गए 7970 और R9 280 के संभावित खरीदारों के पास अक्सर इसे रखने के लिए कहीं नहीं होता है और बस इसे नहीं खिलाते हैं, और द्वितीयक बाजार से कई विकल्प बस अप्रमाणिक हैं, और आने वाले कुछ वर्षों के लिए सस्ते अपग्रेड के रूप में, वे बेकार हैं: बहुत कम है स्मृति, नई तकनीक समर्थित नहीं हैं। नई पीढ़ी के वीडियो कार्ड की खूबी यह है कि जो खिलौने उनके लिए अनुकूलित नहीं हैं, वे पिछले वर्षों के अनुभवी GPU चार्ट की तुलना में बहुत अधिक हर्षित हैं, और एक वर्ष में क्या होगा जब गेम इंजन पूरी शक्ति का उपयोग करना सीखेंगे नई तकनीकों की कल्पना करना कठिन है।

GTX 1050 और 1050Ti

काश, मैं सबसे सस्ती पास्कल खरीदने की सिफारिश नहीं कर सकता। RX 460 आमतौर पर एक हजार या दो सस्ते में बेचा जाता है, और यदि आपका बजट इतना सीमित है कि आप "बाद के लिए" वीडियो कार्ड लेते हैं, तो Radeon वास्तव में पैसे का अधिक दिलचस्प निवेश है। दूसरी ओर, 1050 थोड़ा तेज है, और यदि आपके शहर में इन दो वीडियो कार्डों की कीमतें लगभग समान हैं, तो इसे लें।

1050Ti, बदले में, उन लोगों के लिए एक बढ़िया विकल्प है जो घंटियों और सीटी और यथार्थवादी नाक के बालों के लिए साजिश और गेमप्ले पसंद करते हैं। उसके पास 2 जीबी वीडियो मेमोरी के रूप में कोई अड़चन नहीं है, वह एक साल में "बाहर नहीं जाएगी"। आप इसके लिए पैसे दे सकते हैं - करें। उच्च सेटिंग्स पर विचर, GTA V, DOOM, BF 1 - कोई समस्या नहीं। हां, आपको कई सुधारों को छोड़ना होगा, जैसे कि अल्ट्रा-लॉन्ग शैडो, कॉम्प्लेक्स टेसेलेशन या सीमित रे ट्रेसिंग वाले मॉडलों की सेल्फ-शैडोइंग की "महंगी" गणना, लेकिन लड़ाई की गर्मी में आप इन सुंदरियों के बारे में भूल जाएंगे खेलने के १० मिनट के बाद, और स्थिर ५०-६० फ्रेम प्रति सेकंड, २५ से ४० तक तंत्रिका कूद की तुलना में बहुत अधिक इमर्सिव प्रभाव देगा, लेकिन "अधिकतम" पर सेटिंग्स के साथ।

यदि आपके पास कोई Radeon 7850, GTX 760 या उससे कम का वीडियो कार्ड है जिसमें 2 GB या उससे कम की वीडियो मेमोरी है, तो आप उन्हें सुरक्षित रूप से बदल सकते हैं।

जीटीएक्स 1060

युवा 1060 उन लोगों को प्रसन्न करेगा जिनके लिए ग्राफिक घंटियों और सीटी की तुलना में 100 एफपीएस की फ्रेम दर अधिक महत्वपूर्ण है। साथ ही, यह आपको फुलएचडी रिज़ॉल्यूशन में सभी रिलीज़ किए गए खिलौनों को उच्च या अधिकतम सेटिंग्स और स्थिर 60 फ्रेम प्रति सेकेंड के साथ आराम से खेलने की अनुमति देगा, और कीमत इसके बाद आने वाली हर चीज से बहुत अलग है। 6 गीगाबाइट मेमोरी वाला पुराना 1060 फुलएचडी के लिए एक या दो साल के प्रदर्शन मार्जिन के साथ एक समझौता नहीं करता है, वीआर के साथ परिचित है और मध्यम सेटिंग्स पर उच्च रिज़ॉल्यूशन पर खेलने के लिए पूरी तरह से स्वीकार्य उम्मीदवार है।

अपने GTX 970 को GTX 1060 में बदलने का कोई मतलब नहीं है, यह एक और वर्ष के लिए भुगतना होगा। लेकिन कष्टप्रद 960, 770, 780, R9 280X और पुरानी इकाइयों को सुरक्षित रूप से 1060 में अपग्रेड किया जा सकता है।

शीर्ष खंड: जीटीएक्स 1070 और 1080

1070 जीटीएक्स 970 के रूप में लोकप्रिय होने की संभावना नहीं है (हालांकि अधिकांश उपयोगकर्ताओं के पास द्विवार्षिक हार्डवेयर अद्यतन चक्र है), लेकिन पैसे के मूल्य के मामले में, यह निश्चित रूप से 70 लाइन की एक योग्य निरंतरता है। यह मुख्यधारा के 1080p रिज़ॉल्यूशन पर गेम को पीसता है, आसानी से 2560x1440 के साथ मुकाबला करता है, 21 से 9 के अडॉप्टेड की परीक्षा का सामना करता है, और 4k प्रदर्शित करने में काफी सक्षम है, हालांकि अधिकतम सेटिंग्स पर नहीं।


हाँ, SLI ऐसा ही हो सकता है।

हम सभी प्रकार के 780 Ti, R9 390X और अन्य पिछले वर्ष 980 के लिए "आओ, अलविदा" कहते हैं, खासकर यदि हम उच्च परिभाषा में खेलना चाहते हैं। और, हाँ, यह उन लोगों के लिए सबसे अच्छा विकल्प है जो मिनी-आईटीएक्स प्रारूप में एक नारकीय बॉक्स को इकट्ठा करना पसंद करते हैं और 60-70 इंच के टीवी पर 4k गेम के साथ मेहमानों को डराते हैं, जो कंप्यूटर पर कॉफी मेकर के आकार में चलते हैं।
gtx 1050 ग्राफिक्स कार्ड इतिहास टैग जोड़ें

पिछले हफ्ते जेन-सुन हुआंग ने मंच संभाला और आधिकारिक तौर पर एनवीडिया ग्राफिक्स कार्ड का अनावरण किया GeForce GTX 1070तथा जीटीएक्स 1080... स्वयं त्वरक और उनकी ओवरक्लॉकिंग क्षमता की प्रस्तुति के अलावा, वास्तुकला में उपयोग की जाने वाली नई तकनीकों का प्रदर्शन किया गया पास्कल... यह उनके लिए है कि यह सामग्री समर्पित है। बेशक, सभी नवाचारों पर विचार नहीं किया जाएगा। जीटीएक्स 1080 समीक्षा में कुछ नई और / या अद्यतन तकनीकों पर चर्चा की जाएगी, जो बहुत जल्द दिखाई देगी।

पास्कलतथाजीपीयू जीपी 104

में पहला और सबसे महत्वपूर्ण परिवर्तन पास्कल- मार्च 2012 से GeForce GTX 600-श्रृंखला के जारी होने के बाद से उपभोक्ता ग्राफिक्स कार्ड में उपयोग की जाने वाली 28nm प्रक्रिया तकनीक से दूर जाना। पास्कल वास्तुकला एक नए पर बनाता है 16 एनएमफिनफेट TSMC की निर्माण प्रक्रिया, और थिनर लिथोग्राफी की ओर कदम बिजली की खपत और प्रदर्शन स्केलिंग में नाटकीय सुधार के साथ आता है।

लेकिन सबसे बढ़कर, एक अधिक सूक्ष्म तकनीकी प्रक्रिया अक्सर आपको आवृत्ति बढ़ाने की अनुमति देती है। स्टॉक में, वीडियो कार्ड 1700 मेगाहर्ट्ज से अधिक पर संचालित होता है। इसके अलावा, कई समीक्षाओं को देखते हुए, GTX 1080 2100+ मेगाहर्ट्ज को ओवरक्लॉक करने में सक्षम है, और यह एक संदर्भ है, जो गंभीरता से शक्ति में भी सीमित है।

यह ध्यान दिया जाना चाहिए कि न केवल तकनीकी प्रक्रिया में कमी ने इस तरह से आवृत्ति बढ़ाने की अनुमति दी। GPU इंजीनियरिंग के वरिष्ठ उपाध्यक्ष जोना एल्बेन के अनुसार, 16nm FinFET प्रक्रिया प्रौद्योगिकी पर स्विच करने के बाद, नए GPU लगभग 1325 MHz पर चल सकते हैं, और टीम NVIDIAलंबे समय तक उसने आवृत्तियों को बढ़ाने पर काम किया। काम का परिणाम GTX 1080 था, जो 1733 मेगाहर्ट्ज पर संचालित होता है।

आपने मैक्सवेल आर्किटेक्चर पर घड़ी की गति और प्रदर्शन में सुधार के इस स्तर को कैसे प्राप्त किया? पास्कल नाटकीय रूप से दक्षता बढ़ाने के लिए कई दिलचस्प नवाचारों को जोड़ती है।

अनुकूलन ने न केवल घड़ी की आवृत्ति को बढ़ाने की अनुमति दी, बल्कि अपने पूर्ववर्ती, GM204 के सापेक्ष GPU GP104 के CUDA कोर की दक्षता को भी बढ़ाया। इसका प्रमाण 70% (GTX 980 के सापेक्ष) का प्रदर्शन लाभ है, और यह अभी भी उन ड्राइवरों पर है जो अभी तक पूरी तरह से समाप्त नहीं हुए हैं।

परिवर्तनों में से एक ऊपर प्रस्तुत ब्लॉक आरेख में देखा जा सकता है। अब, एक GPC क्लस्टर में, पाँच के चार SM-s (एक साथ मल्टीप्रोसेसर) ब्लॉक बदलें।

पॉलीमॉर्फयन्त्र 4.0

GPU क्रिस्टल में ही केवल एक महत्वपूर्ण जोड़ है - PolyMorph Engine में एक नया मॉड्यूल जोड़ना। एक सिंक्रोनस मल्टीप्रोजेक्शन यूनिट जोड़ा गया है। नया ब्लॉक फ्रेम प्रोसेसिंग पथ के बहुत अंत में स्थित है और एक ज्यामिति स्ट्रीम से कई प्रक्षेपण योजनाएं बनाता है।

यदि आप विवरण में नहीं जाते हैं, और वहां सब कुछ बहुत जटिल है, तो नया ब्लॉक ज्यामिति के प्रसंस्करण को संभालता है, सभी नहीं, बल्कि एक आवश्यक हिस्सा। यह अन्य GPU इकाइयों पर भार को कम करता है। के अतिरिक्त, पॉलीमॉर्फमल्टी-मॉनिटर कॉन्फ़िगरेशन पर सही कोणों पर एक चित्र बनाने में मदद करता है, लेकिन उस पर बाद में और अधिक।

पैरामीटरअर्थ
चिप कोडनेमGP104
उत्पादन प्रौद्योगिकी१६ एनएम फिनफेट
ट्रांजिस्टर की संख्या7.2 अरब
मूल भाग314 मिमी²
आर्किटेक्चर
डायरेक्टएक्स हार्डवेयर सपोर्ट
मेमोरी बस
१६०७ (१७३३) मेगाहर्ट्ज
कंप्यूटिंग इकाइयांआईईईई 754-2008 मानक के ढांचे के भीतर फ्लोटिंग पॉइंट गणना के लिए 2560 स्केलर एएलयू सहित 20 स्ट्रीमिंग मल्टीप्रोसेसर;
बनावट ब्लॉकबनावट में FP16 और FP32 घटकों के समर्थन के साथ 160 टेक्सचर एड्रेसिंग और फ़िल्टरिंग इकाइयाँ और सभी बनावट स्वरूपों के लिए ट्रिलिनियर और अनिसोट्रोपिक फ़िल्टरिंग के लिए समर्थन
मॉनिटर समर्थन
GeForce GTX 1080 संदर्भ ग्राफिक्स कार्ड निर्दिष्टीकरण
पैरामीटरअर्थ
कोर आवृत्ति१६०७ (१७३३) मेगाहर्ट्ज
2560
बनावट इकाइयों की संख्या160
सम्मिश्रण ब्लॉकों की संख्या64
प्रभावी स्मृति आवृत्ति10000 (4 × 2500) मेगाहर्ट्ज
मेमोरी प्रकारGDDR5X
मेमोरी बस256-बिट
याद8 जीबी
320 जीबी / एस
लगभग 9 टेराफ्लॉप्स
१०३ गीगापिक्सेल/सेकंड
२५७ गीगाटेक्सेल / वर्ग
टायरपीसीआई एक्सप्रेस 3.0
कनेक्टर्स
ऊर्जा की खपत180 डब्ल्यू . तक
अतिरिक्त भोजनएक 8-पिन कनेक्टर
2
अनुशंसित मूल्य$ 599-699 (यूएसए), 54990 रूबल (रूस)

GeForce GTX 1080 ग्राफिक्स कार्ड के नए मॉडल को नई GeForce श्रृंखला के पहले समाधान के लिए एक तार्किक नाम मिला - यह अपने प्रत्यक्ष पूर्ववर्ती से केवल परिवर्तित पीढ़ी के अंक में भिन्न है। नवीनता न केवल कंपनी की वर्तमान लाइन में शीर्ष समाधानों की जगह लेती है, बल्कि कुछ समय के लिए नई श्रृंखला का प्रमुख बन गई, जब तक कि टाइटन एक्स को और भी अधिक शक्ति के जीपीयू पर जारी नहीं किया गया। इसके नीचे पदानुक्रम में पहले से घोषित GeForce GTX 1070 मॉडल भी है, जो GP104 चिप के स्ट्रिप्ड-डाउन संस्करण पर आधारित है, जिस पर हम नीचे विचार करेंगे।

एनवीडिया के नए जीपीयू में क्रमशः नियमित और संस्थापक संस्करण (नीचे देखें) के लिए $ 599 और $ 699 का एमएसआरपी है, जो कि एक बहुत अच्छा सौदा है, यह देखते हुए कि जीटीएक्स 1080 न केवल जीटीएक्स 980 टीआई, बल्कि टाइटन एक्स से भी बेहतर प्रदर्शन करता है। आज नया उत्पाद बिना किसी प्रश्न के सिंगल-चिप वीडियो कार्ड के लिए बाजार पर सबसे अच्छा प्रदर्शन समाधान है, और साथ ही इसकी कीमत पिछली पीढ़ी के सबसे अधिक उत्पादक वीडियो कार्ड से भी कम है। अब तक, GeForce GTX 1080 का अनिवार्य रूप से AMD से कोई प्रतियोगी नहीं है, इसलिए Nvidia उनके लिए उपयुक्त कीमत निर्धारित करने में सक्षम था।

विचाराधीन वीडियो कार्ड 256-बिट मेमोरी बस के साथ GP104 चिप पर आधारित है, लेकिन नए प्रकार की GDDR5X मेमोरी 10 GHz की बहुत उच्च प्रभावी आवृत्ति पर संचालित होती है, जो 320 GB / s की उच्च शिखर बैंडविड्थ देती है - जो लगभग 384-बिट बस के साथ GTX 980 Ti के स्तर पर है। ऐसी बस के साथ वीडियो कार्ड पर स्थापित मेमोरी की मात्रा 4 या 8 जीबी के बराबर हो सकती है, लेकिन आधुनिक परिस्थितियों में इस तरह के एक शक्तिशाली समाधान के लिए एक छोटी मात्रा निर्धारित करना मूर्खता होगी, इसलिए जीटीएक्स 1080 ने काफी तार्किक रूप से 8 जीबी प्राप्त किया। मेमोरी, और यह राशि आने वाले कई वर्षों के लिए किसी भी गुणवत्ता सेटिंग्स के साथ किसी भी 3D एप्लिकेशन को चलाने के लिए पर्याप्त है।

GeForce GTX 1080 PCB, स्पष्ट कारणों से, कंपनी के पिछले PCBs से काफी अलग है। नए उत्पाद के लिए सामान्य बिजली खपत मूल्य 180 डब्ल्यू है, जो जीटीएक्स 980 से थोड़ा अधिक है, लेकिन कम शक्तिशाली टाइटन एक्स और जीटीएक्स 980 टीआई से काफी कम है। संदर्भ बोर्ड में छवि आउटपुट उपकरणों को जोड़ने के लिए कनेक्टर्स का सामान्य सेट होता है: एक डुअल-लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट।

संस्थापक संस्करण संदर्भ डिजाइन

मई की शुरुआत में GeForce GTX 1080 की घोषणा के साथ ही, फाउंडर्स एडिशन नामक वीडियो कार्ड के एक विशेष संस्करण की घोषणा की गई, जिसकी कीमत कंपनी के भागीदारों के सामान्य वीडियो कार्ड की तुलना में अधिक है। वास्तव में, यह संस्करण कार्ड और शीतलन प्रणाली के लिए एक संदर्भ डिजाइन है, और यह स्वयं एनवीडिया द्वारा निर्मित है। आप वीडियो कार्ड के लिए ऐसे विकल्पों से अलग तरह से संबंधित हो सकते हैं, लेकिन कंपनी के इंजीनियरों द्वारा विकसित संदर्भ डिजाइन और उच्च गुणवत्ता वाले घटकों के उपयोग से बने निर्माण में इसके प्रशंसक हैं।

लेकिन क्या वे एनवीडिया से वीडियो कार्ड के लिए कुछ हजार रूबल अधिक देंगे, यह एक ऐसा प्रश्न है जिसका उत्तर केवल अभ्यास ही दे सकता है। किसी भी स्थिति में, सबसे पहले यह बढ़ी हुई कीमत पर एनवीडिया के संदर्भ वीडियो कार्ड होंगे जो बिक्री पर दिखाई देंगे, और इसमें से चुनने के लिए बहुत कुछ नहीं है - यह हर घोषणा के साथ होता है, लेकिन संदर्भ GeForce GTX 1080 इसमें भिन्न है। इसे इस रूप में अपनी पूरी अवधि, जीवन, अगली पीढ़ी के समाधानों तक बेचने की योजना है।

एनवीडिया का मानना ​​है कि भागीदारों के सर्वोत्तम कार्यों पर भी इस संस्करण की अपनी खूबियां हैं। उदाहरण के लिए, कूलर का डुअल-स्लॉट डिज़ाइन इस शक्तिशाली वीडियो कार्ड के आधार पर अपेक्षाकृत छोटे फॉर्म फैक्टर और मल्टी-चिप वीडियो सिस्टम (यहां तक ​​​​कि तीन- और चार- के बावजूद) के गेमिंग पीसी के आधार पर बनाना आसान बनाता है। चिप मोड जो कंपनी अनुशंसा नहीं करती है)। GeForce GTX 1080 फाउंडर्स एडिशन में एक कुशल वाष्प कक्ष कूलर और एक पंखे के कुछ लाभ हैं जो मामले से गर्म हवा को उड़ाते हैं - 250W से कम बिजली की खपत करने वाला यह पहला ऐसा एनवीडिया समाधान है।

कंपनी के पिछले संदर्भ उत्पाद डिजाइनों की तुलना में, पावर सर्किट को चार-चरण से पांच-चरण में अपग्रेड किया गया है। एनवीडिया उन बेहतर घटकों के बारे में भी बात कर रहा है जिन पर नया उत्पाद आधारित है, साथ ही कम विद्युत शोर, बेहतर वोल्टेज स्थिरता और ओवरक्लॉकिंग क्षमता के लिए अनुमति देता है। सभी सुधारों के परिणामस्वरूप, संदर्भ बोर्ड GeForce GTX 980 की तुलना में 6% अधिक ऊर्जा कुशल है।

और GeForce GTX 1080 के "नियमित" मॉडल से अलग होने के लिए और बाहरी रूप से, संस्थापक संस्करण के लिए एक असामान्य "कटा हुआ" केस डिज़ाइन विकसित किया गया था। जो, हालांकि, संभवतः वाष्पीकरण कक्ष और रेडिएटर (फोटो देखें) के रूप की जटिलता का कारण बना, जिसने इस तरह के एक विशेष संस्करण के लिए $ 100 अधिभार के कारणों में से एक के रूप में कार्य किया हो सकता है। हम दोहराते हैं कि बिक्री की शुरुआत में, खरीदारों के पास ज्यादा विकल्प नहीं होंगे, लेकिन भविष्य में वे कंपनी के भागीदारों में से एक से अपने स्वयं के डिजाइन के साथ एक समाधान चुनने में सक्षम होंगे, और खुद एनवीडिया द्वारा बनाया गया था।

पास्कल ग्राफिक्स आर्किटेक्चर की अगली पीढ़ी

GeForce GTX 1080 GP104 चिप पर आधारित कंपनी का पहला समाधान है, जो Nvidia के पास्कल ग्राफिक्स आर्किटेक्चर की नई पीढ़ी से संबंधित है। हालांकि नया आर्किटेक्चर मैक्सवेल में तैयार किए गए समाधानों पर आधारित है, लेकिन इसमें महत्वपूर्ण कार्यात्मक अंतर भी हैं, जिनके बारे में हम बाद में लिखेंगे। वैश्विक दृष्टिकोण से मुख्य परिवर्तन नई तकनीकी प्रक्रिया थी, जिसके अनुसार नया ग्राफिक्स प्रोसेसर बनाया गया था।

ताइवान की कंपनी TSMC के कारखानों में GP104 ग्राफिक्स प्रोसेसर के उत्पादन में 16 एनएम FinFET प्रक्रिया प्रौद्योगिकी के उपयोग ने अपेक्षाकृत कम क्षेत्र और लागत को बनाए रखते हुए चिप की जटिलता को काफी बढ़ाना संभव बना दिया। ट्रांजिस्टर की संख्या और GP104 और GM204 चिप्स के क्षेत्र की तुलना करें - वे क्षेत्र में करीब हैं (नवीनता का क्रिस्टल शारीरिक रूप से थोड़ा छोटा है), लेकिन पास्कल आर्किटेक्चर चिप में ट्रांजिस्टर की एक बड़ी संख्या है, और, तदनुसार, नई कार्यक्षमता प्रदान करने वाली इकाइयों सहित निष्पादन इकाइयाँ।

एक वास्तुशिल्प दृष्टिकोण से, पहला गेम पास्कल मैक्सवेल वास्तुकला के समान समाधानों के समान है, हालांकि कुछ अंतर हैं। मैक्सवेल की तरह, पास्कल प्रोसेसर में ग्राफिक्स प्रोसेसिंग क्लस्टर (जीपीसी), स्ट्रीमिंग मल्टीप्रोसेसर (एसएम), और मेमोरी कंट्रोलर के अलग-अलग कॉन्फ़िगरेशन होंगे। एसएम मल्टीप्रोसेसर एक अत्यधिक समानांतर मल्टीप्रोसेसर है जो एक मल्टीप्रोसेसर में CUDA कोर और अन्य निष्पादन इकाइयों पर वार्प्स (वार्प्स, 32 इंस्ट्रक्शन थ्रेड्स के समूह) को शेड्यूल और चलाता है। आप एनवीडिया के पिछले समाधानों की हमारी समीक्षाओं में इन सभी ब्लॉकों के डिजाइन के बारे में विस्तृत जानकारी पा सकते हैं।

एसएम मल्टीप्रोसेसरों में से प्रत्येक को पॉलीमॉर्फ इंजन के साथ जोड़ा जाता है, जो बनावट लाने, टेसेलेशन, परिवर्तन, शीर्ष विशेषता सेटिंग और परिप्रेक्ष्य सुधार को संभालता है। कंपनी के पिछले समाधानों के विपरीत, GP104 चिप में पॉलीमॉर्फ इंजन में नई एक साथ बहु-प्रोजेक्शन इकाई भी शामिल है, जिसके बारे में हम नीचे चर्चा करेंगे। एक पॉलीमॉर्फ इंजन के साथ एक एसएम मल्टीप्रोसेसर के संयोजन को पारंपरिक रूप से एनवीडिया के लिए टीपीसी - टेक्सचर प्रोसेसर क्लस्टर कहा जाता है।

कुल मिलाकर, GeForce GTX 1080 में GP104 चिप में चार GPC क्लस्टर और 20 SM मल्टीप्रोसेसर, साथ ही 64 ROP इकाइयों के साथ आठ मेमोरी कंट्रोलर शामिल हैं। प्रत्येक जीपीसी में एक समर्पित रास्टरराइजेशन इंजन होता है और इसमें पांच एसएम मल्टीप्रोसेसर शामिल होते हैं। बदले में, प्रत्येक मल्टीप्रोसेसर में 128 CUDA कोर, 256 KB रजिस्टर फ़ाइल, 96 KB साझा मेमोरी, 48 KB L1 कैश और आठ TMU बनावट इकाइयाँ होती हैं। यानी कुल मिलाकर, GP104 में 2560 CUDA कोर और 160 TMU शामिल हैं।

साथ ही, जिस ग्राफिक्स प्रोसेसर पर GeForce GTX 1080 आधारित है, उसमें आठ 32-बिट (पहले इस्तेमाल किए गए 64-बिट के विपरीत) मेमोरी कंट्रोलर होते हैं, जो हमें अंतिम 256-बिट मेमोरी बस देता है। आठ ROPs और 256 KB L2 कैश प्रत्येक मेमोरी कंट्रोलर से जुड़े होते हैं। यानी GP104 चिप में कुल 64 ROP और 2048 KB का L2 कैश है।

आर्किटेक्चरल ऑप्टिमाइजेशन और नई प्रोसेस टेक्नोलॉजी की बदौलत पहला गेमिंग पास्कल अब तक का सबसे पावरफुल जीपीयू बन गया है। इसके अलावा, इसमें योगदान 16 एनएम फिनफेट की सबसे उन्नत तकनीकी प्रक्रियाओं में से एक है, और मैक्सवेल की तुलना में पास्कल में वास्तुकला के अनुकूलन से है। नई प्रक्रिया प्रौद्योगिकी पर स्विच करते समय एनवीडिया घड़ी की गति को उनकी अपेक्षा से भी अधिक बढ़ाने में सक्षम था। GP104 एक काल्पनिक GM204 की तुलना में उच्च आवृत्ति पर चलता है जो 16nm प्रक्रिया के साथ काम करेगा। ऐसा करने के लिए, एनवीडिया इंजीनियरों को पिछले समाधानों की सभी बाधाओं को सावधानीपूर्वक जांचना और अनुकूलित करना था जो एक निश्चित सीमा से ऊपर ओवरक्लॉकिंग की अनुमति नहीं देते थे। नतीजतन, नया GeForce GTX 1080, GeForce GTX 980 की तुलना में 40% से अधिक तेज चलता है। लेकिन यह सभी GPU घड़ी में बदलाव नहीं है।

GPU बूस्ट 3.0 तकनीक

जैसा कि हम पिछले एनवीडिया वीडियो कार्ड से अच्छी तरह जानते हैं, वे अपने GPU में GPU बूस्ट हार्डवेयर तकनीक का उपयोग करते हैं, जिसे GPU की ऑपरेटिंग क्लॉक स्पीड को मोड में बढ़ाने के लिए डिज़ाइन किया गया है, जब यह अभी तक बिजली की खपत और गर्मी अपव्यय की सीमा तक नहीं पहुंचा है। इन वर्षों में, इस एल्गोरिथ्म में कई बदलाव हुए हैं, और इस तकनीक की तीसरी पीढ़ी का उपयोग पास्कल आर्किटेक्चर वीडियो चिप - जीपीयू बूस्ट 3.0 में किया जाता है, जिसका मुख्य नवाचार वोल्टेज के आधार पर टर्बो आवृत्तियों की एक बेहतर सेटिंग है।

यदि आप प्रौद्योगिकी के पिछले संस्करणों के संचालन के सिद्धांत को याद करते हैं, तो आधार आवृत्ति (गारंटी न्यूनतम आवृत्ति मान, जिसके नीचे GPU नहीं गिरता है, कम से कम खेलों में) और टर्बो आवृत्ति के बीच का अंतर तय किया गया था। यही है, टर्बो आवृत्ति हमेशा बेस एक की तुलना में एक निश्चित संख्या में मेगाहर्ट्ज़ अधिक थी। GPU बूस्ट 3.0 प्रत्येक वोल्टेज के लिए अलग से टर्बो फ़्रीक्वेंसी ऑफ़सेट सेट करने की क्षमता का परिचय देता है। इसे समझने का सबसे आसान तरीका दृष्टांत से है:

बाईं ओर दूसरे संस्करण का GPU बूस्ट है, दाईं ओर - तीसरा, जो पास्कल में दिखाई दिया। आधार और टर्बो आवृत्तियों के बीच निश्चित अंतर ने GPU की क्षमताओं को पूरी तरह से प्रकट करने की अनुमति नहीं दी, कुछ मामलों में पिछली पीढ़ी के GPU सेट वोल्टेज पर तेजी से काम कर सकते थे, लेकिन टर्बो आवृत्ति की निश्चित अतिरिक्तता ने ऐसा करने की अनुमति नहीं दी। . GPU बूस्ट 3.0 में, ऐसा अवसर दिखाई दिया, और टर्बो फ़्रीक्वेंसी को प्रत्येक व्यक्तिगत वोल्टेज मान के लिए सेट किया जा सकता है, GPU से सभी रस को पूरी तरह से निचोड़ कर।

ओवरक्लॉकिंग को नियंत्रित करने और टर्बो फ़्रीक्वेंसी कर्व सेट करने के लिए उपयोगी उपयोगिताओं की आवश्यकता होती है। एनवीडिया स्वयं ऐसा नहीं करता है, लेकिन यह अपने भागीदारों को ओवरक्लॉकिंग (उचित सीमा के भीतर, निश्चित रूप से) की सुविधा के लिए ऐसी उपयोगिताओं को बनाने में मदद करता है। उदाहरण के लिए, ईवीजीए प्रेसिजन एक्सओसी में नई जीपीयू बूस्ट 3.0 कार्यक्षमता का पहले ही अनावरण किया जा चुका है, जिसमें एक समर्पित ओवरक्लॉकिंग स्कैनर शामिल है जो स्वचालित रूप से ऑन-बोर्ड प्रदर्शन चलाकर विभिन्न वोल्टेज के लिए बेस फ्रीक्वेंसी और टर्बो फ्रीक्वेंसी के बीच गैर-रैखिक अंतर का पता लगाता है और सेट करता है। स्थिरता परीक्षण। नतीजतन, उपयोगकर्ता के पास एक टर्बो फ़्रीक्वेंसी वक्र होता है जो आदर्श रूप से किसी विशेष चिप की क्षमताओं से मेल खाता है। इसके अलावा, किसी भी तरह से मैन्युअल रूप से संशोधित किया जा सकता है।

जैसा कि आप उपयोगिता के स्क्रीनशॉट में देख सकते हैं, GPU और सिस्टम के बारे में जानकारी के अलावा, ओवरक्लॉकिंग के लिए सेटिंग्स भी हैं: पावर टारगेट (ओवरक्लॉकिंग के दौरान विशिष्ट बिजली की खपत को मानक के प्रतिशत के रूप में निर्धारित करता है), GPU Temp लक्ष्य (अधिकतम स्वीकार्य कोर तापमान), GPU क्लॉक ऑफ़सेट (सभी वोल्टेज मानों के लिए आधार आवृत्ति से अधिक), मेमोरी ऑफ़सेट (डिफ़ॉल्ट मान पर वीडियो मेमोरी आवृत्ति की अधिकता), ओवरवॉल्टेज (वोल्टेज बढ़ाने के लिए अतिरिक्त विकल्प)।

प्रेसिजन एक्सओसी यूटिलिटी में तीन ओवरक्लॉकिंग मोड शामिल हैं: बेसिक बेसिक, लीनियर लीनियर और मैनुअल मैनुअल। मुख्य मोड में, आप आधार वाले के ऊपर सिंगल ओवरफ़्रीक्वेंसी मान (फिक्स्ड टर्बो फ़्रीक्वेंसी) सेट कर सकते हैं, जैसा कि पिछले GPU के लिए था। रैखिक मोड आपको GPU के लिए न्यूनतम से अधिकतम वोल्टेज मानों के लिए आवृत्ति को रैंप पर सेट करने की अनुमति देता है। ठीक है, मैनुअल मोड में, आप ग्राफ पर प्रत्येक वोल्टेज बिंदु के लिए GPU आवृत्ति के लिए अद्वितीय मान सेट कर सकते हैं।

उपयोगिता में स्वचालित ओवरक्लॉकिंग के लिए एक विशेष स्कैनर भी शामिल है। आप या तो अपना आवृत्ति स्तर सेट कर सकते हैं या प्रेसिजन एक्सओसी को सभी वोल्टेज पर जीपीयू स्कैन करने दे सकते हैं और वोल्टेज और आवृत्ति वक्र पर प्रत्येक बिंदु के लिए सबसे स्थिर आवृत्तियों को पूरी तरह से स्वचालित रूप से ढूंढ सकते हैं। स्कैनिंग प्रक्रिया के दौरान, प्रेसिजन एक्सओसी धीरे-धीरे जीपीयू आवृत्ति जोड़ता है और स्थिरता या कलाकृतियों के लिए इसके प्रदर्शन की जांच करता है, एक आदर्श आवृत्ति और वोल्टेज वक्र बनाता है जो प्रत्येक चिप के लिए अद्वितीय होगा।

इस स्कैनर को प्रत्येक वोल्टेज मान, परीक्षण की जाने वाली न्यूनतम और अधिकतम आवृत्ति, और उसके चरण के परीक्षण के लिए समय अंतराल निर्धारित करके आपकी अपनी आवश्यकताओं के अनुरूप अनुकूलित किया जा सकता है। यह स्पष्ट है कि स्थिर परिणाम प्राप्त करने के लिए, एक छोटा कदम और एक अच्छी परीक्षण अवधि निर्धारित करना बेहतर होगा। परीक्षण के दौरान, वीडियो ड्राइवर और सिस्टम के अस्थिर संचालन को देखा जा सकता है, लेकिन अगर स्कैनर फ्रीज नहीं होता है, तो यह ऑपरेशन को बहाल कर देगा और इष्टतम आवृत्तियों को खोजना जारी रखेगा।

नए प्रकार की वीडियो मेमोरी GDDR5X और बेहतर संपीड़न

तो, GPU की शक्ति काफ़ी बढ़ गई है, और मेमोरी बस केवल 256-बिट बनी हुई है - क्या मेमोरी बैंडविड्थ समग्र प्रदर्शन को सीमित कर देगी और आप इसके बारे में क्या कर सकते हैं? ऐसा लगता है कि होनहार दूसरी पीढ़ी की एचबीएम मेमोरी अभी भी निर्माण के लिए बहुत महंगी है, इसलिए अन्य विकल्पों की तलाश करनी पड़ी। 2009 में GDDR5 मेमोरी की शुरुआत के बाद से, Nvidia इंजीनियर नए प्रकार की मेमोरी का उपयोग करने की संभावनाएं तलाश रहे हैं। नतीजतन, विकास नए GDDR5X मेमोरी मानक के कार्यान्वयन के लिए आया - इस समय सबसे जटिल और उन्नत मानक, 10 Gbps की अंतरण दर दे रहा है।

एनवीडिया एक दिलचस्प उदाहरण देता है कि यह कितना तेज़ है। प्रेषित बिट्स के बीच केवल 100 पिकोसेकंड गुजरते हैं - इस समय के दौरान, प्रकाश की किरण केवल एक इंच (लगभग 2.5 सेमी) की दूरी तय करती है। और GDDR5X मेमोरी का उपयोग करते समय, डेटा ट्रांसमिशन और रिसेप्शन सर्किट को इस समय आधे से भी कम समय में ट्रांसमिटेड बिट के मान का चयन करना चाहिए, इससे पहले कि अगले एक को भेजा जाए - यह सिर्फ इसलिए है ताकि आप समझ सकें कि आधुनिक तकनीकें क्या पहुंच गई हैं।

इस गति को प्राप्त करने के लिए, डेटा I / O सिस्टम के लिए एक नया आर्किटेक्चर विकसित करना आवश्यक था, जिसके लिए मेमोरी चिप निर्माताओं के साथ कई वर्षों के संयुक्त विकास की आवश्यकता थी। बढ़ी हुई डेटा ट्रांसफर गति के अलावा, ऊर्जा दक्षता में भी वृद्धि हुई है - GDDR5X मेमोरी चिप्स 1.35 V के कम वोल्टेज का उपयोग करते हैं और नई तकनीकों का उपयोग करके उत्पादित किए जाते हैं, जो 43% उच्च आवृत्ति पर समान बिजली की खपत देता है।

कंपनी के इंजीनियरों को GPU कोर और मेमोरी चिप्स के बीच डेटा ट्रांसफर लाइनों को फिर से काम करना पड़ा, सिग्नल के नुकसान को रोकने और मेमोरी से GPU और बैक तक सभी तरह से गिरावट को रोकने के लिए अधिक ध्यान देना पड़ा। तो, उपरोक्त चित्रण कैप्चर किए गए सिग्नल को एक बड़े सममित "आंख" के रूप में दिखाता है, जो पूरे सर्किट के अच्छे अनुकूलन और सिग्नल से डेटा कैप्चर करने की सापेक्ष आसानी को इंगित करता है। इसके अलावा, ऊपर वर्णित परिवर्तनों ने न केवल 10 गीगाहर्ट्ज़ पर GDDR5X का उपयोग करने की संभावना को जन्म दिया है, बल्कि अधिक परिचित GDDR5 मेमोरी का उपयोग करके भविष्य के उत्पादों पर उच्च मेमोरी बैंडविड्थ प्राप्त करने में भी मदद करनी चाहिए।

खैर, हमें नई मेमोरी का उपयोग करने से 40% से अधिक मेमोरी बैंडविड्थ लाभ मिला है। लेकिन क्या यह काफी नहीं है? मेमोरी बैंडविड्थ दक्षता में और सुधार करने के लिए, एनवीडिया ने पिछले आर्किटेक्चर में पेश किए गए उन्नत डेटा संपीड़न में सुधार करना जारी रखा है। GeForce GTX 1080 में मेमोरी सबसिस्टम मेमोरी बैंडविड्थ आवश्यकताओं को कम करने के लिए डिज़ाइन की गई कई नई दोषरहित डेटा संपीड़न तकनीकों का उपयोग करता है - इन-चिप संपीड़न की चौथी पीढ़ी।

इन-मेमोरी डेटा कम्प्रेशन एल्गोरिदम एक साथ कई लाभ लाते हैं। संपीड़न मेमोरी में लिखे गए डेटा की मात्रा को कम करता है, वही वीडियो मेमोरी से L2 कैश में स्थानांतरित डेटा पर लागू होता है, जो L2 कैश की दक्षता में सुधार करता है, क्योंकि एक संपीड़ित टाइल (कई फ्रेमबफ़र पिक्सेल का एक ब्लॉक) का आकार छोटा होता है एक असम्पीडित की तुलना में। यह विभिन्न बिंदुओं, जैसे टीएमयू बनावट इकाई और फ्रेमबफर के बीच भेजे गए डेटा की मात्रा को भी कम करता है।

GPU में डेटा संपीड़न पाइपलाइन कई एल्गोरिदम का उपयोग करती है, जो डेटा की "संपीड़नशीलता" के आधार पर निर्धारित की जाती हैं - उनके लिए सबसे अच्छा उपलब्ध एल्गोरिदम चुना जाता है। सबसे महत्वपूर्ण में से एक डेल्टा रंग संपीड़न एल्गोरिथ्म है। यह संपीड़न विधि डेटा को डेटा के बजाय क्रमिक मानों के बीच अंतर के रूप में एन्कोड करती है। GPU एक ब्लॉक (टाइल) में पिक्सेल के बीच रंग मूल्यों में अंतर की गणना करता है और ब्लॉक को पूरे ब्लॉक के लिए कुछ औसत रंग के रूप में संग्रहीत करता है और प्रत्येक पिक्सेल के लिए मूल्यों में अंतर पर डेटा। ग्राफिक डेटा के लिए, यह विधि आमतौर पर अच्छी तरह से अनुकूल होती है, क्योंकि सभी पिक्सेल के लिए छोटी टाइलों के भीतर का रंग अक्सर बहुत अधिक भिन्न नहीं होता है।

GeForce GTX 1080 में GP104 GPU पिछले मैक्सवेल चिप्स की तुलना में अधिक संपीड़न एल्गोरिदम का समर्थन करता है। इस प्रकार, 2: 1 संपीड़न एल्गोरिथ्म अधिक कुशल हो गया है, और इसके अलावा, दो नए एल्गोरिदम दिखाई दिए हैं: एक 4: 1 संपीड़न मोड, उन मामलों के लिए उपयुक्त है जहां ब्लॉक पिक्सेल के रंग मान में अंतर बहुत छोटा है, और एक 8: 1 मोड, जो ब्लॉकों के बीच 2x डेल्टा संपीड़न के साथ 2 × 2 पिक्सेल ब्लॉक के निरंतर 4: 1 संपीड़न को जोड़ता है। जब संपीड़न बिल्कुल संभव नहीं है, तो इसका उपयोग नहीं किया जाता है।

हालांकि, वास्तव में, उत्तरार्द्ध बहुत कम ही होता है। यह गेम प्रोजेक्ट CARS के स्क्रीनशॉट के उदाहरणों से देखा जा सकता है, जो पास्कल में बढ़े हुए संपीड़न अनुपात को दर्शाने के लिए Nvidia द्वारा लाए गए थे। दृष्टांतों में, वे फ्रेमबफ़र टाइलें जिन्हें GPU संपीड़ित करने में सक्षम था, मैजेंटा में चित्रित किया गया था, और गैर-हानिकारक वाले मूल रंग (शीर्ष - मैक्सवेल, नीचे - पास्कल) के साथ बने रहे।

जैसा कि आप देख सकते हैं, GP104 में नया संपीड़न एल्गोरिदम वास्तव में मैक्सवेल की तुलना में बहुत बेहतर प्रदर्शन करता है। हालांकि पुरानी वास्तुकला भी दृश्य में अधिकांश टाइलों को संपीड़ित करने में सक्षम थी, किनारों के आसपास बहुत सारी घास और पेड़, साथ ही साथ मशीन के पुर्जे, विरासत संपीड़न एल्गोरिदम के अधीन नहीं हैं। लेकिन पास्कल में नई तकनीकों की शुरूआत के साथ, छवि के बहुत कम क्षेत्र असम्पीडित रहे - बेहतर दक्षता स्पष्ट है।

डेटा संपीड़न में सुधार के परिणामस्वरूप, GeForce GTX 1080 प्रति फ्रेम भेजे गए डेटा की मात्रा को काफी कम करने में सक्षम है। संख्या के संदर्भ में, बेहतर संपीड़न प्रभावी मेमोरी बैंडविड्थ में अतिरिक्त 20% बचाता है। GDDR5X मेमोरी का उपयोग करने से GTX 980 की तुलना में GeForce GTX 1080 की 40% से अधिक उच्च मेमोरी बैंडविड्थ के अलावा, यह सब एक साथ पिछली पीढ़ी के मॉडल की तुलना में प्रभावी मेमोरी बैंडविड्थ में लगभग 70% की वृद्धि देता है।

एसिंक्स कंप्यूट सपोर्ट

अधिकांश आधुनिक गेम ग्राफिकल के अलावा जटिल गणनाओं का उपयोग करते हैं। उदाहरण के लिए, भौतिक निकायों के व्यवहार की गणना करते समय गणना ग्राफिक गणना से पहले या बाद में नहीं की जा सकती है, लेकिन साथ ही साथ, क्योंकि वे एक दूसरे से संबंधित नहीं हैं और एक फ्रेम के भीतर एक दूसरे पर निर्भर नहीं हैं। साथ ही, एक उदाहरण पहले से रेंडर किए गए फ़्रेमों की पोस्ट-प्रोसेसिंग और ऑडियो डेटा की प्रोसेसिंग है, जिसे रेंडरिंग के समानांतर भी किया जा सकता है।

कार्यक्षमता के उपयोग का एक अन्य प्रमुख उदाहरण एसिंक्रोनस टाइम ताना तकनीक है जिसका उपयोग वीआर सिस्टम में किया जाता है ताकि रेंडर करने से पहले खिलाड़ी के सिर की गति से मिलान करने के लिए रेंडर किए गए फ्रेम को बदल दिया जाए, जिससे अगले रेंडरिंग में बाधा उत्पन्न हो। GPU शक्ति का ऐसा अतुल्यकालिक लोडिंग इसकी निष्पादन इकाइयों के उपयोग की दक्षता को बढ़ाने की अनुमति देता है।

इस तरह के कार्यभार दो नए GPU उपयोग के मामले बनाते हैं। उनमें से पहले में अतिव्यापी भार शामिल हैं, क्योंकि कई प्रकार के कार्य GPU की क्षमताओं का पूरी तरह से उपयोग नहीं करते हैं, और कुछ संसाधन निष्क्रिय हैं। ऐसे मामलों में, आप केवल एक GPU पर दो अलग-अलग कार्यों को चला सकते हैं जो इसकी निष्पादन इकाइयों को अधिक कुशल उपयोग के लिए अलग करते हैं - उदाहरण के लिए, PhysX प्रभाव जो एक फ्रेम के 3D प्रतिपादन के संयोजन के साथ किए जाते हैं।

इस परिदृश्य के प्रदर्शन को बेहतर बनाने के लिए, पास्कल वास्तुकला में गतिशील भार संतुलन पेश किया गया है। पिछले मैक्सवेल आर्किटेक्चर में, अतिव्यापी वर्कलोड को ग्राफिक्स और कंप्यूट के लिए GPU संसाधनों के स्थिर आवंटन के रूप में लागू किया गया था। यह दृष्टिकोण प्रभावी है बशर्ते कि दो कार्यभार के बीच संतुलन मोटे तौर पर संसाधनों के विभाजन से मेल खाता हो और कार्यों को एक ही समय में पूरा किया जाता है। यदि गैर-ग्राफ़िकल गणनाओं में ग्राफ़िकल की तुलना में अधिक समय लगता है, और दोनों सामान्य कार्य के पूरा होने की प्रतीक्षा कर रहे हैं, तो शेष समय के लिए GPU का हिस्सा निष्क्रिय रहेगा, जिससे समग्र प्रदर्शन में कमी आएगी और सभी लाभों को समाप्त कर दिया जाएगा। हार्डवेयर डायनेमिक लोड बैलेंसिंग मुक्त किए गए GPU संसाधनों के उपलब्ध होते ही उनका उपयोग करने की अनुमति देता है - समझने के लिए यहां एक उदाहरण दिया गया है।

ऐसे कार्य भी हैं जो निष्पादन समय के लिए महत्वपूर्ण हैं, और यह अतुल्यकालिक संगणनाओं के लिए दूसरा परिदृश्य है। उदाहरण के लिए, VR में एसिंक्रोनस टाइम वॉरपिंग एल्गोरिथम का निष्पादन स्कैन (स्कैन आउट) से पहले पूरा होना चाहिए या फ्रेम को छोड़ दिया जाएगा। इस मामले में, GPU को कार्य के बहुत तेज़ रुकावट का समर्थन करना चाहिए और GPU पर निष्पादन से कम महत्वपूर्ण कार्य को हटाने के लिए दूसरे पर स्विच करना चाहिए, महत्वपूर्ण कार्यों के लिए अपने संसाधनों को मुक्त करना - इसे प्रीमेशन कहा जाता है।

गेम इंजन से एक एकल रेंडर कमांड में सैकड़ों ड्रॉ कॉल हो सकते हैं, प्रत्येक ड्रॉ कॉल में बदले में सैकड़ों संसाधित त्रिकोण होते हैं, जिनमें से प्रत्येक में सैकड़ों पिक्सेल की गणना और ड्रा किया जाता है। पारंपरिक GPU दृष्टिकोण केवल उच्च-स्तरीय कार्य रुकावट का उपयोग करता है, और ग्राफिक्स पाइपलाइन को कार्य को स्विच करने से पहले इस सभी कार्य को पूरा करने के लिए इंतजार करना पड़ता है, जिसके परिणामस्वरूप बहुत अधिक विलंबता होती है।

इसे ठीक करने के लिए, पास्कल आर्किटेक्चर पिक्सेल स्तर पर कार्य को बाधित करने की क्षमता पेश करने वाला पहला व्यक्ति था - पिक्सेल स्तर प्रीमेशन। पास्कल GPU निष्पादन इकाइयाँ रेंडरिंग कार्यों की प्रगति की लगातार निगरानी कर सकती हैं, और जब एक रुकावट का अनुरोध किया जाता है, तो वे निष्पादन को रोक सकते हैं, संदर्भ को बाद में पूरा करने के लिए किसी अन्य कार्य पर जल्दी से स्विच करके सहेज सकते हैं।

कम्प्यूटेशनल संचालन के लिए थ्रेड स्तर पर इंटरप्टिंग और स्विचिंग ग्राफिक्स गणना के लिए पिक्सेल स्तर पर इंटरप्टिंग के समान काम करता है। कम्प्यूटेशनल वर्कलोड में कई ग्रिड होते हैं, जिनमें से प्रत्येक में कई थ्रेड होते हैं। जब एक रुकावट अनुरोध प्राप्त होता है, तो मल्टीप्रोसेसर पर चलने वाले थ्रेड निष्पादन को समाप्त करते हैं। अन्य ब्लॉक भविष्य में उसी बिंदु से जारी रखने के लिए अपने स्वयं के राज्य को बचाते हैं, और GPU दूसरे कार्य पर स्विच हो जाता है। रनिंग थ्रेड्स समाप्त होने के बाद पूरी टास्क स्विचिंग प्रक्रिया में 100 माइक्रोसेकंड से भी कम समय लगता है।

गेमिंग वर्कलोड के लिए, ग्राफिक्स के लिए पिक्सेल-लेवल इंटरप्ट और कंप्यूट कार्यों के लिए थ्रेड-लेवल इंटरप्ट का संयोजन पास्कल जीपीयू को कम से कम समय बर्बाद करने वाले कार्यों के बीच जल्दी से स्विच करने की क्षमता देता है। और CUDA पर कम्प्यूटेशनल कार्यों के लिए, निर्देश स्तर पर - न्यूनतम ग्रैन्युलैरिटी के साथ बाधित करना भी संभव है। इस मोड में, सभी थ्रेड तुरंत निष्पादन रोक देते हैं, तुरंत दूसरे कार्य पर स्विच कर देते हैं। इस दृष्टिकोण के लिए प्रत्येक थ्रेड के सभी रजिस्टरों की स्थिति के बारे में अधिक जानकारी संग्रहीत करने की आवश्यकता होती है, लेकिन गैर-ग्राफ़िकल गणना के कुछ मामलों में, यह काफी उचित है।

ग्राफिक्स और कम्प्यूटेशनल कार्यों में तेजी से रुकावट और टास्क स्विचिंग का उपयोग पास्कल आर्किटेक्चर में जोड़ा गया था ताकि ग्राफिक्स और गैर-ग्राफिक्स कार्यों को पूरे थ्रेड के बजाय व्यक्तिगत निर्देशों के स्तर पर बाधित किया जा सके, जैसा कि मैक्सवेल और केपलर में हुआ था। . ये प्रौद्योगिकियां विभिन्न GPU कार्यभार के अतुल्यकालिक निष्पादन में सुधार कर सकती हैं और एक ही समय में कई कार्य करते समय जवाबदेही में सुधार कर सकती हैं। घटना में, एनवीडिया ने भौतिक प्रभावों की गणना के उदाहरण का उपयोग करके एसिंक्रोनस कंप्यूटिंग का प्रदर्शन दिखाया। यदि अतुल्यकालिक गणना के बिना, प्रदर्शन 77-79 एफपीएस के स्तर पर था, तो इन सुविधाओं को शामिल करने के साथ, फ्रेम दर बढ़कर 93-94 एफपीएस हो गई।

हमने पहले ही वीआर में एसिंक्रोनस टाइम डिस्टॉर्शन के रूप में गेम में इस कार्यक्षमता का उपयोग करने की संभावनाओं में से एक उदाहरण के रूप में उद्धृत किया है। चित्रण से पता चलता है कि यह तकनीक किस तरह से छूट और तेजी से काम करती है। पहले मामले में, अतुल्यकालिक समय विरूपण की प्रक्रिया को यथासंभव देर से करने की कोशिश की जाती है, लेकिन प्रदर्शन पर छवि को अपडेट करने की शुरुआत से पहले। लेकिन कुछ मिलीसेकंड पहले GPU में निष्पादन के लिए एल्गोरिथ्म का कार्य दिया जाना चाहिए, क्योंकि त्वरित रुकावट के बिना सही समय पर कार्य को सटीक रूप से करने का कोई तरीका नहीं है, और GPU कुछ समय के लिए निष्क्रिय है।

पिक्सेल और स्ट्रीम स्तर पर (दाईं ओर चित्रण में) सटीक रुकावट के मामले में, यह रुकावट के क्षण को निर्धारित करने में अधिक सटीकता की अनुमति देता है, और अतुल्यकालिक समय विरूपण बहुत बाद में काम पूरा होने से पहले विश्वास के साथ शुरू किया जा सकता है। डिस्प्ले पर जानकारी अपडेट की जाती है। और पहले मामले में कुछ समय के लिए निष्क्रिय रहे GPU को कुछ अतिरिक्त ग्राफिक कार्य के साथ लोड किया जा सकता है।

एक साथ बहु-प्रक्षेपण प्रौद्योगिकी

नया GP104 GPU नई सायमलटेनियस मल्टी-प्रोजेक्शन (SMP) तकनीक के लिए समर्थन जोड़ता है, जो GPU को आधुनिक डिस्प्ले सिस्टम पर डेटा को अधिक कुशलता से प्रस्तुत करने की अनुमति देता है। एसएमपी वीडियो चिप को एक साथ कई अनुमानों में डेटा आउटपुट करने की अनुमति देता है, जिसके लिए रैस्टराइजेशन यूनिट से पहले ज्यामिति पाइपलाइन के अंत में पॉलीमॉर्फ इंजन में जीपीयू में एक नई हार्डवेयर इकाई को पेश करने की आवश्यकता होती है। यह ब्लॉक एकल ज्यामिति प्रवाह के लिए कई अनुमानों के साथ काम करने के लिए जिम्मेदार है।

मल्टी-प्रोजेक्शन इंजन 16 पूर्व-कॉन्फ़िगर किए गए अनुमानों के लिए ज्यामितीय डेटा को एक साथ संसाधित करता है जो एक प्रक्षेपण बिंदु (कैमरा) को जोड़ते हैं, इन अनुमानों को स्वतंत्र रूप से घुमाया या झुकाया जा सकता है। चूंकि प्रत्येक ज्यामिति आदिम एक साथ कई अनुमानों में प्रकट हो सकता है, एसएमपी इंजन यह कार्यक्षमता प्रदान करता है, जिससे एक एप्लिकेशन को अतिरिक्त प्रसंस्करण के बिना 32 बार (दो प्रक्षेपण केंद्रों पर 16 अनुमान) तक ज्यामिति को दोहराने के लिए GPU को निर्देश देने की अनुमति मिलती है।

संपूर्ण प्रसंस्करण प्रक्रिया हार्डवेयर त्वरित है, और चूंकि मल्टीप्रोजेक्शन ज्यामिति इंजन के बाद काम करता है, इसलिए इसे कई बार ज्यामिति प्रसंस्करण के सभी चरणों को दोहराने की आवश्यकता नहीं होती है। सहेजे गए संसाधन महत्वपूर्ण होते हैं जब प्रतिपादन गति ज्यामिति प्रसंस्करण प्रदर्शन, जैसे टेसेलेशन द्वारा सीमित होती है, जहां प्रत्येक प्रक्षेपण के लिए एक ही ज्यामिति कार्य कई बार किया जाता है। तदनुसार, अपने चरम पर, बहु-प्रक्षेपण ज्यामिति प्रसंस्करण की आवश्यकता को 32 गुना तक कम कर सकता है।

लेकिन यह सब क्यों जरूरी है? कुछ अच्छे उदाहरण हैं जहां बहु-प्रक्षेपण प्रौद्योगिकी उपयोगी हो सकती है। उदाहरण के लिए, तीन डिस्प्ले वाला एक मल्टी-मॉनिटर सिस्टम उपयोगकर्ता के काफी करीब एक कोण पर माउंट किया गया है (चारों ओर कॉन्फ़िगरेशन)। एक विशिष्ट स्थिति में, दृश्य को एक प्रक्षेपण में प्रस्तुत किया जाता है, जिससे ज्यामितीय विरूपण और ज्यामिति का गलत प्रतिपादन होता है। सही तरीका यह है कि प्रत्येक मॉनिटर के लिए तीन अलग-अलग प्रोजेक्शन हों, जिस कोण पर वे स्थित हैं।

पास्कल आर्किटेक्चर के साथ एक चिप पर वीडियो कार्ड की मदद से, यह एक ज्यामिति पास में किया जा सकता है, जिसमें तीन अलग-अलग अनुमान होते हैं, प्रत्येक अपने स्वयं के मॉनिटर के लिए। और उपयोगकर्ता, इस प्रकार, उस कोण को बदलने में सक्षम होगा जिस पर मॉनिटर एक-दूसरे से न केवल भौतिक रूप से, बल्कि वस्तुतः भी - 3D दृश्य में सही परिप्रेक्ष्य प्राप्त करने के लिए साइड मॉनिटर के अनुमानों को घुमाकर बदल सकते हैं। एक व्यापक रूप से देखने वाला कोण (FOV)। हालांकि, एक सीमा है - इस तरह के समर्थन के लिए, एप्लिकेशन को एक विस्तृत एफओवी के साथ एक दृश्य प्रस्तुत करने में सक्षम होना चाहिए और इसे सेट करने के लिए विशेष एसएमपी एपीआई कॉल का उपयोग करना चाहिए। यानी आप हर गेम में ऐसा नहीं कर सकते, आपको स्पेशल सपोर्ट की जरूरत होती है।

वैसे भी, एक फ्लैट पैनल मॉनिटर पर एक प्रक्षेपण के दिन चले गए हैं, अब कई बहु-मॉनिटर कॉन्फ़िगरेशन और घुमावदार डिस्प्ले हैं जो इस तकनीक का उपयोग भी कर सकते हैं। वर्चुअल रियलिटी सिस्टम का उल्लेख नहीं है जो स्क्रीन और उपयोगकर्ता की आंखों के बीच विशेष लेंस का उपयोग करते हैं, जिसके लिए 3D छवि को 2D छवि में प्रोजेक्ट करने के लिए नई तकनीकों की आवश्यकता होती है। इनमें से कई प्रौद्योगिकियां और तकनीकें अभी भी विकास के शुरुआती चरण में हैं, मुख्य बात यह है कि पुराने GPU प्रभावी रूप से एक से अधिक प्लेन प्रोजेक्शन का उपयोग नहीं कर सकते हैं। उन्हें कई रेंडर पास, एक ही ज्यामिति के कई प्रसंस्करण आदि की आवश्यकता होती है।

दक्षता बढ़ाने में मदद करने के लिए मैक्सवेल चिप्स के पास मल्टी-रिज़ॉल्यूशन के लिए सीमित समर्थन था, लेकिन पास्कल का एसएमपी बहुत कुछ कर सकता है। मैक्सवेल क्यूब मैपिंग या विभिन्न प्रोजेक्शन रिज़ॉल्यूशन के लिए प्रोजेक्शन 90 डिग्री घुमा सकता था, लेकिन यह केवल वीएक्सजीआई जैसे सीमित अनुप्रयोगों में ही उपयोगी था।

एसएमपी का उपयोग करने की अन्य संभावनाओं में विभिन्न संकल्पों के साथ प्रतिपादन और एकल-पास स्टीरियो प्रतिपादन शामिल हैं। उदाहरण के लिए, प्रदर्शन को अनुकूलित करने के लिए खेलों में मल्टी-रेस शेडिंग का उपयोग किया जा सकता है। जब लागू किया जाता है, तो फ्रेम के केंद्र में एक उच्च रिज़ॉल्यूशन का उपयोग किया जाता है, और परिधि पर इसे उच्च रेंडरिंग गति प्राप्त करने के लिए कम किया जाता है।

वन-पास स्टीरियो रेंडरिंग का उपयोग VR में किया जाता है और इसे पहले ही VRWorks में जोड़ा जा चुका है और VR रेंडरिंग के लिए आवश्यक ज्यामिति कार्य की मात्रा को कम करने के लिए मल्टी-प्रोजेक्शन क्षमता का उपयोग करता है। यदि इस सुविधा का उपयोग किया जाता है, तो GeForce GTX 1080 ग्राफिक्स प्रोसेसर केवल एक बार दृश्य ज्यामिति को संसाधित करता है, प्रत्येक आंख के लिए एक बार में दो अनुमान उत्पन्न करता है, जो GPU पर ज्यामितीय भार को आधा करता है, और ड्राइवर और OS से होने वाले नुकसान को भी कम करता है।

वीआर रेंडरिंग की दक्षता बढ़ाने के लिए एक और भी अधिक उन्नत तकनीक लेंस मैचेड शेडिंग है, जहां कई अनुमान वीआर रेंडरिंग के लिए आवश्यक ज्यामितीय विरूपण का अनुकरण करते हैं। यह विधि एक सतह पर एक 3D दृश्य प्रस्तुत करने के लिए बहु-प्रक्षेपण का उपयोग करती है जो मोटे तौर पर VR हेडसेट के आउटपुट के लिए प्रदान किए जाने पर सही लेंस जैसा दिखता है, इस प्रकार परिधि पर कई अनावश्यक पिक्सेल से बचा जाता है जिसे छोड़ दिया जाएगा। विधि के सार को समझने का सबसे आसान तरीका चित्रण द्वारा है - प्रत्येक आंख के सामने, चार थोड़े से सामने वाले अनुमानों का उपयोग किया जाता है (पास्कल में, आप प्रत्येक आंख के लिए 16 अनुमानों का उपयोग कर सकते हैं - एक घुमावदार लेंस की अधिक सटीक नकल के लिए) इसके बजाय में से एक:

यह दृष्टिकोण प्रदर्शन में बहुत कुछ बचा सकता है। तो, ओकुलस रिफ्ट के लिए एक विशिष्ट छवि 1.1 मेगापिक्सेल प्रति आंख है। लेकिन अनुमानों में अंतर के कारण, मूल 2.1 मेगापिक्सेल छवि का उपयोग इसे प्रस्तुत करने के लिए किया जाता है - आवश्यकता से 86% अधिक! पास्कल आर्किटेक्चर में कार्यान्वित मल्टी-प्रोजेक्शन का उपयोग, आपको प्रदान की गई छवि के रिज़ॉल्यूशन को 1.4 मेगापिक्सेल तक कम करने की अनुमति देता है, पिक्सेल प्रसंस्करण गति में डेढ़ गुना बचत प्राप्त करता है, और मेमोरी बैंडविड्थ भी बचाता है।

और सिंगल-पास स्टीरियो रेंडरिंग के कारण ज्यामिति प्रसंस्करण गति में दो गुना बचत के साथ, GeForce GTX 1080 वीडियो कार्ड का ग्राफिक्स प्रोसेसर VR रेंडरिंग के प्रदर्शन में उल्लेखनीय वृद्धि प्रदान करने में सक्षम है, जिसकी बहुत मांग है ज्यामिति प्रसंस्करण की गति, और पिक्सेल प्रसंस्करण पर और भी बहुत कुछ।

वीडियो डेटा के आउटपुट और प्रोसेसिंग के ब्लॉक में सुधार

3D रेंडरिंग से संबंधित प्रदर्शन और नई कार्यक्षमता के अलावा, छवि आउटपुट और वीडियो डिकोडिंग और एन्कोडिंग क्षमताओं को भी एक अच्छे स्तर पर बनाए रखने की आवश्यकता है। और पास्कल वास्तुकला का पहला GPU निराश नहीं करता था - यह इस अर्थ में सभी आधुनिक मानकों का समर्थन करता है, जिसमें एक पीसी पर 4K वीडियो देखने के लिए आवश्यक HEVC प्रारूप का हार्डवेयर डिकोडिंग शामिल है। साथ ही, GeForce GTX 1080 ग्राफिक्स कार्ड के भविष्य के मालिक जल्द ही अपने सिस्टम पर नेटफ्लिक्स और अन्य प्रदाताओं से 4K वीडियो स्ट्रीमिंग का आनंद ले सकेंगे।

डिस्प्ले आउटपुट के मामले में, GeForce GTX 1080 में HDCP 2.2 के साथ-साथ डिस्प्लेपोर्ट के साथ HDMI 2.0b सपोर्ट है। अब तक, DP 1.2 को प्रमाणित किया गया है, लेकिन GPU मानक के नए संस्करणों के प्रमाणन के लिए तैयार है: DP 1.3 तैयार और DP 1.4 तैयार। बाद वाला आपको 4K स्क्रीन पर 120 हर्ट्ज पर और 5K और 8K डिस्प्ले पर 60 हर्ट्ज पर डिस्प्लेपोर्ट 1.3 केबल की एक जोड़ी का उपयोग करके छवियों को प्रदर्शित करने की अनुमति देता है। यदि GTX 980 के लिए 60 हर्ट्ज पर अधिकतम समर्थित रिज़ॉल्यूशन 5120 × 3200 था, तो नए GTX 1080 के लिए यह उसी 60 हर्ट्ज पर बढ़कर 7680 × 4320 हो गया। संदर्भ GeForce GTX 1080 में तीन डिस्प्लेपोर्ट आउटपुट, एक एचडीएमआई 2.0 बी और एक डिजिटल डुअल-लिंक डीवीआई है।

एनवीडिया वीडियो कार्ड के नए मॉडल को वीडियो डेटा को डिकोडिंग और एन्कोडिंग के लिए एक बेहतर इकाई भी मिली। उदाहरण के लिए, GP104 चिप वीडियो स्ट्रीमिंग के लिए PlayReady 3.0 (SL3000) के उच्च मानकों को पूरा करती है, यह सुनिश्चित करती है कि नेटफ्लिक्स जैसे प्रसिद्ध प्रदाताओं की उच्च गुणवत्ता वाली सामग्री को उच्चतम गुणवत्ता और ऊर्जा दक्षता के साथ चलाया जाए। एन्कोडिंग और डिकोडिंग के लिए विभिन्न वीडियो प्रारूपों के समर्थन पर विवरण तालिका में दिया गया है, नया उत्पाद बेहतर के लिए पिछले समाधानों से स्पष्ट रूप से अलग है:

लेकिन एक और अधिक दिलचस्प नवीनता को तथाकथित उच्च गतिशील रेंज (एचडीआर) डिस्प्ले के लिए समर्थन कहा जा सकता है, जो बाजार में व्यापक होने वाले हैं। टीवी 2016 में बिक्री पर हैं (केवल एक साल में चार मिलियन एचडीआर टीवी बेचे जाने की योजना है), और अगले साल मॉनिटर करता है। एचडीआर वर्षों में डिस्प्ले टेक्नोलॉजी में सबसे बड़ी सफलता है, दो बार रंगीन टोन (आरजीबी के लिए दृश्यमान स्पेक्ट्रम का 75% बनाम 33%), उच्च कंट्रास्ट (10,000: 1) और समृद्ध रंगों के साथ उज्ज्वल डिस्प्ले (1000 एनआईटी) प्रदान करता है।

चमक और समृद्ध और अधिक संतृप्त रंगों में अधिक अंतर के साथ सामग्री को पुन: पेश करने की क्षमता का उदय स्क्रीन पर छवि को वास्तविकता के करीब लाएगा, काला रंग गहरा हो जाएगा, और चमकदार रोशनी वास्तविक दुनिया की तरह चकाचौंध हो जाएगी . नतीजतन, उपयोगकर्ता मानक मॉनिटर और टीवी की तुलना में छवियों के उज्ज्वल और अंधेरे क्षेत्रों में अधिक विवरण देखेंगे।

एचडीआर डिस्प्ले को सपोर्ट करने के लिए, GeForce GTX 1080 में आपकी जरूरत की सभी चीजें हैं - 12-बिट कलर आउटपुट करने की क्षमता, BT.2020 और SMPTE 2084 मानकों के लिए सपोर्ट, और एचडीएमआई 2.0b 10/12-बिट स्टैंडर्ड के अनुसार इमेज आउटपुट। 4K- रेजोल्यूशन में HDR, जो मैक्सवेल के पास था। इसके अलावा, पास्कल एचईवीसी प्रारूप को 4K रिज़ॉल्यूशन में 60 हर्ट्ज और 10- या 12-बिट रंग में डिकोड करने के लिए समर्थन जोड़ता है, जिसका उपयोग एचडीआर वीडियो के लिए किया जाता है, साथ ही समान मापदंडों के साथ एक ही प्रारूप को एन्कोड करने के लिए, लेकिन केवल में एचडीआर वीडियो रिकॉर्डिंग या स्ट्रीमिंग के लिए 10-बिट। साथ ही, इस कनेक्टर पर एचडीआर डेटा संचारित करने के लिए डिस्प्लेपोर्ट 1.4 मानकीकरण के लिए नवीनता तैयार है।

वैसे, भविष्य में ऐसे डेटा को होम पीसी से SHIELD गेम कंसोल में स्थानांतरित करने के लिए HDR वीडियो एन्कोडिंग की आवश्यकता हो सकती है जो 10-बिट HEVC चला सकता है। यानी यूजर पीसी से एचडीआर फॉर्मेट में गेम को स्ट्रीम कर सकेगा। रुको, मुझे इस तरह के समर्थन के साथ गेम कहां मिल सकते हैं? एनवीडिया इस समर्थन को लागू करने के लिए गेम डेवलपर्स के साथ लगातार काम कर रहा है, उन्हें मौजूदा डिस्प्ले के साथ संगत एचडीआर छवियों को सही ढंग से प्रस्तुत करने के लिए उन्हें जो कुछ भी चाहिए (ड्राइवर समर्थन, कोड उदाहरण, आदि) प्रदान करता है।

वीडियो कार्ड के जारी होने के समय, GeForce GTX 1080, HDR आउटपुट को ओबडक्शन, द विटनेस, लॉब्रेकर्स, राइज़ ऑफ़ द टॉम्ब रेडर, पैरागॉन, द टैलोस प्रिंसिपल और शैडो वारियर 2 जैसे खेलों द्वारा समर्थित किया जाता है। लेकिन यह सूची निकट भविष्य में जोड़े जाने की उम्मीद है। ...

मल्टी-चिप SLI रेंडरिंग में परिवर्तन

मल्टी-जीपीयू एसएलआई रेंडरिंग की मालिकाना तकनीक से संबंधित कुछ बदलाव भी थे, हालांकि किसी को भी इसकी उम्मीद नहीं थी। एसएलआई का उपयोग पीसी गेमिंग के प्रति उत्साही द्वारा प्रदर्शन को बढ़ाने के लिए या तो सबसे शक्तिशाली सिंगल-चिप वीडियो कार्ड को अग्रानुक्रम में स्थापित करने के लिए किया जाता है, या बहुत उच्च फ्रेम दर प्राप्त करने के लिए, खुद को कुछ मध्य-श्रेणी तक सीमित करने के लिए किया जाता है। समाधान, जिनकी कीमत कभी-कभी एक से भी कम होती है (निर्णय विवादास्पद है, लेकिन वे ऐसा करते हैं)। 4K मॉनिटर के साथ, खिलाड़ियों के पास वीडियो कार्ड की एक जोड़ी स्थापित करने के अलावा लगभग कोई विकल्प नहीं होता है, क्योंकि यहां तक ​​कि टॉप-एंड मॉडल अक्सर ऐसी परिस्थितियों में अधिकतम सेटिंग्स पर एक आरामदायक गेम प्रदान नहीं कर सकते हैं।

एनवीडिया एसएलआई के महत्वपूर्ण घटकों में से एक पुल हैं जो वीडियो कार्ड को एक सामान्य वीडियो सबसिस्टम में जोड़ते हैं और उनके बीच डेटा स्थानांतरित करने के लिए एक डिजिटल चैनल को व्यवस्थित करने का काम करते हैं। GeForce वीडियो कार्ड पारंपरिक रूप से दोहरे SLI कनेक्टर्स से लैस हैं, जो 3-वे और 4-वे SLI कॉन्फ़िगरेशन में दो या चार वीडियो कार्ड के बीच जुड़ने का काम करते हैं। प्रत्येक वीडियो कार्ड को प्रत्येक से जोड़ा जाना था, क्योंकि सभी GPU ने उन फ़्रेमों को भेजा जो उन्होंने मुख्य GPU को प्रदान किए थे, इसलिए, प्रत्येक कार्ड पर दो इंटरफेस की आवश्यकता थी।

सभी एनवीडिया पास्कल-आधारित ग्राफिक्स कार्ड के लिए GeForce GTX 1080 से शुरू होकर, दो SLI ग्राफिक्स कार्ड के बीच डेटा ट्रांसफर प्रदर्शन को बेहतर बनाने के लिए एक साथ बंधे हैं, और यह नया डुअल-लिंक SLI मोड बहुत अधिक दृश्य जानकारी प्रदर्शित करते समय प्रदर्शन और आराम में सुधार करता है। -रिज़ॉल्यूशन डिस्प्ले या मल्टी-मॉनिटर सिस्टम।

इस तरह के एक मोड के लिए, नए पुलों की भी आवश्यकता थी, जिन्हें एसएलआई एचबी कहा जाता है। वे दो एसएलआई चैनलों पर एक साथ GeForce GTX 1080 ग्राफिक्स कार्ड की एक जोड़ी को जोड़ते हैं, हालांकि नए ग्राफिक्स कार्ड पुराने पुलों के साथ भी संगत हैं। 1920 × 1080 और 2560 × 1440 पिक्सल के रिज़ॉल्यूशन के लिए 60 हर्ट्ज की ताज़ा दर पर, आप मानक पुलों का उपयोग कर सकते हैं, लेकिन अधिक मांग वाले मोड (4K, 5K और मल्टी-मॉनिटर सिस्टम) में, केवल नए ब्रिज ही बेहतर परिणाम प्रदान करेंगे। फ्रेम परिवर्तन की चिकनाई, हालांकि पुराने काम करेंगे, लेकिन थोड़ा खराब।

इसके अलावा, एसएलआई एचबी पुलों का उपयोग करते समय, पुराने जीपीयू पर पारंपरिक एसएलआई पुलों के लिए 400 मेगाहर्ट्ज की तुलना में GeForce GTX 1080 डेटा इंटरफ़ेस 650 मेगाहर्ट्ज पर चलता है। इसके अलावा, कुछ कठिन पुराने पुलों के लिए, पास्कल आर्किटेक्चर के वीडियो चिप्स के साथ एक उच्च डेटा ट्रांसमिशन आवृत्ति भी उपलब्ध है। बढ़ी हुई ऑपरेटिंग आवृत्ति के साथ दोगुनी एसएलआई इंटरफ़ेस के माध्यम से जीपीयू के बीच डेटा ट्रांसफर दर में वृद्धि के साथ, पिछले समाधानों की तुलना में स्क्रीन पर फ्रेम का एक आसान प्रदर्शन प्रदान किया जाता है:

यह भी ध्यान दिया जाना चाहिए कि DirectX 12 में मल्टी-जीपीयू रेंडरिंग के लिए समर्थन पहले की प्रथा से कुछ अलग है। ग्राफिक्स एपीआई के नवीनतम संस्करण में, माइक्रोसॉफ्ट ने ऐसे वीडियो सिस्टम के संचालन से संबंधित कई बदलाव किए हैं। सॉफ्टवेयर डेवलपर्स के लिए, DX12 में कई GPU का उपयोग करने के लिए दो विकल्प हैं: मल्टी डिस्प्ले एडेप्टर (MDA) और लिंक्ड डिस्प्ले एडेप्टर (LDA) मोड।

इसके अलावा, एलडीए मोड के दो रूप हैं: लागू एलडीए (जिसे एनवीडिया एसएलआई के लिए उपयोग करता है) और स्पष्ट एलडीए (जब गेम डेवलपर मल्टी-चिप रेंडरिंग के प्रबंधन के कार्यों को संभालता है। एमडीए और स्पष्ट एलडीए मोड को डायरेक्टएक्स 12 में क्रम में लागू किया गया था। मल्टी-चिप वीडियो सिस्टम का उपयोग करते समय गेम डेवलपर्स को अधिक स्वतंत्रता और लचीलापन प्रदान करने के लिए। मोड के बीच का अंतर निम्न तालिका में स्पष्ट रूप से दिखाई देता है:

एलडीए मोड में, प्रत्येक जीपीयू की मेमोरी को दूसरे की मेमोरी से जोड़ा जा सकता है और एक बड़ी कुल मात्रा के रूप में प्रदर्शित किया जा सकता है, निश्चित रूप से, सभी प्रदर्शन सीमाओं के साथ जब डेटा "विदेशी" मेमोरी से पुनर्प्राप्त किया जाता है। एमडीए मोड में, प्रत्येक जीपीयू की मेमोरी अलग से काम करती है, और विभिन्न जीपीयू सीधे दूसरे जीपीयू की मेमोरी से डेटा तक नहीं पहुंच सकते हैं। एलडीए मोड समान प्रदर्शन के मल्टी-चिप सिस्टम के लिए डिज़ाइन किया गया है, जबकि एमडीए मोड में कम प्रतिबंध हैं, और अलग-अलग निर्माताओं के चिप्स के साथ असतत और एकीकृत जीपीयू या असतत समाधान एक साथ काम कर सकते हैं। लेकिन इस मोड को भी अधिक ध्यान देने और डेवलपर्स से काम करने की आवश्यकता होती है जब GPU को एक दूसरे के साथ संवाद करने के लिए सहयोग प्रोग्रामिंग करते हैं।

डिफ़ॉल्ट रूप से, GeForce GTX 1080 कार्ड पर आधारित SLI सिस्टम केवल दो GPU का समर्थन करता है, और तीन- और चार-चिप कॉन्फ़िगरेशन को आधिकारिक तौर पर उपयोग के लिए अनुशंसित नहीं किया जाता है, क्योंकि इसके अतिरिक्त से आधुनिक गेम में प्रदर्शन लाभ प्रदान करना अधिक से अधिक कठिन हो जाता है। तीसरे और चौथे जीपीयू का। उदाहरण के लिए, कई गेम मल्टी-चिप वीडियो सिस्टम को संचालित करते समय सिस्टम के केंद्रीय प्रोसेसर की क्षमताओं के खिलाफ चलते हैं, और नए गेम तेजी से अस्थायी (अस्थायी) तकनीकों का उपयोग कर रहे हैं जो पिछले फ्रेम से डेटा का उपयोग करते हैं, जिसमें कई जीपीयू का कुशल संचालन बस है असंभव।

हालांकि, अन्य (गैर-एसएलआई) मल्टी-चिप सिस्टम में सिस्टम का संचालन संभव रहता है, जैसे डायरेक्टएक्स 12 में एमडीए या एलडीए स्पष्ट मोड या फिजिक्स भौतिक प्रभावों के लिए समर्पित तीसरे जीपीयू के साथ दो-चिप एसएलआई सिस्टम। लेकिन बेंचमार्क रिकॉर्ड के बारे में क्या, क्या वास्तव में एनवीडिया उन्हें पूरी तरह से छोड़ देता है? नहीं, निश्चित रूप से, लेकिन चूंकि लगभग कुछ उपयोगकर्ताओं द्वारा इस तरह की प्रणालियों की दुनिया में मांग है, ऐसे अति उत्साही लोगों के लिए एक विशेष उत्साही कुंजी का आविष्कार किया गया था, जिसे एनवीडिया वेबसाइट से डाउनलोड किया जा सकता है और इस सुविधा को अनब्लॉक किया जा सकता है। ऐसा करने के लिए, आपको पहले एक विशेष एप्लिकेशन लॉन्च करके एक अद्वितीय जीपीयू आईडी प्राप्त करने की आवश्यकता है, फिर वेबसाइट पर उत्साही कुंजी का अनुरोध करें और इसे डाउनलोड करने के बाद, सिस्टम में कुंजी स्थापित करें, जिससे 3-वे और 4-वे अनलॉक हो जाएं। एसएलआई विन्यास।

फास्ट सिंक तकनीक

प्रदर्शन पर जानकारी प्रदर्शित करते समय सिंक्रनाइज़ेशन तकनीकों में कुछ बदलाव हुए हैं। आगे देखें तो G-Sync में कुछ भी नया नहीं है, और Adaptive Sync तकनीक भी समर्थित नहीं है। लेकिन एनवीडिया ने उन खेलों के लिए आउटपुट और सिंक की सुगमता में सुधार करने का फैसला किया है जो बहुत उच्च प्रदर्शन दिखाते हैं जब फ्रेम दर मॉनिटर की ताज़ा दर से काफी अधिक होती है। यह उन खेलों के लिए विशेष रूप से महत्वपूर्ण है जिनमें न्यूनतम विलंबता और तेज़ प्रतिक्रिया की आवश्यकता होती है, और जिसमें मल्टीप्लेयर लड़ाई और प्रतियोगिताएं होती हैं।

फ़ास्ट सिंक एक नया वर्टिकल सिंक विकल्प है जिसमें छवि में चित्र आँसू की दृश्य कलाकृतियाँ नहीं होती हैं और यह एक निश्चित ताज़ा दर से बंधा नहीं होता है, जो विलंबता को बढ़ाता है। काउंटर-स्ट्राइक: ग्लोबल ऑफेंसिव जैसे खेलों में वर्टिकल सिंक में क्या समस्या है? यह गेम कई सौ फ्रेम प्रति सेकंड पर शक्तिशाली आधुनिक जीपीयू पर चलता है, और खिलाड़ी के पास एक विकल्प होता है: वर्टिकल सिंक को सक्षम करना या नहीं।

मल्टीप्लेयर गेम में, उपयोगकर्ता अक्सर न्यूनतम विलंबता का पीछा करते हैं और VSync को अक्षम कर देते हैं, जिससे छवि में स्पष्ट रूप से दिखाई देने वाले आंसू आ जाते हैं, जो उच्च फ्रेम दर पर भी बेहद अप्रिय होते हैं। यदि आप वर्टिकल सिंक को सक्षम करते हैं, तो खिलाड़ी को अपने कार्यों और स्क्रीन पर छवि के बीच देरी में उल्लेखनीय वृद्धि का अनुभव होगा जब ग्राफिक्स पाइपलाइन मॉनिटर की ताज़ा दर तक धीमी हो जाती है।

इस तरह एक पारंपरिक कन्वेयर काम करता है। लेकिन एनवीडिया ने फास्ट सिंक तकनीक का उपयोग करके प्रतिपादन और प्रदर्शन प्रक्रिया को अलग करने का निर्णय लिया। यह GPU के उस हिस्से को अनुमति देता है जो फ्रेम को पूरी गति से प्रस्तुत कर रहा है ताकि वे यथासंभव कुशलता से काम करना जारी रख सकें, उन फ़्रेमों को एक विशेष अस्थायी अंतिम रेंडर बफर में संग्रहीत कर सकें।

यह विधि आपको कम विलंबता प्राप्त करते हुए, लेकिन छवि कलाकृतियों के बिना, प्रदर्शन पद्धति को बदलने और VSync चालू और VSync बंद मोड से सर्वश्रेष्ठ लेने की अनुमति देती है। फास्ट सिंक के साथ, कोई फ्रेम प्रवाह नियंत्रण नहीं है, गेम इंजन ऑफ-सिंक मोड में चलता है और अगले एक के ड्रा होने तक प्रतीक्षा करने के लिए नहीं कहा जाता है, इसलिए देरी लगभग उतनी ही कम होती है जितनी VSync ऑफ मोड में होती है। लेकिन चूंकि फास्ट सिंक स्वतंत्र रूप से पूरे फ्रेम को प्रदर्शित करने और प्रदर्शित करने के लिए बफर का चयन करता है, इसलिए कोई चित्र विराम भी नहीं है।

फास्ट सिंक तीन अलग-अलग बफर का उपयोग करता है, जिनमें से पहले दो क्लासिक पाइपलाइन में डबल बफरिंग के समान काम करते हैं। प्राथमिक बफर (फ्रंट बफर - एफबी) एक बफर है जिससे डिस्प्ले पर सूचना प्रदर्शित होती है, एक पूरी तरह से प्रस्तुत फ्रेम। बैक बफर (बीबी) वह बफर है जिसमें प्रतिपादन के दौरान जानकारी प्राप्त होती है।

उच्च फ्रेम दर वातावरण में लंबवत सिंक का उपयोग करते समय, स्क्रीन पर पूरे फ्रेम को प्रदर्शित करने के लिए माध्यमिक बफर के साथ प्राथमिक बफर को स्वैप करने के लिए रीफ्रेश अंतराल तक पहुंचने तक गेम प्रतीक्षा करता है। यह प्रक्रिया को धीमा कर देता है, और पारंपरिक ट्रिपल बफ़रिंग जैसे अतिरिक्त बफ़र्स जोड़ने से केवल विलंबता बढ़ेगी।

फास्ट सिंक एक तीसरा लास्ट रेंडर्ड बफर (LRB) जोड़ता है जिसका उपयोग बैक बफर में सिर्फ रेंडर किए गए सभी फ्रेम को होल्ड करने के लिए किया जाता है। बफर का नाम अपने लिए बोलता है, इसमें अंतिम पूरी तरह से रेंडर किए गए फ्रेम की एक प्रति होती है। और जब प्राथमिक बफ़र को अद्यतन करने का समय आता है, तो इस LRB बफ़र को प्राथमिक रूप से कॉपी किया जाता है, न कि भागों में, जैसे कि द्वितीयक से जब लंबवत सिंक अक्षम होता है। चूंकि बफ़र्स से जानकारी कॉपी करना अप्रभावी है, वे बस स्वैप (या नाम बदलें, क्योंकि यह समझने में अधिक सुविधाजनक होगा), और GP104 में पेश किए गए बफ़र्स को स्वैप करने के लिए नया तर्क इस प्रक्रिया को नियंत्रित करता है।

व्यवहार में, नई फास्ट सिंक सिंक्रोनाइज़ेशन विधि को सक्षम करना अभी भी पूरी तरह से अक्षम वर्टिकल सिंक की तुलना में थोड़ा अधिक विलंब प्रदान करता है - औसतन, 8 एमएस अधिक, लेकिन स्क्रीन पर अप्रिय कलाकृतियों के बिना, मॉनिटर पर पूरे फ्रेम को प्रदर्शित करता है, छवि को फाड़ता है . नई विधि को वर्टिकल सिंक कंट्रोल सेक्शन में एनवीडिया कंट्रोल पैनल की ग्राफिकल सेटिंग्स से सक्षम किया जा सकता है। हालाँकि, डिफ़ॉल्ट मान एप्लिकेशन नियंत्रण है, और आपको बस सभी 3D अनुप्रयोगों में फास्ट सिंक को सक्षम करने की आवश्यकता नहीं है, विशेष रूप से उच्च FPS वाले गेम के लिए इस पद्धति को चुनना बेहतर है।

आभासी वास्तविकता प्रौद्योगिकियां एनवीडिया वीआरवर्क्स

हम इस लेख में पहले से ही आभासी वास्तविकता के गर्म विषय पर एक से अधिक बार स्पर्श कर चुके हैं, लेकिन यह मुख्य रूप से फ्रेम दर को बढ़ाने और कम विलंबता सुनिश्चित करने के बारे में था, जो वीआर के लिए बहुत महत्वपूर्ण हैं। यह सब बहुत महत्वपूर्ण है और वास्तव में प्रगति हो रही है, लेकिन अभी तक वीआर गेम "नियमित" आधुनिक 3 डी गेम के सर्वश्रेष्ठ के रूप में प्रभावशाली होने से बहुत दूर हैं। यह केवल इसलिए नहीं होता है क्योंकि अग्रणी गेम डेवलपर्स अभी तक विशेष रूप से वीआर अनुप्रयोगों में नहीं लगे हैं, बल्कि फ्रेम दर पर वीआर की अधिक मांगों के कारण भी है, जो इस तरह के गेम में कई सामान्य तकनीकों के उपयोग की अनुमति नहीं देता है। उच्च मांगें।

वीआर गेम और नियमित गेम के बीच गुणवत्ता में अंतर को कम करने के लिए, एनवीडिया ने संबंधित वीआरवर्क्स प्रौद्योगिकियों का एक पूरा पैकेज जारी करने का फैसला किया, जिसमें बड़ी संख्या में एपीआई, पुस्तकालय, इंजन और प्रौद्योगिकियां शामिल थीं जो वीआर की गुणवत्ता और प्रदर्शन दोनों में काफी सुधार कर सकती हैं। आवेदन। यह पास्कल में पहले गेम समाधान की घोषणा से कैसे संबंधित है? यह बहुत आसान है - उत्पादकता बढ़ाने और गुणवत्ता में सुधार करने में मदद करने के लिए इसमें कुछ तकनीकों को पेश किया गया है, और हम उनके बारे में पहले ही लिख चुके हैं।

और हालांकि यह केवल ग्राफिक्स के बारे में नहीं है, हम आपको पहले इसके बारे में थोड़ा बताएंगे। VRWorks ग्राफ़िक्स तकनीकों के सेट में पहले बताई गई तकनीकें शामिल हैं, जैसे कि लेंस मैचेड शेडिंग, जो GeForce GTX 1080 में दिखाई देने वाली बहु-प्रक्षेपण सुविधा का उपयोग करती है। नया उत्पाद आपको संबंध में 1.5-2 गुना की प्रदर्शन वृद्धि प्राप्त करने की अनुमति देता है। उन समाधानों के लिए जिनके पास ऐसा समर्थन नहीं है। हमने अन्य तकनीकों का भी उल्लेख किया, जैसे कि मल्टीरेस शेडिंग, जिसे फ्रेम के केंद्र में और इसकी परिधि में विभिन्न प्रस्तावों पर प्रतिपादन के लिए डिज़ाइन किया गया है।

लेकिन बहुत अधिक अप्रत्याशित VRWorks ऑडियो तकनीक की घोषणा थी, जिसे 3D दृश्यों में ऑडियो डेटा के उच्च-गुणवत्ता वाले प्रसंस्करण के लिए डिज़ाइन किया गया था, जो कि वर्चुअल रियलिटी सिस्टम में विशेष रूप से महत्वपूर्ण है। पारंपरिक इंजनों में, आभासी वातावरण में ध्वनि स्रोतों की स्थिति की गणना काफी सही ढंग से की जाती है, यदि दुश्मन दाईं ओर से गोली मारता है, तो ऑडियो सिस्टम के इस तरफ से ध्वनि जोर से सुनाई देती है, और यह गणना कंप्यूटिंग शक्ति पर बहुत अधिक मांग नहीं करती है। .

लेकिन वास्तव में ध्वनियाँ न केवल खिलाड़ी तक जाती हैं, बल्कि सभी दिशाओं में जाती हैं और विभिन्न सामग्रियों से परावर्तित होती हैं, जैसे प्रकाश किरणें परावर्तित होती हैं। और वास्तव में, हम इन प्रतिबिंबों को सुनते हैं, हालांकि प्रत्यक्ष ध्वनि तरंगों के रूप में स्पष्ट रूप से नहीं। ये अप्रत्यक्ष ध्वनि प्रतिबिंब आमतौर पर विशेष रीवरब प्रभावों द्वारा सिम्युलेटेड होते हैं, लेकिन यह कार्य के लिए एक बहुत ही आदिम दृष्टिकोण है।

VRWorks ऑडियो पैकेज रेंडरिंग में रे ट्रेसिंग के समान ध्वनि तरंगों का उपयोग करता है, जहां आभासी दृश्य में वस्तुओं से कई प्रतिबिंबों के लिए प्रकाश किरणों के पथ का पता लगाया जाता है। VRWorks ऑडियो पर्यावरण में ध्वनि तरंगों के प्रसार का भी अनुकरण करता है, जहां प्रत्यक्ष और परावर्तित तरंगों को ट्रैक किया जाता है, जो घटना के कोण और परावर्तक सामग्री के गुणों पर निर्भर करता है। अपने काम में, VRWorks Audio उच्च-प्रदर्शन रे ट्रेसिंग इंजन Nvidia OptiX का उपयोग करता है, जिसे ग्राफिक्स कार्यों के लिए जाना जाता है। OptiX का उपयोग विभिन्न प्रकार के कार्यों के लिए किया जा सकता है जैसे अप्रत्यक्ष रोशनी की गणना और लाइटमैप तैयार करना, और अब VRWorks ऑडियो में ध्वनि तरंगों का पता लगाने के लिए।

एनवीडिया ने अपने वीआर फनहाउस डेमो में सटीक ध्वनि तरंग गणना का निर्माण किया है, जो हजारों बीम का उपयोग करता है और वस्तुओं से 12 प्रतिबिंबों की गणना करता है। और एक स्पष्ट उदाहरण का उपयोग करके प्रौद्योगिकी के लाभों को जानने के लिए, हमारा सुझाव है कि आप रूसी में प्रौद्योगिकी के संचालन के बारे में एक वीडियो देखें:

यह महत्वपूर्ण है कि एनवीडिया का दृष्टिकोण पारंपरिक ध्वनि इंजनों से अलग है, जिसमें मुख्य प्रतियोगी से GPU में एक विशेष ब्लॉक का उपयोग करके हार्डवेयर त्वरित विधि शामिल है। ये सभी विधियां केवल ध्वनि स्रोतों की सटीक स्थिति प्रदान करती हैं, लेकिन 3D दृश्य में वस्तुओं से ध्वनि तरंगों के प्रतिबिंबों की गणना नहीं करती हैं, हालांकि वे पुनर्संयोजन प्रभाव का उपयोग करके इसका अनुकरण कर सकते हैं। और फिर भी, किरण अनुरेखण तकनीक का उपयोग करना अधिक यथार्थवादी हो सकता है, क्योंकि केवल यह दृष्टिकोण दृश्य में वस्तुओं के आकार, आकार और सामग्री को ध्यान में रखते हुए विभिन्न ध्वनियों की सटीक नकल प्रदान करेगा। यह कहना मुश्किल है कि एक विशिष्ट खिलाड़ी के लिए गणना की ऐसी सटीकता की आवश्यकता होती है, लेकिन हम निश्चित रूप से कह सकते हैं: वीआर में, यह उपयोगकर्ताओं को बहुत ही यथार्थवाद जोड़ सकता है जो अभी भी नियमित खेलों में कमी है।

खैर, हमें आपको केवल VR SLI तकनीक के बारे में बताना है, जो OpenGL और DirectX दोनों में काम करती है। इसका सिद्धांत बेहद सरल है: वीआर एप्लिकेशन में एक डुअल-प्रोसेसर वीडियो सिस्टम इस तरह से काम करेगा कि एएफआर रेंडरिंग के विपरीत, प्रत्येक आंख को एक अलग जीपीयू आवंटित किया जाए, जो कि एसएलआई कॉन्फ़िगरेशन के लिए सामान्य है। यह वर्चुअल रियलिटी सिस्टम के लिए महत्वपूर्ण समग्र प्रदर्शन में काफी सुधार करता है। सिद्धांत रूप में, आप अधिक GPU का उपयोग कर सकते हैं, लेकिन उनकी संख्या सम होनी चाहिए।

इस दृष्टिकोण की आवश्यकता थी क्योंकि एएफआर वीआर के लिए अच्छी तरह से अनुकूल नहीं है, क्योंकि इसकी मदद से पहला जीपीयू दोनों आंखों के लिए एक समान फ्रेम प्रदान करेगा, और दूसरा - एक अजीब, जो किसी भी तरह से महत्वपूर्ण विलंबता को कम नहीं करता है आभासी वास्तविकता प्रणालियों के लिए। हालांकि फ्रेम रेट काफी ज्यादा होगा। तो वीआर एसएलआई की मदद से, प्रत्येक फ्रेम पर काम दो जीपीयू में बांटा गया है - एक बाईं आंख के लिए फ्रेम के एक हिस्से पर काम करता है, दूसरा दाएं के लिए, और फिर फ्रेम के इन हिस्सों को एक पूरे में जोड़ दिया जाता है।

GPU की एक जोड़ी के बीच काम का यह विभाजन लगभग 2x प्रदर्शन लाभ लाता है, जिससे उच्च फ्रेम दर और सिंगल-जीपीयू सिस्टम की तुलना में कम विलंबता की अनुमति मिलती है। हालांकि, इस स्केलिंग पद्धति का उपयोग करने के लिए VR SLI के उपयोग के लिए एप्लिकेशन से विशेष समर्थन की आवश्यकता होती है। लेकिन वीआर एसएलआई तकनीक पहले से ही वीआर डेमो अनुप्रयोगों में निर्मित है जैसे कि वाल्व से लैब और आईएलएमएक्सएलएबी से टैटूइन पर परीक्षण, और यह सिर्फ शुरुआत है - एनवीडिया अन्य अनुप्रयोगों की आसन्न उपस्थिति के साथ-साथ गेम इंजन में प्रौद्योगिकी की शुरूआत का वादा करता है। अवास्तविक इंजन 4, एकता और मैक्सप्ले।

एंसल गेम स्क्रीनशॉट प्लेटफॉर्म

सबसे दिलचस्प सॉफ्टवेयर से संबंधित घोषणाओं में से एक गेमिंग अनुप्रयोगों में उच्च-गुणवत्ता वाले स्क्रीनशॉट को कैप्चर करने के लिए एक तकनीक का विमोचन था, जिसका नाम एक प्रसिद्ध फोटोग्राफर - एंसेल के नाम पर रखा गया था। खेल लंबे समय से न केवल खेल बन गए हैं, बल्कि एक ऐसी जगह भी हैं जहां विभिन्न रचनात्मक व्यक्तित्वों द्वारा शरारती हाथों का उपयोग किया जाता है। कोई गेम के लिए स्क्रिप्ट बदलता है, कोई गेम के लिए उच्च-गुणवत्ता वाले टेक्सचर सेट जारी करता है, और कोई सुंदर स्क्रीनशॉट बनाता है।

एनवीडिया ने खेलों से उच्च गुणवत्ता वाली तस्वीरें बनाने के लिए एक नया मंच पेश करके बाद की मदद करने का फैसला किया (ठीक है, क्योंकि यह इतनी सरल प्रक्रिया नहीं है)। उनका मानना ​​​​है कि एंसल एक नई तरह की समकालीन कला बनाने में मदद कर सकता है। आखिरकार, पहले से ही काफी कलाकार हैं जो अपना अधिकांश जीवन पीसी पर बिताते हैं, गेम से सुंदर स्क्रीनशॉट बनाते हैं, और उनके पास अभी भी इसके लिए एक सुविधाजनक उपकरण नहीं है।

Ansel आपको न केवल खेल में छवि को कैप्चर करने की अनुमति देता है, बल्कि इसे उस तरह से बदलने की अनुमति देता है जिस तरह से निर्माता को इसकी आवश्यकता होती है। इस तकनीक के साथ, आप कैमरे को दृश्य के चारों ओर घुमा सकते हैं, घुमा सकते हैं और फ्रेम की वांछित संरचना प्राप्त करने के लिए इसे किसी भी दिशा में झुका सकते हैं। उदाहरण के लिए, प्रथम-व्यक्ति निशानेबाजों जैसे खेलों में, आप केवल खिलाड़ी को स्थानांतरित कर सकते हैं, आप कुछ और नहीं बदल सकते हैं, इसलिए सभी स्क्रीनशॉट बहुत नीरस हैं। Ansel में एक मुफ्त कैमरे के साथ, आप गेम कैमरे से बहुत आगे जा सकते हैं, एक सफल चित्र के लिए आवश्यक कोण का चयन कर सकते हैं, या यहां तक ​​कि आवश्यक बिंदु से पूर्ण 360-डिग्री स्टीरियो छवि कैप्चर कर सकते हैं, और बाद में देखने के लिए उच्च रिज़ॉल्यूशन में एक वीआर हेडसेट।

Ansel काफी सरलता से काम करता है - Nvidia की एक विशेष लाइब्रेरी का उपयोग करके, यह प्लेटफ़ॉर्म गेम कोड में अंतर्निहित है। ऐसा करने के लिए, इसके डेवलपर को केवल अपने प्रोजेक्ट में कोड का एक छोटा सा टुकड़ा जोड़ने की जरूरत है ताकि एनवीडिया वीडियो ड्राइवर को बफ़र्स और शेडर्स से डेटा को इंटरसेप्ट करने की अनुमति मिल सके। वहाँ बहुत कम काम है, खेल में एंसेल के कार्यान्वयन को लागू होने में एक दिन से भी कम समय लगता है। तो, इस सुविधा को गेम द विटनेस में शामिल करने से कोड की लगभग 40 लाइनें ली गईं, और द विचर 3 में - कोड की लगभग 150 लाइनें।

एंसल एक खुले विकास पैकेज - एसडीके के साथ दिखाई देगा। मुख्य बात यह है कि उपयोगकर्ता को उसके साथ सेटिंग्स का एक मानक सेट मिलता है जो उसे कैमरे की स्थिति और कोण बदलने, प्रभाव जोड़ने आदि की अनुमति देता है। परिणाम एक नियमित स्क्रीनशॉट, 360-डिग्री चित्र, स्टीरियो जोड़ी के रूप में होता है। या सिर्फ एक विशाल संकल्प का एक चित्रमाला।

एकमात्र चेतावनी: सभी खेलों को एंसल गेम स्क्रीनशॉट प्लेटफॉर्म की सभी विशेषताओं के लिए समर्थन प्राप्त नहीं होगा। कुछ गेम डेवलपर्स, एक कारण या किसी अन्य के लिए, अपने गेम में पूरी तरह से मुफ्त कैमरा शामिल नहीं करना चाहते हैं - उदाहरण के लिए, धोखेबाजों द्वारा इस कार्यक्षमता का उपयोग करने की संभावना के कारण। या वे उसी कारण से व्यूइंग एंगल में बदलाव को प्रतिबंधित करना चाहते हैं - ताकि किसी को अनुचित लाभ न मिले। ठीक है, या इसलिए कि उपयोगकर्ता पृष्ठभूमि में मनहूस स्प्राइट्स नहीं देखते हैं। ये सभी गेम क्रिएटर्स की काफी सामान्य इच्छाएं हैं।

Ansel की सबसे दिलचस्प विशेषताओं में से एक सिर्फ एक विशाल रिज़ॉल्यूशन के स्क्रीनशॉट का निर्माण है। इससे कोई फर्क नहीं पड़ता कि खेल 4K तक के प्रस्तावों का समर्थन करता है, उदाहरण के लिए, और उपयोगकर्ता का मॉनिटर फुल एचडी है। स्क्रीनशॉट लेने के लिए मंच की मदद से, आप एक उच्च गुणवत्ता वाली छवि को कैप्चर कर सकते हैं, बल्कि ड्राइव के वॉल्यूम और प्रदर्शन द्वारा सीमित कर सकते हैं। प्लेटफ़ॉर्म आसानी से 4.5 गीगापिक्सेल तक के स्क्रीनशॉट को कैप्चर करता है, जिसे 3600 टुकड़ों से एक साथ सिला जाता है!

यह स्पष्ट है कि इस तरह की तस्वीरों में आप सभी विवरण देख सकते हैं, दूरी में पड़े अखबारों के पाठ के ठीक नीचे, यदि इस तरह का विवरण, सिद्धांत रूप में, खेल में प्रदान किया गया है - Ansel विस्तार के स्तर को नियंत्रित कर सकता है, सर्वोत्तम चित्र गुणवत्ता प्राप्त करने के लिए अधिकतम स्तर निर्धारित करना। लेकिन आप सुपरसैंपलिंग को भी सक्षम कर सकते हैं। यह सब आपको उन खेलों से चित्र बनाने की अनुमति देता है जिन्हें आप बड़े बैनर पर सुरक्षित रूप से प्रिंट कर सकते हैं और उनकी गुणवत्ता के बारे में शांत रह सकते हैं।

दिलचस्प बात यह है कि बड़ी छवियों को एक साथ जोड़ने के लिए एक विशेष CUDA-आधारित हार्डवेयर त्वरित कोड का उपयोग किया जाता है। आखिरकार, कोई भी वीडियो कार्ड एक बहु-गीगापिक्सेल छवि को समग्र रूप से प्रस्तुत नहीं कर सकता है, लेकिन यह इसे टुकड़ों में कर सकता है, जिसे आपको बाद में संयोजित करने की आवश्यकता है, प्रकाश, रंग आदि में संभावित अंतर को ध्यान में रखते हुए।

इस तरह के पैनोरमा को सिलाई करने के बाद, पूरे फ्रेम के लिए विशेष पोस्ट-प्रोसेसिंग का उपयोग किया जाता है, जिसे GPU पर भी त्वरित किया जाता है। और उच्च गतिशील रेंज छवियों को कैप्चर करने के लिए, आप एक विशेष छवि प्रारूप का उपयोग कर सकते हैं - EXR, औद्योगिक लाइट और मैजिक से एक खुला मानक, जिसका प्रत्येक चैनल में क्रोमा मान 16-बिट फ्लोटिंग पॉइंट फॉर्मेट (FP16) में दर्ज किया गया है।

यह प्रारूप आपको प्रसंस्करण के बाद छवि की चमक और गतिशील रेंज को बदलने की अनुमति देता है, इसे प्रत्येक विशिष्ट प्रदर्शन के लिए वांछित एक पर लाता है, उसी तरह जैसे कि कैमरों से रॉ प्रारूपों के साथ किया जाता है। और छवि प्रसंस्करण कार्यक्रमों में पोस्ट-प्रोसेसिंग फिल्टर के बाद के अनुप्रयोग के लिए, यह प्रारूप बहुत उपयोगी है, क्योंकि इसमें छवियों के लिए सामान्य प्रारूपों की तुलना में बहुत अधिक डेटा होता है।

लेकिन एंसल प्लेटफॉर्म में पोस्ट-प्रोसेसिंग के लिए कई फिल्टर हैं, जो विशेष रूप से महत्वपूर्ण है क्योंकि इसमें न केवल अंतिम छवि तक पहुंच है, बल्कि गेम द्वारा उपयोग किए जाने वाले सभी बफ़र्स तक भी पहुंच है, जिसका उपयोग बहुत ही रोचक प्रभावों के लिए किया जा सकता है, जैसे क्षेत्र की गहराई। ऐसा करने के लिए, Ansel के पास पोस्ट-प्रोसेसिंग के लिए एक समर्पित API है, और इस प्लेटफ़ॉर्म के समर्थन के साथ किसी भी प्रभाव को गेम में शामिल किया जा सकता है।

Ansel पोस्ट फिल्टर में इस तरह के फिल्टर शामिल हैं: कलर कर्व्स, कलर स्पेस, ट्रांसफॉर्मेशन, डिसैचुरेशन, ब्राइटनेस / कंट्रास्ट, फिल्म ग्रेन, ब्लूम, लेंस फ्लेयर, एनामॉर्फिक ग्लेयर, डिस्टॉर्शन, हीथेज, फिशआई, कलर एबेरेशन, टोन मैपिंग, लेंस डर्ट, लाइटशाफ्ट। विगनेट, गामा करेक्शन, कनवल्शन, शार्पनिंग, एज डिटेक्शन, ब्लर, सेपिया, डेनोइस, एफएक्सएए और अन्य।

खेलों में एंसल समर्थन की उपस्थिति के लिए, आपको थोड़ा इंतजार करना होगा जबकि डेवलपर्स इसे लागू करते हैं और इसका परीक्षण करते हैं। लेकिन एनवीडिया ने वादा किया है कि इस तरह के समर्थन जल्द ही द डिवीजन, द विटनेस, लॉब्रेकर्स, द विचर 3, पैरागॉन, फ़ोर्टनाइट, ऑबडक्शन, नो मैन्स स्काई, अवास्तविक टूर्नामेंट और अन्य जैसे प्रसिद्ध खेलों में दिखाई देंगे।

नई 16 एनएम FinFET तकनीकी प्रक्रिया और वास्तुकला अनुकूलन ने GP104 GPU पर आधारित GeForce GTX 1080 ग्राफिक्स कार्ड को संदर्भ रूप में भी 1.6-1.7 GHz की उच्च घड़ी की गति प्राप्त करने की अनुमति दी, और एक नई पीढ़ी उच्चतम संभव आवृत्तियों पर संचालन की गारंटी देती है। खेलों में। GPU बूस्ट तकनीक। निष्पादन इकाइयों की बढ़ती संख्या के साथ, इन सुधारों ने नए उत्पाद को न केवल उच्चतम प्रदर्शन करने वाला एकल-चिप वीडियो कार्ड बना दिया है, बल्कि बाजार पर सबसे अधिक ऊर्जा कुशल समाधान भी बनाया है।

GeForce GTX 1080 एक नए प्रकार की ग्राफिक्स मेमोरी, GDDR5X, उच्च गति वाले चिप्स की एक नई पीढ़ी को पेश करने वाला पहला ग्राफिक्स कार्ड है जो बहुत उच्च डेटा दर प्राप्त करता है। GeForce GTX 1080 संशोधन के मामले में, इस प्रकार की मेमोरी 10 GHz की प्रभावी आवृत्ति पर काम करती है। फ़्रेमबफ़र में जानकारी को संपीड़ित करने के लिए बेहतर एल्गोरिदम के साथ, इसने अपने प्रत्यक्ष पूर्ववर्ती, GeForce GTX 980 की तुलना में इस GPU के लिए प्रभावी मेमोरी बैंडविड्थ में 1.7x की वृद्धि की है।

एनवीडिया ने बुद्धिमानी से अपने लिए पूरी तरह से नई तकनीकी प्रक्रिया पर एक मौलिक नई वास्तुकला जारी नहीं करने का फैसला किया, ताकि विकास और उत्पादन के दौरान अनावश्यक समस्याओं का सामना न करना पड़े। इसके बजाय, उन्होंने पहले से ही अच्छे और अत्यधिक कुशल मैक्सवेल आर्किटेक्चर में कुछ विशेषताओं को जोड़ते हुए गंभीरता से सुधार किया है। नतीजतन, नए GPU के उत्पादन के साथ सब कुछ ठीक है, और GeForce GTX 1080 मॉडल के मामले में, इंजीनियरों ने बहुत उच्च आवृत्ति क्षमता हासिल की है - भागीदारों से ओवरक्लॉक किए गए संस्करणों में, GPU आवृत्ति 2 GHz तक होने की उम्मीद है! यह प्रभावशाली आवृत्ति सही तकनीकी प्रक्रिया और पास्कल जीपीयू के विकास में एनवीडिया इंजीनियरों के श्रमसाध्य कार्य के लिए एक वास्तविकता बन गई है।

जबकि पास्कल मैक्सवेल मामले का प्रत्यक्ष उत्तराधिकारी बन गया है, और ये ग्राफिक्स आर्किटेक्चर मौलिक रूप से एक दूसरे से बहुत अलग नहीं हैं, एनवीडिया ने कई बदलाव और सुधार लागू किए हैं, जिसमें प्रदर्शन क्षमताएं, वीडियो एन्कोडिंग और डिकोडिंग इंजन, विभिन्न प्रकार के एसिंक्रोनस निष्पादन में सुधार शामिल है। GPU पर गणना, मल्टी-चिप रेंडरिंग में बदलाव किए और सिंक्रोनाइज़ेशन फास्ट सिंक की एक नई विधि पेश की।

मल्टीप्रोजेक्शन एक साथ मल्टी-प्रोजेक्शन की तकनीक को अलग करना असंभव नहीं है, जो वर्चुअल रियलिटी सिस्टम में प्रदर्शन को बढ़ाने में मदद करता है, मल्टी-मॉनिटर सिस्टम पर दृश्यों का अधिक सही प्रदर्शन प्राप्त करता है, और प्रदर्शन को अनुकूलित करने के लिए नई तकनीकों को पेश करता है। लेकिन गति में सबसे बड़ा लाभ वीआर अनुप्रयोगों द्वारा प्राप्त किया जाएगा जब वे मल्टीप्रोजेक्शन तकनीक का समर्थन करते हैं, जो कि ज्यामितीय डेटा को संसाधित करते समय और पिक्सेल-दर-पिक्सेल गणना में डेढ़ गुना जीपीयू संसाधनों को बचाने में मदद करता है।

विशुद्ध रूप से सॉफ़्टवेयर परिवर्तनों में, Ansel नामक गेम में स्क्रीनशॉट बनाने का प्लेटफ़ॉर्म सबसे अलग है - न केवल कई खिलाड़ियों के लिए, बल्कि उच्च-गुणवत्ता वाले 3D ग्राफिक्स में रुचि रखने वालों के लिए भी इसे अभ्यास में आज़माना दिलचस्प होगा। नवीनता आपको स्क्रीनशॉट बनाने और फिर से छूने की कला को अगले स्तर तक ले जाने की अनुमति देती है। खैर, एनवीडिया गेम डेवलपर्स के लिए अपने पैकेजों में सुधार करना जारी रखता है, जैसे कि गेमवर्क्स और वीआरवर्क्स, कदम से कदम - इसलिए, बाद में, उच्च-गुणवत्ता वाले ध्वनि प्रसंस्करण की एक दिलचस्प संभावना दिखाई दी है, जिसमें ध्वनि तरंगों के कई प्रतिबिंबों का उपयोग करना शामिल है। हार्डवेयर किरण अनुरेखण।

सामान्य तौर पर, एक वास्तविक नेता ने Nvidia GeForce GTX 1080 वीडियो कार्ड के रूप में बाजार में प्रवेश किया, इसके लिए सभी आवश्यक गुण हैं: उच्च प्रदर्शन और व्यापक कार्यक्षमता, साथ ही नई सुविधाओं और एल्गोरिदम के लिए समर्थन। इस वीडियो कार्ड के पहले खरीदार तुरंत उल्लेख किए गए कई लाभों की सराहना करने में सक्षम होंगे, और समाधान की अन्य संभावनाएं थोड़ी देर बाद सामने आएंगी, जब सॉफ्टवेयर से व्यापक समर्थन मिलेगा। मुख्य बात यह है कि GeForce GTX 1080 बहुत तेज और कुशल निकला, और कुछ समस्या क्षेत्रों (समान अतुल्यकालिक गणना), जैसा कि हम वास्तव में आशा करते हैं, इसे ठीक करने के लिए एनवीडिया इंजीनियरों द्वारा प्रबंधित किया गया था।

ग्राफिक्स एक्सेलेरेटर GeForce GTX 1070

पैरामीटरअर्थ
चिप कोडनेमGP104
उत्पादन प्रौद्योगिकी१६ एनएम फिनफेट
ट्रांजिस्टर की संख्या7.2 अरब
मूल भाग314 मिमी²
आर्किटेक्चरकई प्रकार के डेटा की स्ट्रीमिंग प्रोसेसिंग के लिए सामान्य प्रोसेसर की एक सरणी के साथ एकीकृत: कोने, पिक्सेल, आदि।
डायरेक्टएक्स हार्डवेयर सपोर्टDirectX 12, फ़ीचर स्तर 12_1 . के समर्थन के साथ
मेमोरी बस256-बिट: GDDR5 और GDDR5X मेमोरी का समर्थन करने वाले आठ स्वतंत्र 32-बिट मेमोरी कंट्रोलर
GPU आवृत्ति१५०६ (१६८३) मेगाहर्ट्ज
कंप्यूटिंग इकाइयांआईईईई 754-2008 मानक के ढांचे के भीतर फ्लोटिंग पॉइंट गणना के लिए 1920 (256 में से) स्केलर एएलयू सहित 15 सक्रिय (चिप में 20 में से) स्ट्रीमिंग मल्टीप्रोसेसर;
बनावट ब्लॉक120 सक्रिय (चिप में 160 में से) बनावट में FP16 और FP32 घटकों के समर्थन के साथ टेक्सचर एड्रेसिंग और फ़िल्टरिंग इकाइयाँ और सभी बनावट स्वरूपों के लिए ट्रिलिनियर और अनिसोट्रोपिक फ़िल्टरिंग के लिए समर्थन
रास्टर ऑपरेशन ब्लॉक (आरओपी)विभिन्न एंटी-अलियासिंग मोड के समर्थन के साथ 8 चौड़े आरओपी ब्लॉक (64 पिक्सल), जिनमें एफपी16 या एफपी32 फ्रेमबफर प्रारूप के साथ प्रोग्राम करने योग्य मोड शामिल हैं। ब्लॉक में विन्यास योग्य ALU की एक सरणी होती है और यह गहराई, बहु-नमूनाकरण और सम्मिश्रण की पीढ़ी और तुलना के लिए जिम्मेदार होते हैं।
मॉनिटर समर्थनचार ड्यूल लिंक डीवीआई, एचडीएमआई 2.0 बी और डिस्प्लेपोर्ट 1.2 (1.3 / 1.4 रेडी) मॉनिटर के लिए एकीकृत समर्थन

GeForce GTX 1070 संदर्भ ग्राफिक्स कार्ड निर्दिष्टीकरण
पैरामीटरअर्थ
कोर आवृत्ति१५०६ (१६८३) मेगाहर्ट्ज
यूनिवर्सल प्रोसेसर की संख्या1920
बनावट इकाइयों की संख्या120
सम्मिश्रण ब्लॉकों की संख्या64
प्रभावी स्मृति आवृत्ति8000 (4 × 2000) मेगाहर्ट्ज
मेमोरी प्रकारजीडीडीआर5
मेमोरी बस256-बिट
याद8 जीबी
मेमोरी बैंडविड्थ256 जीबी / एस
कम्प्यूटेशनल प्रदर्शन (FP32)लगभग 6.5 टेराफ्लॉप्स
सैद्धांतिक अधिकतम भरण दर९६ गीगापिक्सेल/सेकंड
सैद्धांतिक बनावट नमूनाकरण दर१८१ गीगाटेक्सल्स / वर्ग
टायरपीसीआई एक्सप्रेस 3.0
कनेक्टर्सएक डुअल लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट
ऊर्जा की खपत150 डब्ल्यू . तक
अतिरिक्त भोजनएक 8-पिन कनेक्टर
सिस्टम चेसिस में व्याप्त स्लॉट्स की संख्या2
अनुशंसित मूल्य$ 379-449 (यूएसए), 34,990 (रूस)

GeForce GTX 1070 वीडियो कार्ड को भी एक तार्किक नाम मिला, जो पिछली GeForce श्रृंखला के समान समाधान के समान था। यह अपने प्रत्यक्ष पूर्ववर्ती, GeForce GTX 970 से अलग है, केवल संशोधित पीढ़ी संख्या में। नवीनता कंपनी की वर्तमान लाइन में वर्तमान टॉप-एंड समाधान GeForce GTX 1080 की तुलना में एक कदम कम हो जाती है, जो कि अधिक से अधिक शक्ति के GPU पर समाधान जारी होने तक नई श्रृंखला का अस्थायी फ्लैगशिप बन गया है।

एनवीडिया के नए टॉप-एंड ग्राफिक्स कार्ड के लिए अनुशंसित मूल्य क्रमशः एनवीडिया भागीदारों के नियमित संस्करणों और विशेष संस्थापक संस्करण के लिए $ 379 और $ 449 हैं। शीर्ष मॉडल की तुलना में, यह एक बहुत अच्छी कीमत है क्योंकि GTX 1070 सबसे खराब स्थिति में लगभग 25% पीछे है। और घोषणा और रिलीज के समय, GTX 1070 अपनी कक्षा में सर्वश्रेष्ठ प्रदर्शन समाधान बन जाता है। GeForce GTX 1080 की तरह, GTX 1070 का AMD से कोई प्रत्यक्ष प्रतियोगी नहीं है, और इसकी तुलना केवल Radeon R9 390X और Fury से की जा सकती है।

उन्होंने GeForce GTX 1070 संशोधन में GP104 ग्राफिक्स प्रोसेसर के लिए पूर्ण 256-बिट मेमोरी बस को छोड़ने का फैसला किया, हालांकि उन्होंने एक नए प्रकार की GDDR5X मेमोरी का उपयोग नहीं किया, लेकिन एक बहुत तेज़ GDDR5, जो 8 GHz की उच्च प्रभावी आवृत्ति पर संचालित होता है। . ऐसी बस के साथ वीडियो कार्ड पर स्थापित मेमोरी की मात्रा 4 या 8 जीबी के बराबर हो सकती है, और उच्च सेटिंग्स और रेंडरिंग रिज़ॉल्यूशन की स्थितियों में नए समाधान के अधिकतम प्रदर्शन को सुनिश्चित करने के लिए, GeForce GTX 1070 वीडियो कार्ड मॉडल था अपनी बड़ी बहन की तरह 8 जीबी वीडियो मेमोरी से भी लैस है। यह वॉल्यूम किसी भी 3D एप्लिकेशन को कई वर्षों तक अधिकतम गुणवत्ता सेटिंग्स के साथ चलाने के लिए पर्याप्त है।

विशेष संस्करण GeForce GTX 1070 संस्थापक संस्करण

जब मई की शुरुआत में GeForce GTX 1080 की घोषणा की गई, तो फाउंडर्स एडिशन नामक ग्राफिक्स कार्ड के एक विशेष संस्करण की घोषणा की गई, जिसकी कीमत कंपनी के भागीदारों के सामान्य ग्राफिक्स कार्ड की तुलना में अधिक है। यही बात नए उत्पाद पर भी लागू होती है। इस लेख में, हम फिर से GeForce GTX 1070 ग्राफिक्स कार्ड के विशेष संस्करण के बारे में बात करेंगे जिसे फाउंडर्स एडिशन कहा जाता है। पुराने मॉडल की तरह, एनवीडिया ने निर्माता के संदर्भ वीडियो कार्ड के इस संस्करण को अधिक कीमत पर जारी करने का निर्णय लिया। उनका तर्क है कि हाई-एंड ग्राफिक्स कार्ड खरीदने वाले कई गेमर्स और उत्साही एक प्रीमियम लुक और फील वाला उत्पाद चाहते हैं।

तदनुसार, यह इन उपयोगकर्ताओं के लिए है कि GeForce GTX 1070 संस्थापक संस्करण बाजार में जारी किया जाएगा, जिसे प्रीमियम सामग्री और घटकों से Nvidia इंजीनियरों द्वारा डिज़ाइन और निर्मित किया गया है, जैसे कि GeForce GTX 1070 संस्थापक संस्करण का एल्यूमीनियम कवर, साथ ही साथ एक लो-प्रोफाइल बैकप्लेट के रूप में जो पीसीबी के पिछले हिस्से को कवर करता है और उत्साही लोगों के साथ काफी लोकप्रिय है।

जैसा कि आप बोर्ड की तस्वीरों से देख सकते हैं, GeForce GTX 1070 फाउंडर्स एडिशन को बिल्कुल वैसा ही औद्योगिक डिज़ाइन विरासत में मिला है, जो GeForce GTX 1080 फाउंडर्स एडिशन के संदर्भ संस्करण में निहित है। दोनों मॉडल एक रेडियल पंखे का उपयोग करते हैं जो गर्म हवा को बाहर की ओर उड़ाता है, जो छोटे मामलों और सीमित भौतिक स्थान के साथ मल्टी-चिप एसएलआई कॉन्फ़िगरेशन दोनों में बहुत उपयोगी है। हवाई जहाज़ के पहिये के अंदर इसे प्रसारित करने के बजाय गर्म हवा को बाहर उड़ाने से, यह थर्मल तनाव को कम कर सकता है, ओवरक्लॉकिंग परिणामों में सुधार कर सकता है, और सिस्टम घटकों के जीवन का विस्तार कर सकता है।

GeForce GTX 1070 रेफरेंस कूलिंग सिस्टम के कवर के नीचे, तीन एकीकृत कॉपर हीट पाइप के साथ एक विशेष रूप से आकार का एल्यूमीनियम हीटसिंक है जो GPU से ही गर्मी को हटाता है। ऊष्मा पाइपों द्वारा नष्ट की गई गर्मी को फिर एक एल्यूमीनियम हीट सिंक द्वारा नष्ट कर दिया जाता है। खैर, बोर्ड के पीछे लो-प्रोफाइल मेटल प्लेट को भी बेहतर थर्मल प्रदर्शन प्रदान करने के लिए डिज़ाइन किया गया है। इसमें SLI कॉन्फ़िगरेशन में कई ग्राफिक्स कार्ड के बीच बेहतर एयरफ्लो के लिए एक वापस लेने योग्य अनुभाग भी है।

बोर्ड की बिजली आपूर्ति के संदर्भ में, GeForce GTX 1070 फाउंडर्स एडिशन में स्थिर बिजली आपूर्ति के लिए अनुकूलित चार-चरण बिजली प्रणाली है। एनवीडिया का कहना है कि GTX 1070 फाउंडर्स एडिशन ने बेहतर ओवरक्लॉकिंग प्रदर्शन के लिए GeForce GTX 970 पर बिजली दक्षता, स्थिरता और विश्वसनीयता में सुधार किया है। कंपनी के अपने परीक्षणों में, GeForce GTX 1070 GPU ने आसानी से 1.9 GHz मान से बेहतर प्रदर्शन किया, जो पुराने GTX 1080 मॉडल के परिणामों के करीब है।

Nvidia GeForce GTX 1070 ग्राफिक्स कार्ड 10 जून से रिटेल स्टोर्स पर उपलब्ध होगा। GeForce GTX 1070 फाउंडर्स एडिशन और पार्टनर सॉल्यूशंस के लिए अनुशंसित मूल्य अलग-अलग हैं, और यह इस विशेष संस्करण के लिए सबसे बड़ा सवाल है। यदि एनवीडिया पार्टनर अपने GeForce GTX 1070 ग्राफिक्स कार्ड को $ 379 (अमेरिकी बाजार में) से शुरू करते हैं, तो Nvidia के संदर्भ डिजाइन के संस्थापक संस्करण की कीमत $ 449 होगी। क्या ऐसे कई उत्साही लोग हैं जो संदर्भ संस्करण के संदिग्ध लाभों के लिए, स्पष्ट रूप से, अधिक भुगतान करने को तैयार हैं? समय बताएगा, लेकिन हम मानते हैं कि बिक्री की शुरुआत में खरीद के लिए उपलब्ध विकल्प के रूप में संदर्भ बोर्ड अधिक दिलचस्प है, और बाद में इसे प्राप्त करने का बिंदु (और उच्च कीमत पर भी!) पहले से ही शून्य हो गया है।

यह जोड़ना बाकी है कि संदर्भ GeForce GTX 1070 का मुद्रित सर्किट बोर्ड पुराने वीडियो कार्ड के समान है और ये दोनों कंपनी के पिछले बोर्डों के डिवाइस से भिन्न हैं। नए उत्पाद के लिए सामान्य बिजली खपत मूल्य 150 डब्ल्यू है, जो जीटीएक्स 1080 के मूल्य से लगभग 20% कम है और पिछली पीढ़ी के जीईफ़ोर्स जीटीएक्स 970 की बिजली खपत के करीब है। संदर्भ एनवीडिया बोर्ड का एक परिचित सेट है छवि आउटपुट उपकरणों को जोड़ने के लिए कनेक्टर: एक डुअल-लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट। इसके अलावा, एचडीएमआई और डिस्प्लेपोर्ट के नए संस्करणों के लिए समर्थन दिखाई दिया, जिसके बारे में हमने जीटीएक्स 1080 मॉडल की समीक्षा में ऊपर लिखा था।

वास्तु परिवर्तन

GeForce GTX 1070 ग्राफिक्स कार्ड GP104 चिप पर आधारित है, जो Nvidia के पास्कल ग्राफिक्स आर्किटेक्चर की नई पीढ़ी का पहला है। इस आर्किटेक्चर ने मैक्सवेल में काम किए गए समाधानों के आधार के रूप में लिया, लेकिन इसमें कुछ कार्यात्मक अंतर भी हैं, जिनके बारे में हमने ऊपर विस्तार से लिखा है - टॉप-एंड GeForce GTX 1080 वीडियो कार्ड के लिए समर्पित भाग में।

नई वास्तुकला में मुख्य परिवर्तन तकनीकी प्रक्रिया थी जिसके द्वारा सभी नए जीपीयू निष्पादित किए जाएंगे। GP104 के उत्पादन में 16 एनएम FinFET प्रक्रिया प्रौद्योगिकी के उपयोग ने अपेक्षाकृत कम क्षेत्र और लागत को बनाए रखते हुए चिप की जटिलता को बढ़ाना संभव बना दिया, और पास्कल आर्किटेक्चर की पहली चिप में निष्पादन की एक बड़ी संख्या है। इकाइयाँ, जिनमें समान स्थिति के मैक्सवेल चिप्स की तुलना में नई कार्यक्षमता प्रदान करने वाली इकाइयां शामिल हैं।

GP104 वीडियो चिप इसकी संरचना में मैक्सवेल आर्किटेक्चर के समान समाधानों के समान है, और आप एनवीडिया से पिछले समाधानों की हमारी समीक्षाओं में आधुनिक जीपीयू के उपकरण के बारे में विस्तृत जानकारी पा सकते हैं। पिछले GPU की तरह, नए आर्किटेक्चर चिप्स में ग्राफिक्स प्रोसेसिंग क्लस्टर (GPCs), स्ट्रीमिंग मल्टीप्रोसेसर (SM) और मेमोरी कंट्रोलर के अलग-अलग कॉन्फ़िगरेशन होंगे, और GeForce GTX 1070 में कुछ बदलाव पहले ही हो चुके हैं - चिप का हिस्सा लॉक और निष्क्रिय है (ग्रे में हाइलाइट किया गया):

हालांकि GP104 GPU में चार GPC क्लस्टर और 20 SM मल्टीप्रोसेसर शामिल हैं, GeForce GTX 1070 के संस्करण में इसे हार्डवेयर द्वारा अक्षम एक GPC क्लस्टर के साथ एक स्ट्रिप-डाउन संशोधन प्राप्त हुआ। चूंकि प्रत्येक GPC में एक समर्पित रास्टरराइज़ेशन इंजन होता है और इसमें पाँच SM मल्टीप्रोसेसर शामिल होते हैं, और प्रत्येक मल्टीप्रोसेसर में 128 CUDA कोर और आठ TMU बनावट इकाइयाँ होती हैं, GP104 के इस संस्करण में 1920 CUDA कोर और 2560 स्ट्रीम प्रोसेसर से 120 TMU सक्रिय हैं। और 160 बनावट इकाइयाँ हैं। भौतिक रूप से उपलब्ध है।

ग्राफिक्स प्रोसेसर जिस पर GeForce GTX 1070 आधारित है, उसमें आठ 32-बिट मेमोरी कंट्रोलर होते हैं, जो अंतिम 256-बिट मेमोरी बस देते हैं - बिल्कुल पुराने GTX 1080 मॉडल की तरह। मेमोरी सबसिस्टम को पर्याप्त प्रदान करने के लिए नहीं काटा गया है GeForce GTX 1070 में GDDR5 मेमोरी का उपयोग करने की स्थिति के साथ बैंडविड्थ मेमोरी। आठ ROP और 256 KB L2 कैश प्रत्येक मेमोरी कंट्रोलर से जुड़े होते हैं, इसलिए इस संशोधन में GP104 चिप में 64 ROP और L2 कैश स्तर का 2048 KB भी होता है। .

वास्तु अनुकूलन और एक नई प्रक्रिया प्रौद्योगिकी के लिए धन्यवाद, GP104 GPU अब तक का सबसे अधिक ऊर्जा कुशल GPU बन गया है। नई प्रक्रिया प्रौद्योगिकी पर स्विच करते समय एनवीडिया इंजीनियर घड़ी की गति को अपेक्षा से अधिक बढ़ाने में सक्षम थे, जिसके लिए उन्हें कड़ी मेहनत करनी पड़ी, पिछले समाधानों की सभी बाधाओं की सावधानीपूर्वक जांच और अनुकूलन करना था, जो उन्हें एक पर काम करने की अनुमति नहीं देता था। उच्च आवृत्ति। तदनुसार, GeForce GTX 1070 भी बहुत उच्च आवृत्ति पर चलता है, GeForce GTX 970 के संदर्भ मूल्य से 40% अधिक है।

चूंकि GeForce GTX 1070 मॉडल, संक्षेप में, GDDR5 मेमोरी के साथ थोड़ा कम उत्पादक GTX 1080 है, यह उन सभी तकनीकों का समर्थन करता है जिनका हमने पिछले खंड में वर्णन किया था। पास्कल आर्किटेक्चर के साथ-साथ इसके द्वारा समर्थित तकनीकों के बारे में अधिक जानकारी के लिए, जैसे कि बेहतर वीडियो आउटपुट और प्रोसेसिंग यूनिट, Async कंप्यूट के लिए समर्थन, एक साथ मल्टी-प्रोजेक्शन तकनीक, SLI मल्टी-चिप रेंडरिंग में परिवर्तन और नया फास्ट सिंक प्रकार सिंक्रनाइज़ेशन के, कृपया GTX 1080 अनुभाग के साथ देखें।

उच्च-प्रदर्शन GDDR5 मेमोरी और इसका कुशल उपयोग

हमने ऊपर GP104 GPU के मेमोरी सबसिस्टम में बदलाव के बारे में लिखा है, जिस पर GeForce GTX 1080 और GTX 1070 मॉडल आधारित हैं - इस GPU में शामिल मेमोरी कंट्रोलर दोनों नए प्रकार की GDDR5X वीडियो मेमोरी का समर्थन करते हैं, जिसका विस्तार से वर्णन किया गया है GTX 1080 समीक्षा में, साथ ही साथ अच्छी पुरानी GDDR5 मेमोरी जिसे हम कई वर्षों से जानते हैं।

पुराने GTX 1080 की तुलना में युवा मॉडल GTX 1070 में मेमोरी बैंडविड्थ में बहुत अधिक नहीं खोने के लिए, सभी आठ 32-बिट मेमोरी नियंत्रकों को इसमें सक्रिय छोड़ दिया गया था, जिसमें एक पूर्ण 256-बिट सामान्य वीडियो मेमोरी इंटरफ़ेस प्राप्त हुआ था। इसके अलावा, वीडियो कार्ड बाजार में उपलब्ध उच्चतम गति वाली GDDR5 मेमोरी से लैस था - 8 GHz की प्रभावी ऑपरेटिंग आवृत्ति के साथ। यह सब 256 जीबी / एस की मेमोरी बैंडविड्थ प्रदान करता है, पुराने समाधान में 320 जीबी / एस के विपरीत - कंप्यूटिंग क्षमताओं को उसी राशि से काट दिया गया था, इसलिए शेष राशि का सम्मान किया गया था।

ध्यान रखें कि GPU प्रदर्शन के लिए चरम सैद्धांतिक बैंडविड्थ महत्वपूर्ण है, लेकिन आपको इस बात पर ध्यान देने की आवश्यकता है कि इसका कितनी कुशलता से उपयोग किया जाता है। रेंडरिंग के दौरान, कई अलग-अलग अड़चनें समग्र प्रदर्शन को सीमित कर सकती हैं, जिससे सभी उपलब्ध मेमोरी बैंडविड्थ का उपयोग होने से रोका जा सकता है। इन बाधाओं को कम करने के लिए, GPU पढ़ने और लिखने के संचालन की दक्षता में सुधार के लिए विशेष दोषरहित संपीड़न का उपयोग करते हैं।

पास्कल आर्किटेक्चर में, बफर सूचना के डेल्टा संपीड़न की चौथी पीढ़ी को पेश किया गया था, जो GPU को वीडियो मेमोरी बस की उपलब्ध क्षमताओं का अधिक कुशलता से उपयोग करने की अनुमति देता है। GeForce GTX 1070 और GTX 1080 में मेमोरी सबसिस्टम मेमोरी बैंडविड्थ आवश्यकताओं को कम करने के लिए डिज़ाइन की गई पुरानी और कई नई दोषरहित डेटा संपीड़न तकनीकों का उपयोग करता है। यह मेमोरी में लिखे गए डेटा की मात्रा को कम करता है, L2 कैश दक्षता में सुधार करता है, और GPU में विभिन्न बिंदुओं जैसे TMU और फ्रेमबफ़र के बीच स्थानांतरित डेटा की मात्रा को कम करता है।

GPU बूस्ट 3.0 और ओवरक्लॉकिंग सुविधाएँ

एनवीडिया के अधिकांश भागीदारों ने पहले ही GeForce GTX 1080 और GTX 1070 पर आधारित फैक्ट्री ओवरक्लॉक्ड समाधानों की घोषणा कर दी है। और कई वीडियो कार्ड निर्माता विशेष ओवरक्लॉकिंग उपयोगिताओं का निर्माण कर रहे हैं जो GPU बूस्ट 3.0 तकनीक की नई कार्यक्षमता का लाभ उठाते हैं। ऐसी उपयोगिताओं का एक उदाहरण ईवीजीए प्रेसिजन एक्सओसी है, जिसमें वोल्टेज बनाम आवृत्ति वक्र निर्धारित करने के लिए एक स्वचालित स्कैनर शामिल है - इस मोड में, प्रत्येक वोल्टेज मान के लिए, स्थिरता परीक्षण चलाकर, एक स्थिर आवृत्ति पाई जाती है जिस पर जीपीयू प्रदर्शन लाभ प्रदान करता है . हालाँकि, इस वक्र को मैन्युअल रूप से भी बदला जा सकता है।

हम पिछले एनवीडिया वीडियो कार्ड से जीपीयू बूस्ट तकनीक को अच्छी तरह जानते हैं। अपने GPU में, वे GPU की ऑपरेटिंग क्लॉक स्पीड को मोड में बढ़ाने के लिए डिज़ाइन की गई इस हार्डवेयर सुविधा का उपयोग करते हैं, जब यह अभी तक बिजली की खपत और गर्मी अपव्यय की सीमा तक नहीं पहुंचा है। पास्कल जीपीयू में, इस एल्गोरिथ्म में कई बदलाव हुए हैं, जिनमें से मुख्य वोल्टेज के आधार पर टर्बो फ़्रीक्वेंसी की बेहतर सेटिंग है।

यदि पहले बेस फ़्रीक्वेंसी और टर्बो फ़्रीक्वेंसी के बीच का अंतर तय किया गया था, तो GPU बूस्ट 3.0 में प्रत्येक वोल्टेज के लिए अलग से टर्बो फ़्रीक्वेंसी के ऑफ़सेट सेट करना संभव हो गया। टर्बो आवृत्ति अब प्रत्येक व्यक्तिगत वोल्टेज मान के लिए सेट की जा सकती है, जो आपको GPU से सभी ओवरक्लॉकिंग क्षमताओं को पूरी तरह से निचोड़ने की अनुमति देती है। हमने इस बारे में अपनी GeForce GTX 1080 समीक्षा में विस्तार से लिखा है, और आप इसके लिए EVGA प्रेसिजन XOC और MSI आफ्टरबर्नर उपयोगिताओं का उपयोग कर सकते हैं।

चूंकि जीपीयू बूस्ट 3.0 के समर्थन के साथ वीडियो कार्ड जारी करने के साथ ओवरक्लॉकिंग विधि में कुछ विवरण बदल गए हैं, इसलिए एनवीडिया को नए उत्पादों को ओवरक्लॉक करने के निर्देशों में अतिरिक्त स्पष्टीकरण देना पड़ा। विभिन्न चर विशेषताओं के साथ अलग-अलग ओवरक्लॉकिंग तकनीकें हैं जो अंतिम परिणाम को प्रभावित करती हैं। किसी भी प्रणाली के लिए, एक विशिष्ट विधि बेहतर अनुकूल हो सकती है, लेकिन आधार हमेशा एक जैसा होता है।

कई ओवरक्लॉकर सिस्टम की स्थिरता की जांच के लिए यूनिगिन हेवन 4.0 बेंचमार्क का उपयोग करते हैं, जो काम के साथ जीपीयू को पूरी तरह से लोड करता है, इसमें लचीली सेटिंग्स होती हैं और इसे ईवीजीए जैसे ओवरक्लॉकिंग और निगरानी के लिए उपयोगिता विंडो के साथ विंडो मोड में चलाया जा सकता है। प्रेसिजन या एमएसआई आफ्टरबर्नर। हालांकि, इस तरह की जांच केवल प्रारंभिक अनुमानों के लिए पर्याप्त है, और ओवरक्लॉकिंग स्थिरता की ठोस पुष्टि के लिए, इसे कई गेमिंग अनुप्रयोगों में जांचना चाहिए, क्योंकि अलग-अलग गेम अलग-अलग GPU कार्यात्मक इकाइयों पर अलग-अलग भार ग्रहण करते हैं: गणितीय, बनावट, ज्यामितीय। हेवन 4.0 बेंचमार्क ओवरक्लॉकिंग कार्य के लिए भी सुविधाजनक है, क्योंकि इसमें लूपेड ऑपरेशन मोड है जिसमें ओवरक्लॉकिंग सेटिंग्स को बदलना सुविधाजनक है और गति लाभ का आकलन करने के लिए एक बेंचमार्क है।

Nvidia नए GeForce GTX 1080 और GTX 1070 ग्राफिक्स कार्ड को ओवरक्लॉक करते समय एक साथ हेवन 4.0 और EVGA प्रेसिजन XOC विंडो चलाने की सलाह देता है। सबसे पहले, पंखे की गति को तुरंत बढ़ाने की सलाह दी जाती है। और गंभीर ओवरक्लॉकिंग के लिए, आप तुरंत गति मान को 100% पर सेट कर सकते हैं, जिससे वीडियो कार्ड बहुत ज़ोर से काम करेगा, लेकिन जितना संभव हो सके GPU और वीडियो कार्ड के अन्य घटकों को ठंडा करें, तापमान को न्यूनतम संभव स्तर तक कम करें। , थ्रॉटलिंग को रोकना (एक निश्चित मूल्य से ऊपर GPU तापमान में वृद्धि के कारण आवृत्तियों को कम करना)।

इसके बाद, आपको पावर टारगेट को भी अधिकतम पर सेट करने की आवश्यकता है। यह सेटिंग बिजली की खपत और GPU Temp लक्ष्य को बढ़ाकर GPU को अधिक से अधिक शक्ति प्रदान करेगी। कुछ उद्देश्यों के लिए, दूसरे मान को पावर लक्ष्य परिवर्तन से अलग किया जा सकता है, और फिर इन सेटिंग्स को व्यक्तिगत रूप से समायोजित किया जा सकता है - उदाहरण के लिए, वीडियो चिप के कम हीटिंग को प्राप्त करने के लिए।

अगला कदम GPU क्लॉक ऑफ़सेट को बढ़ाना है - इसका मतलब है कि ऑपरेशन के दौरान टर्बो फ़्रीक्वेंसी कितनी अधिक होगी। यह मान सभी वोल्टेज के लिए आवृत्ति बढ़ाता है और बेहतर प्रदर्शन में परिणाम देता है। हमेशा की तरह, ओवरक्लॉकिंग करते समय, आपको GPU आवृत्ति को छोटे चरणों में बढ़ाते समय स्थिरता की जांच करने की आवश्यकता होती है - 10 मेगाहर्ट्ज से 50 मेगाहर्ट्ज प्रति चरण इससे पहले कि आप हैंग, ड्राइवर या एप्लिकेशन त्रुटि, या यहां तक ​​​​कि दृश्य कलाकृतियों को नोटिस करें। जब यह सीमा समाप्त हो जाती है, तो आपको आवृत्ति मान को एक कदम नीचे करना चाहिए और फिर से ओवरक्लॉकिंग के दौरान स्थिरता और प्रदर्शन की जांच करनी चाहिए।

GPU फ़्रीक्वेंसी के अलावा, आप वीडियो मेमोरी फ़्रीक्वेंसी (मेमोरी क्लॉक ऑफ़सेट) भी बढ़ा सकते हैं, जो कि GDDR5 मेमोरी से लैस GeForce GTX 1070 के मामले में विशेष रूप से महत्वपूर्ण है, जो आमतौर पर अच्छी तरह से ओवरक्लॉक करता है। मेमोरी फ़्रीक्वेंसी के मामले में, प्रक्रिया बिल्कुल वही दोहराती है जो एक स्थिर GPU आवृत्ति मिलने पर की जाती है, केवल अंतर यह है कि चरणों को बड़ा किया जा सकता है - आधार आवृत्ति में एक बार में 50-100 मेगाहर्ट्ज जोड़ें।

ऊपर वर्णित चरणों के अलावा, आप वोल्टेज सीमा (ओवरवॉल्टेज) भी बढ़ा सकते हैं, क्योंकि GPU की एक उच्च आवृत्ति अक्सर बढ़े हुए वोल्टेज पर प्राप्त की जाती है, जब GPU के अस्थिर भागों को अतिरिक्त शक्ति प्राप्त होती है। सच है, इस मूल्य को बढ़ाने का संभावित नुकसान वीडियो चिप को नुकसान और इसकी त्वरित विफलता की संभावना है, इसलिए आपको अत्यधिक सावधानी के साथ वोल्टेज में वृद्धि का उपयोग करने की आवश्यकता है।

ओवरक्लॉकिंग के प्रति उत्साही थोड़ा अलग तकनीकों का उपयोग करते हैं, मापदंडों को एक अलग क्रम में बदलते हैं। उदाहरण के लिए, कुछ ओवरक्लॉकर स्थिर GPU और मेमोरी फ़्रीक्वेंसी खोजने पर अपने प्रयोग साझा करते हैं ताकि वे एक-दूसरे के साथ हस्तक्षेप न करें, और फिर वीडियो चिप और मेमोरी चिप्स दोनों के संयुक्त ओवरक्लॉकिंग का परीक्षण करें, लेकिन ये पहले से ही व्यक्ति के महत्वहीन विवरण हैं पहुंचना।

मंचों में राय और लेखों पर टिप्पणियों को देखते हुए, कुछ उपयोगकर्ताओं को नया GPU बूस्ट 3.0 एल्गोरिथ्म पसंद नहीं आया, जब GPU आवृत्ति पहली बार में बहुत अधिक बढ़ जाती है, अक्सर टर्बो आवृत्ति से अधिक होती है, लेकिन फिर, के प्रभाव में GPU तापमान वृद्धि या निर्धारित सीमा से ऊपर बिजली की खपत में वृद्धि, यह बहुत कम मूल्यों तक गिर सकता है। यह केवल अद्यतन एल्गोरिदम की विशिष्टता है, आपको गतिशील रूप से परिवर्तनीय GPU आवृत्ति के नए व्यवहार के लिए उपयोग करने की आवश्यकता है, लेकिन यह कोई नकारात्मक परिणाम नहीं लेता है।

GeForce GTX 1070 ग्राफिक्स कार्ड Nvidia के पास्कल GPU की नई लाइन में GTX 1080 के बाद दूसरा मॉडल है। नई 16nm FinFET प्रक्रिया प्रौद्योगिकी और वास्तुकला अनुकूलन ने प्रस्तुत वीडियो कार्ड को उच्च घड़ी की गति प्राप्त करने की अनुमति दी, जिसे GPU बूस्ट तकनीक की नई पीढ़ी द्वारा भी मदद मिली है। भले ही स्ट्रीम प्रोसेसर और बनावट इकाइयों के रूप में कार्यात्मक इकाइयों की संख्या में कटौती की गई है, लेकिन उनकी संख्या GTX 1070 के लिए सबसे अधिक लाभदायक और ऊर्जा कुशल समाधान बनने के लिए पर्याप्त बनी हुई है।

नए प्रकार के GDDR5X के विपरीत, GP104 चिप पर जारी किए गए Nvidia वीडियो कार्ड के जोड़े के सबसे छोटे जोड़े पर GDDR5 मेमोरी स्थापित करना, जो GTX 1080 अलग है, इसे उच्च प्रदर्शन संकेतक प्राप्त करने से नहीं रोकता है। सबसे पहले, एनवीडिया ने GeForce GTX 1070 मॉडल की मेमोरी बस को नहीं काटने का फैसला किया, और दूसरी बात, उन्होंने 8 GHz की प्रभावी आवृत्ति के साथ सबसे तेज़ GDDR5 मेमोरी स्थापित की, जो पुराने मॉडल में उपयोग किए गए GDDR5X के लिए केवल 10 GHz से थोड़ा कम है। बेहतर डेल्टा संपीड़न एल्गोरिदम को ध्यान में रखते हुए, GPU की प्रभावी मेमोरी बैंडविड्थ पिछली पीढ़ी के GeForce GTX 970 के समान मॉडल की तुलना में अधिक हो गई है।

GeForce GTX 1070 अच्छा है क्योंकि यह कुछ समय पहले घोषित पुराने मॉडल की तुलना में काफी कम कीमत पर नई सुविधाओं और एल्गोरिदम के लिए बहुत उच्च प्रदर्शन और समर्थन प्रदान करता है। यदि कुछ उत्साही लोग 55,000 में GTX 1080 की खरीद का खर्च उठा सकते हैं, तो संभावित खरीदारों का एक बहुत बड़ा समूह समान क्षमताओं के साथ केवल एक चौथाई कम उत्पादक समाधान के लिए 35,000 का भुगतान करने में सक्षम होगा। यह अपेक्षाकृत कम कीमत और उच्च प्रदर्शन का यह संयोजन था जिसने रिलीज के समय GeForce GTX 1070 को यकीनन सबसे अच्छी खरीद बना दिया।

ग्राफिक्स एक्सेलेरेटर GeForce GTX 1060

पैरामीटरअर्थ
चिप कोडनेमजीपी106
उत्पादन प्रौद्योगिकी१६ एनएम फिनफेट
ट्रांजिस्टर की संख्या4.4 अरब
मूल भाग200 मिमी²
आर्किटेक्चरकई प्रकार के डेटा की स्ट्रीमिंग प्रोसेसिंग के लिए सामान्य प्रोसेसर की एक सरणी के साथ एकीकृत: कोने, पिक्सेल, आदि।
डायरेक्टएक्स हार्डवेयर सपोर्टDirectX 12, फ़ीचर स्तर 12_1 . के समर्थन के साथ
मेमोरी बस192-बिट: GDDR5 मेमोरी का समर्थन करने वाले छह स्वतंत्र 32-बिट मेमोरी कंट्रोलर
GPU आवृत्ति१५०६ (१७०८) मेगाहर्ट्ज
कंप्यूटिंग इकाइयांआईईईई 754-2008 मानक के ढांचे के भीतर फ्लोटिंग पॉइंट गणना के लिए 1280 स्केलर एएलयू सहित 10 स्ट्रीमिंग मल्टीप्रोसेसर;
बनावट ब्लॉकबनावट में FP16 और FP32 घटकों के समर्थन के साथ 80 टेक्सचर एड्रेसिंग और फ़िल्टरिंग इकाइयाँ और सभी बनावट स्वरूपों के लिए ट्रिलिनियर और अनिसोट्रोपिक फ़िल्टरिंग के लिए समर्थन
रास्टर ऑपरेशन ब्लॉक (आरओपी)विभिन्न एंटी-अलियासिंग मोड के समर्थन के साथ 6 चौड़े आरओपी ब्लॉक (48 पिक्सल), जिनमें एफपी16 या एफपी32 फ्रेमबफर प्रारूप के साथ प्रोग्राम करने योग्य शामिल हैं। ब्लॉक में विन्यास योग्य ALU की एक सरणी होती है और यह गहराई, बहु-नमूनाकरण और सम्मिश्रण की पीढ़ी और तुलना के लिए जिम्मेदार होते हैं।
मॉनिटर समर्थनचार ड्यूल लिंक डीवीआई, एचडीएमआई 2.0 बी और डिस्प्लेपोर्ट 1.2 (1.3 / 1.4 रेडी) मॉनिटर के लिए एकीकृत समर्थन

GeForce GTX 1060 संदर्भ ग्राफिक्स कार्ड निर्दिष्टीकरण
पैरामीटरअर्थ
कोर आवृत्ति१५०६ (१७०८) मेगाहर्ट्ज
यूनिवर्सल प्रोसेसर की संख्या1280
बनावट इकाइयों की संख्या80
सम्मिश्रण ब्लॉकों की संख्या48
प्रभावी स्मृति आवृत्ति8000 (4 × 2000) मेगाहर्ट्ज
मेमोरी प्रकारजीडीडीआर5
मेमोरी बस१९२-बिट
याद6 जीबी
मेमोरी बैंडविड्थ१९२ जीबी/सेक
कम्प्यूटेशनल प्रदर्शन (FP32)लगभग 4 टेराफ्लॉप्स
सैद्धांतिक अधिकतम भरण दर72 गीगापिक्सेल / सेकंड
सैद्धांतिक बनावट नमूनाकरण दर१२१ गिगाटेक्सेल्स / एस
टायरपीसीआई एक्सप्रेस 3.0
कनेक्टर्सएक डुअल लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट
विशिष्ट बिजली की खपत१२० वाट
अतिरिक्त भोजनएक 6-पिन कनेक्टर
सिस्टम चेसिस में व्याप्त स्लॉट्स की संख्या2
अनुशंसित मूल्ययूएस में $ 249 ($ 299) और रूस में 18,990

GeForce GTX 1060 वीडियो कार्ड को भी पिछली GeForce श्रृंखला के समान समाधान के समान एक नाम मिला, जो इसके प्रत्यक्ष पूर्ववर्ती, GeForce GTX 960 के नाम से भिन्न है, केवल पीढ़ी के संशोधित पहले अंक से। कंपनी की वर्तमान पंक्ति में नवीनता पहले से जारी GeForce GTX 1070 समाधान से एक कदम कम हो गई है, जो कि नई श्रृंखला में औसत गति है।

एनवीडिया के नए वीडियो कार्ड के लिए अनुशंसित मूल्य क्रमशः कंपनी के भागीदारों के नियमित संस्करणों और संस्थापक संस्करण के विशेष संस्करण के लिए $ 249 और $ 299 हैं। दो पुराने मॉडलों की तुलना में, यह एक बहुत ही अनुकूल कीमत है, क्योंकि नया जीटीएक्स 1060 मॉडल, हालांकि टॉप-एंड मदरबोर्ड से कमतर है, जितना कि यह उनसे सस्ता है। घोषणा के समय, नया उत्पाद निश्चित रूप से अपनी श्रेणी में सर्वश्रेष्ठ प्रदर्शन समाधान बन गया और इस मूल्य सीमा में सबसे लाभप्रद प्रस्तावों में से एक बन गया।

एनवीडिया के पास्कल परिवार के एक वीडियो कार्ड का यह मॉडल एक प्रतिस्पर्धी कंपनी एएमडी के नए निर्णय का प्रतिकार करने के लिए सामने आया, जिसने कुछ समय पहले रेडियन आरएक्स 480 को बाजार में जारी किया था। ... GeForce GTX 1060 अधिक महंगा है ($ 249-299 बनाम $ 199-229), लेकिन प्रतियोगी की तुलना में स्पष्ट रूप से तेज है।

GP106 ग्राफिक्स प्रोसेसर में 192-बिट मेमोरी बस है, इसलिए ऐसी बस वाले वीडियो कार्ड पर स्थापित मेमोरी की मात्रा 3 या 6 जीबी हो सकती है। आधुनिक परिस्थितियों में कम मूल्य स्पष्ट रूप से पर्याप्त नहीं है, और कई गेम प्रोजेक्ट, यहां तक ​​​​कि पूर्ण एचडी रिज़ॉल्यूशन में, वीडियो मेमोरी की कमी में चलेगा, जो प्रतिपादन की चिकनाई को गंभीरता से प्रभावित करेगा। उच्च सेटिंग्स में नए समाधान के प्रदर्शन को अधिकतम करने के लिए, GeForce GTX 1060 मॉडल 6 जीबी वीडियो मेमोरी से लैस था, जो किसी भी गुणवत्ता सेटिंग पर किसी भी 3D एप्लिकेशन को चलाने के लिए पर्याप्त है। इसके अलावा, आज केवल 6 और 8 जीबी के बीच कोई अंतर नहीं है, और इस तरह के समाधान से थोड़ा पैसा बचेगा।

नए उत्पाद के लिए सामान्य बिजली खपत मूल्य 120 डब्ल्यू है, जो जीटीएक्स 1070 के मूल्य से 20% कम है और पिछली पीढ़ी के जीईफ़ोर्स जीटीएक्स 960 की बिजली खपत के बराबर है, जिसमें बहुत कम प्रदर्शन और क्षमताएं हैं। संदर्भ बोर्ड में छवि आउटपुट उपकरणों को जोड़ने के लिए कनेक्टर्स का सामान्य सेट होता है: एक डुअल-लिंक डीवीआई, एक एचडीएमआई और तीन डिस्प्लेपोर्ट। इसके अलावा, एचडीएमआई और डिस्प्लेपोर्ट के नए संस्करणों के लिए समर्थन दिखाई दिया, जिसके बारे में हमने जीटीएक्स 1080 मॉडल की समीक्षा में लिखा था।

संदर्भ GeForce GTX 1060 बोर्ड की लंबाई 9.8 इंच (25 सेमी) है, और पुराने संस्करणों के अंतर से, हम अलग से ध्यान देते हैं कि GeForce GTX 1060 SLI मल्टी-चिप रेंडरिंग कॉन्फ़िगरेशन का समर्थन नहीं करता है, और इसमें एक नहीं है इसके लिए विशेष कनेक्टर। चूंकि बोर्ड पुराने मॉडलों की तुलना में कम बिजली की खपत करता है, अतिरिक्त बिजली आपूर्ति के लिए बोर्ड पर एक 6-पिन पीसीआई-ई बाहरी पावर कनेक्टर स्थापित किया गया था।

कंपनी के भागीदारों के उत्पादों के रूप में घोषणा के दिन से GeForce GTX 1060 वीडियो कार्ड बाजार में दिखाई दिए हैं: Asus, EVGA, Gainward, Gigabyte, Innovision 3D, MSI, Palit, Zotac। GeForce GTX 1060 के संस्थापक संस्करण का एक विशेष संस्करण, जिसे स्वयं Nvidia द्वारा निर्मित किया गया है, को भी सीमित मात्रा में जारी किया जाएगा, जो कि विशेष रूप से Nvidia वेबसाइट पर $ 299 की कीमत पर बेचा जाएगा और आधिकारिक तौर पर रूस में प्रस्तुत नहीं किया जाएगा। संस्थापक का संस्करण उच्च गुणवत्ता वाली सामग्री और घटकों के साथ बनाया गया है, जिसमें एल्यूमीनियम आवरण भी शामिल है, और एक कुशल शीतलन प्रणाली के साथ-साथ कम प्रतिरोध पावर सर्किट और विशेष रूप से डिज़ाइन किए गए वोल्टेज नियामकों का उपयोग करता है।

वास्तु परिवर्तन

GeForce GTX 1060 ग्राफिक्स कार्ड पूरी तरह से नए GPU मॉडल GP106 पर आधारित है, जो कार्यात्मक रूप से GP104 चिप के रूप में पास्कल आर्किटेक्चर के पहले जन्म से अलग नहीं है, जिस पर GeForce GTX 1080 और GTX 1070 मॉडल ऊपर वर्णित हैं। मैक्सवेल, लेकिन इसमें कुछ कार्यात्मक अंतर भी हैं, जिनके बारे में हमने पहले विस्तार से लिखा था।

GP106 वीडियो चिप इसकी संरचना में टॉप-एंड पास्कल चिप और मैक्सवेल आर्किटेक्चर के समान समाधानों के समान है, और आप Nvidia से पिछले समाधानों की हमारी समीक्षाओं में आधुनिक GPU के उपकरण के बारे में विस्तृत जानकारी पा सकते हैं। पिछले GPU की तरह, नए आर्किटेक्चर चिप्स में ग्राफिक्स प्रोसेसिंग क्लस्टर (GPCs), स्ट्रीमिंग मल्टीप्रोसेसर (SM) और मेमोरी कंट्रोलर के अलग-अलग कॉन्फ़िगरेशन हैं:

GP106 GPU में दो GPC क्लस्टर होते हैं, जिसमें 10 स्ट्रीमिंग मल्टीप्रोसेसर (SM) होते हैं, यानी GP104 का ठीक आधा। पुराने जीपीयू की तरह, प्रत्येक मल्टीप्रोसेसर में 128 कंप्यूटिंग कोर, 8 टीएमयू बनावट इकाइयां, 256 केबी रजिस्टर मेमोरी, 96 केबी साझा मेमोरी और 48 केबी एल 1 कैश शामिल हैं। नतीजतन, GeForce GTX 1060 में कुल 1280 प्रोसेसिंग कोर और 80 बनावट इकाइयां हैं - GTX 1080 का आधा आकार।

लेकिन GeForce GTX 1060 के मेमोरी सबसिस्टम को शीर्ष समाधान के संबंध में आधे में नहीं काटा गया है, इसमें छह 32-बिट मेमोरी कंट्रोलर हैं, जो अंतिम 192-बिट मेमोरी बस देते हैं। GeForce GTX 1060 के लिए 8 GHz के बराबर GDDR5 वीडियो मेमोरी की प्रभावी आवृत्ति के साथ, बैंडविड्थ 192 GB / s तक पहुंच जाता है, जो इस मूल्य खंड में समाधान के लिए काफी अच्छा है, विशेष रूप से पास्कल में इसके उपयोग की उच्च दक्षता को देखते हुए। प्रत्येक मेमोरी कंट्रोलर में आठ ROP और 256KB L2 कैश प्रत्येक मेमोरी कंट्रोलर से बंधा होता है, इसलिए GP106 GPU के पूर्ण संस्करण में कुल 48 ROP और 1536KB L2 कैश होते हैं।

मेमोरी बैंडविड्थ आवश्यकताओं को कम करने और उपलब्ध पास्कल आर्किटेक्चर का अधिक कुशल उपयोग करने के लिए, दोषरहित इंट्रा-चिप संपीड़न में और सुधार किया गया है, जो बफ़र्स में डेटा को संपीड़ित करने, दक्षता और प्रदर्शन लाभ प्राप्त करने में सक्षम है। विशेष रूप से, नए परिवार के चिप्स में 4: 1 और 8: 1 अनुपात के साथ नई डेल्टा संपीड़न विधियों को जोड़ा गया है, जो मैक्सवेल परिवार के पिछले समाधानों की तुलना में मेमोरी बैंडविड्थ दक्षता में अतिरिक्त 20% प्रदान करता है।

नए GPU की आधार आवृत्ति 1506 MHz है - सिद्धांत रूप में आवृत्ति इस चिह्न से नीचे नहीं गिरनी चाहिए। विशिष्ट टर्बो क्लॉक (बूस्ट क्लॉक) 1708 मेगाहर्ट्ज पर बहुत अधिक है, जो वास्तविक घड़ी का औसत मूल्य है जिस पर GeForce GTX 1060 ग्राफिक्स चिप गेम और 3D अनुप्रयोगों की एक विस्तृत श्रृंखला में चलता है। वास्तविक बूस्ट आवृत्ति खेल और परीक्षण वातावरण पर निर्भर करती है।

पास्कल परिवार के बाकी लोगों की तरह, GeForce GTX 1060 न केवल उच्च घड़ी की गति से चलता है, उच्च प्रदर्शन प्रदान करता है, बल्कि ओवरक्लॉकिंग के लिए एक अच्छा हेडरूम भी है। पहला प्रयोग 2 GHz के क्रम की आवृत्तियों को प्राप्त करने की संभावना को इंगित करता है। यह आश्चर्य की बात नहीं है कि कंपनी के साझेदार अन्य बातों के अलावा, GTX 1060 वीडियो कार्ड के फ़ैक्टरी-ओवरक्लॉक संस्करण तैयार कर रहे हैं।

इसलिए, नई वास्तुकला में मुख्य परिवर्तन 16 एनएम फिनफेट तकनीकी प्रक्रिया थी, जिसके उपयोग से जीपी106 के उत्पादन में 200 मिमी² के अपेक्षाकृत कम क्षेत्र को बनाए रखते हुए चिप की जटिलता में काफी वृद्धि करना संभव हो गया, इसलिए पास्कल आर्किटेक्चर की इस चिप में 28 एनएम प्रक्रिया प्रौद्योगिकी का उपयोग करके निर्मित समान स्थिति के मैक्सवेल चिप की तुलना में निष्पादन इकाइयों की एक बड़ी संख्या है।

यदि 227 मिमी² के क्षेत्रफल वाले GM206 (GTX 960) में 3 बिलियन ट्रांजिस्टर और 1024 ALU, 64 TMU, 32 ROP और एक 128-बिट बस है, तो नए GPU में पहले से ही 4.4 बिलियन ट्रांजिस्टर, 200 मिमी² में 1280 ALU शामिल हैं। 192-बिट बस के साथ 80 टीएमयू और 48 आरओपी। इसके अलावा, लगभग डेढ़ गुना अधिक आवृत्ति पर: १५०६ (१७०८) बनाम ११२६ (११७८) मेगाहर्ट्ज। और यह 120 W की समान बिजली खपत के साथ है! नतीजतन, GP106 GPU GP104 के साथ सबसे अधिक ऊर्जा कुशल GPU में से एक बन गया है।

न्यू एनवीडिया टेक्नोलॉजीज

कंपनी की सबसे दिलचस्प तकनीकों में से एक, जो GeForce GTX 1060 और पास्कल परिवार के अन्य समाधानों द्वारा समर्थित है, तकनीक है एनवीडिया एक साथ बहु-प्रोजेक्शन... हमने इस तकनीक के बारे में अपनी GeForce GTX 1080 समीक्षा में पहले ही लिखा है, और यह आपको रेंडरिंग को अनुकूलित करने के लिए कई नई तकनीकों का उपयोग करने की अनुमति देता है। विशेष रूप से, एक साथ दो आंखों के लिए एक वीआर छवि को एक साथ प्रोजेक्ट करने के लिए, आभासी वास्तविकता में जीपीयू का उपयोग करने की दक्षता में काफी वृद्धि हुई है।

एसएमपी का समर्थन करने के लिए, सभी पास्कल जीपीयू में रास्टराइजेशन यूनिट से पहले, ज्यामिति पाइपलाइन के अंत में पॉलीमॉर्फ इंजन में स्थित एक समर्पित इंजन होता है। इसकी मदद से, GPU एक साथ एक बिंदु से कई अनुमानों पर एक ज्यामितीय आदिम प्रोजेक्ट कर सकता है, जबकि ये अनुमान स्टीरियो हो सकते हैं (यानी, एक साथ 16 या 32 अनुमानों का समर्थन किया जाता है)। यह क्षमता पास्कल जीपीयू को वीआर रेंडरिंग के लिए एक घुमावदार सतह को सटीक रूप से पुन: पेश करने की अनुमति देती है, साथ ही मल्टी-मॉनिटर सिस्टम पर सही ढंग से प्रदर्शित होती है।

यह महत्वपूर्ण है कि एक साथ बहु-प्रोजेक्शन तकनीक को पहले से ही लोकप्रिय गेम इंजन (अवास्तविक इंजन और एकता) और खेलों में एकीकृत किया जा रहा है, और आज तक, इस तरह के प्रसिद्ध सहित विकास में 30 से अधिक खेलों के लिए प्रौद्योगिकी के समर्थन की घोषणा की गई है। अवास्तविक टूर्नामेंट के रूप में परियोजनाएं। , पूलनेशन वीआर, एवरेस्ट वीआर, ऑबडक्शन, एडीआर 1 फीट और रॉ डेटा। दिलचस्प है, हालांकि अवास्तविक टूर्नामेंट एक वीआर गेम नहीं है, यह बेहतर दृश्य और बेहतर प्रदर्शन प्राप्त करने के लिए एसएमपी का उपयोग करता है।

एक और बहुप्रतीक्षित तकनीक खेलों में एक शक्तिशाली स्क्रीनशॉट टूल है। एनवीडिया एंसेली... यह टूल आपको गेम से असामान्य और बहुत उच्च-गुणवत्ता वाले स्क्रीनशॉट बनाने की अनुमति देता है, पहले से अनुपलब्ध सुविधाओं के साथ, उन्हें बहुत उच्च रिज़ॉल्यूशन में सहेजता है और उन्हें विभिन्न प्रभावों के साथ पूरक करता है, और अपने कार्यों को साझा करता है। Ansel आपको सचमुच एक स्क्रीनशॉट बनाने की अनुमति देता है जिस तरह से कलाकार इसे चाहता है, जिससे आप दृश्य में कहीं भी किसी भी पैरामीटर के साथ एक कैमरा स्थापित कर सकते हैं, छवि पर शक्तिशाली पोस्ट फ़िल्टर लागू कर सकते हैं, या यहां तक ​​​​कि वर्चुअल में देखने के लिए 360-डिग्री तस्वीर भी ले सकते हैं। वास्तविकता हेलमेट।

एनवीडिया ने गेम में एंसेल के यूजर इंटरफेस के एकीकरण को मानकीकृत किया है, और यह कोड की कुछ पंक्तियों को जोड़ने जितना आसान है। खेलों में इस सुविधा के प्रकट होने की प्रतीक्षा करने की कोई आवश्यकता नहीं है, आप अभी मिरर एज: कैटालिस्ट में एंसेल की क्षमताओं का मूल्यांकन कर सकते हैं, और थोड़ी देर बाद यह विचर 3: वाइल्ड हंट में उपलब्ध हो जाएगा। इसके अलावा, विकास में कई एंसल-सक्षम गेम प्रोजेक्ट हैं, जिनमें फ़ोर्टनाइट, पैरागॉन और अवास्तविक टूर्नामेंट, ऑबडक्शन, द विटनेस, लॉब्रेकर्स, टॉम क्लैंसी की द डिवीजन, नो मैन्स स्काई और अन्य जैसे गेम शामिल हैं।

साथ ही नया GeForce GTX 1060 GPU टूलबॉक्स को सपोर्ट करता है एनवीडिया वीआरवर्क्सडेवलपर्स को प्रभावशाली वीआर अनुभव बनाने में मदद करने के लिए। इस पैकेज में VRWorks ऑडियो सहित डेवलपर्स के लिए कई उपयोगिताओं और उपकरण शामिल हैं, जो आपको GPU पर रे ट्रेसिंग का उपयोग करके दृश्य में वस्तुओं से ध्वनि तरंगों के प्रतिबिंबों की बहुत सटीक गणना करने की अनुमति देता है। पैकेज में दृश्य में वस्तुओं का शारीरिक रूप से सही व्यवहार प्रदान करने के लिए VR और PhysX भौतिकी प्रभावों में एकीकरण भी शामिल है।

VRWorks का लाभ उठाने के लिए सबसे चमकीले आभासी खेलों में से एक VR Funhouse है, जो स्वयं Nvidia का एक आभासी वास्तविकता गेम है, जो वाल्व स्टीम पर मुफ्त में उपलब्ध है। यह गेम अवास्तविक इंजन 4 (एपिक गेम्स) पर आधारित है और HTC Vive VR हेडसेट्स के संयोजन में GeForce GTX 1080, 1070 और 1060 ग्राफिक्स कार्ड पर चलता है। इसके अलावा, इस गेम का सोर्स कोड सार्वजनिक रूप से उपलब्ध होगा, जो अन्य डेवलपर्स को अपने वीआर राइड्स में पहले से तैयार विचारों और कोड का उपयोग करने की अनुमति देगा। इसके लिए हमारा शब्द लें, यह आभासी वास्तविकता क्षमताओं के सबसे प्रभावशाली प्रदर्शनों में से एक है।

SMP और VRWorks प्रौद्योगिकियों के लिए धन्यवाद सहित, VR अनुप्रयोगों में GeForce GTX 1060 GPU का उपयोग प्रवेश-स्तर की आभासी वास्तविकता के लिए पर्याप्त प्रदर्शन प्रदान करता है, और विचाराधीन GPU न्यूनतम आवश्यक हार्डवेयर स्तर को पूरा करता है, जिसमें स्टीमवीआर भी शामिल है, जो एक बन जाता है। आधिकारिक वीआर समर्थन वाले सिस्टम पर उपयोग के लिए सबसे सफल अधिग्रहण।

चूंकि GeForce GTX 1060 मॉडल GP106 चिप पर आधारित है, जो किसी भी तरह से GP104 GPU की क्षमताओं से कमतर नहीं है, जो पुराने संशोधनों का आधार बन गया, यह उन सभी तकनीकों का समर्थन करता है जिन्हें हमने ऊपर वर्णित किया है।

GeForce GTX 1060 ग्राफिक्स कार्ड Nvidia के पास्कल GPU की नई लाइन में तीसरा मॉडल है। नई 16 एनएम FinFET तकनीकी प्रक्रिया और आर्किटेक्चर ऑप्टिमाइजेशन ने सभी नए वीडियो कार्ड को उच्च घड़ी आवृत्ति प्राप्त करने और पिछली पीढ़ी के वीडियो चिप्स की तुलना में स्ट्रीम प्रोसेसर, बनावट इकाइयों और अन्य के रूप में GPU में अधिक कार्यात्मक ब्लॉक रखने की अनुमति दी। यही कारण है कि जीटीएक्स 1060 अपनी कक्षा में और सामान्य रूप से सबसे अधिक लाभदायक और ऊर्जा कुशल समाधान बन गया है।

यह विशेष रूप से महत्वपूर्ण है कि GeForce GTX 1060 GP104 पर आधारित पुराने समाधानों की तुलना में काफी कम कीमत पर नई सुविधाओं और एल्गोरिदम के लिए पर्याप्त रूप से उच्च प्रदर्शन और समर्थन प्रदान करता है। नए मॉडल की GP106 ग्राफिक्स चिप श्रेणी में सर्वश्रेष्ठ प्रदर्शन और पावर दक्षता प्रदान करती है। GeForce GTX 1060 विशेष रूप से डिज़ाइन किया गया है और 1920x1080 के रिज़ॉल्यूशन में उच्च और अधिकतम ग्राफिक्स सेटिंग्स पर सभी आधुनिक खेलों के लिए पूरी तरह से अनुकूल है और यहां तक ​​​​कि विभिन्न तरीकों (FXAA, MFAA या MSAA) द्वारा सक्षम पूर्ण-स्क्रीन एंटी-अलियासिंग के साथ।

और उन लोगों के लिए जो अल्ट्रा-हाई-रिज़ॉल्यूशन डिस्प्ले के साथ और भी बेहतर प्रदर्शन प्राप्त करना चाहते हैं, एनवीडिया में टॉप-एंड GeForce GTX 1070 और GTX 1080 ग्राफिक्स कार्ड हैं जो प्रदर्शन और पावर दक्षता में भी काफी अच्छे हैं। फिर भी, कम कीमत और पर्याप्त प्रदर्शन का संयोजन पुराने समाधानों की पृष्ठभूमि के खिलाफ GeForce GTX 1060 को काफी अनुकूल रूप से अलग करता है। प्रतिस्पर्धी Radeon RX 480 की तुलना में, Nvidia का समाधान कम जटिलता और GPU पदचिह्न के साथ थोड़ा तेज है, और इसमें काफी बेहतर बिजली दक्षता है। सच है, यह थोड़ा अधिक महंगा बेचा जाता है, इसलिए प्रत्येक वीडियो कार्ड का अपना स्थान होता है।

एनवीडिया GeForce GTX 1080 पास्कल समीक्षा | पेश है GP104 GPU

Computex प्रदर्शनी की प्रत्याशा में, Nvidia ने अपनी लंबे समय से प्रतीक्षित नवीनता पेश करने का निर्णय लिया - गेमर्स के लिए अनुकूलित पास्कल वास्तुकला। नए GeForce GTX 1080 और 1070 ग्राफिक्स कार्ड में, निर्माता GP104 GPU स्थापित करता है। आज, हम पुराने मॉडल पर विचार करेंगे, और छोटा जून की शुरुआत में हमारे हाथों में होना चाहिए।

पास्कल आर्किटेक्चर एक उन्नत नियंत्रक के साथ तेज और अधिक कुशल प्रदर्शन, अधिक कंप्यूट मॉड्यूल, एक छोटा डाई क्षेत्र और तेज मेमोरी का वादा करता है। यह आभासी वास्तविकता, 4K गेमिंग और अन्य उच्च-प्रदर्शन कार्यों के लिए बेहतर अनुकूल है।

हमेशा की तरह, हम निर्माता के वादों को समझने और व्यवहार में उनका परीक्षण करने का प्रयास करेंगे। चलो शुरू करो।

क्या GeForce GTX 1080 हाई-एंड सेगमेंट में पावर बैलेंस को बदल देगा?

Nvidia GeForce GTX 1080 इस महीने की शुरुआत में घोषित दो गेमिंग ग्राफिक्स कार्डों में सबसे तेज है। दोनों GP104 GPU का उपयोग करते हैं, जो संयोगवश, पास्कल माइक्रोआर्किटेक्चर के साथ दूसरा GPU है (पहला GP100 था, जो अप्रैल में GTC में दिखाई दिया)। एनवीडिया के सीईओ रेन-सन हुआन ने उत्साही लोगों को चिढ़ाया जब उन्होंने आम जनता के लिए नवीनता प्रस्तुत की, यह दावा करते हुए कि GeForce GTX 1080 SLI में दो 980 से बेहतर प्रदर्शन करेगा।

उन्होंने यह भी नोट किया कि GTX 1080, उच्च प्रदर्शन के साथ, 900 श्रृंखला की तुलना में कम बिजली की खपत करता है। यह पूर्व फ्लैगशिप GeForce Titan X की तुलना में दोगुना उत्पादक और तीन गुना अधिक कुशल है, लेकिन यदि आप साथ के ग्राफ़ और आरेखों को करीब से देखते हैं, तो यह पता चलता है कि आभासी वास्तविकता से संबंधित कुछ कार्यों में इतना प्रभावशाली अंतर प्रकट होता है। लेकिन भले ही इन वादों की केवल आंशिक रूप से पुष्टि हो, फिर भी हमारे पास हाई-एंड पीसी गेम्स के विकास के मामले में कुछ बहुत ही दिलचस्प समय होगा।

आभासी वास्तविकता गति प्राप्त करना शुरू कर रही है, लेकिन ग्राफिक्स सबसिस्टम के लिए उच्च हार्डवेयर आवश्यकताएं इन प्रौद्योगिकियों तक पहुंच के लिए एक महत्वपूर्ण बाधा उत्पन्न करती हैं। इसके अलावा, आज उपलब्ध अधिकांश गेम मल्टीप्रोसेसर रेंडरिंग का लाभ उठाना नहीं जानते हैं। यही है, आप आमतौर पर एक GPU के साथ एक तेज़ वीडियो एडेप्टर की क्षमताओं से सीमित होते हैं। GTX 1080 दो 980 की गति से बेहतर प्रदर्शन करने में सक्षम है और भविष्य के मल्टी-प्रोसेसर कॉन्फ़िगरेशन की आवश्यकता को समाप्त करते हुए, आज के VR गेम में संघर्ष नहीं करना चाहिए।

4K पारिस्थितिकी तंत्र समान गति से आगे बढ़ रहा है। एचडीएमआई 2.0 बी और डिस्प्लेपोर्ट 1.3 / 1.4 जैसे उच्च बैंडविड्थ इंटरफेस को इस साल के अंत तक 120 हर्ट्ज पैनल और डायनेमिक रिफ्रेश रेट सपोर्ट के साथ 4K मॉनिटर के लिए दरवाजा खोलना चाहिए। जबकि AMD और Nvidia के टॉप-एंड GPU की पिछली पीढ़ियों को 4K गेमिंग सॉल्यूशंस के रूप में विपणन किया गया था, उपयोगकर्ताओं को स्वीकार्य फ्रेम दर बनाए रखने के लिए गुणवत्ता वाले ट्रेडऑफ़ बनाने पड़े। GeForce Nvidia GTX 1080 पहला ग्राफिक्स कार्ड हो सकता है जो अधिकतम ग्राफिक्स विवरण सेटिंग्स के साथ 3840x2160 पर उच्च फ्रेम दर बनाए रखने के लिए पर्याप्त तेज़ होगा।

एकाधिक मॉनीटर से कॉन्फ़िगरेशन के साथ स्थिति क्या है? कई गेमर्स 1920x1080 के रिज़ॉल्यूशन के साथ तीन मॉनिटर स्थापित करने के लिए तैयार हैं, लेकिन बशर्ते कि ग्राफिक्स सिस्टम लोड को संभाल सके, क्योंकि इस मामले में कार्ड को आधा मिलियन पिक्सल रेंडर करना पड़ता है, क्योंकि रिज़ॉल्यूशन 7680x1440 है। 11520x2160 पिक्सल के कुल रिज़ॉल्यूशन के साथ तीन 4K डिस्प्ले लेने के इच्छुक भी उत्साही हैं।

नया गेमिंग फ्लैगशिप वीडियो कार्ड के लिए भी बाद वाला विकल्प बहुत आकर्षक है। हालाँकि, Nvidia GP104 प्रोसेसर ऐसी तकनीक से लैस है जो नए मॉडल के कार्यों, यानी 4K और सराउंड के अनुभव को बेहतर बनाने का वादा करता है। लेकिन इससे पहले कि हम नई तकनीकों की ओर बढ़ें, आइए GP104 प्रोसेसर और इसके अंतर्निहित पास्कल आर्किटेक्चर पर करीब से नज़र डालें।

GP104 किससे बना है?

2012 की शुरुआत से, AMD और Nvidia 28nm प्रोसेस टेक्नोलॉजी का उपयोग कर रहे हैं। इस पर स्विच करके, दोनों कंपनियों ने Radeon HD 7970 और GeForce GTX 680 ग्राफिक्स कार्ड की शुरुआत के साथ एक महत्वपूर्ण छलांग लगाई। हालाँकि, अगले चार वर्षों में, उन्हें मौजूदा तकनीक से अधिक प्रदर्शन प्राप्त करने के लिए बहुत कुछ करना पड़ा। Radeon R9 Fury X और GeForce GTX 980 Ti की उपलब्धियां उनकी जटिलता को देखते हुए चमत्कार हैं। Nvidia द्वारा 28nm प्रक्रिया प्रौद्योगिकी का उपयोग करके बनाई गई पहली चिप GK104 थी, जिसमें 3.5 बिलियन ट्रांजिस्टर शामिल थे। GM200, जो GeForce GTX 980 Ti और Titan X को शक्ति प्रदान करता है, में पहले से ही आठ बिलियन ट्रांजिस्टर हैं।

TSMC की 16nm FinFET Plus तकनीक के कदम ने Nvidia इंजीनियरों को नए विचारों को जीवन में लाने की अनुमति दी। तकनीकी आंकड़ों के अनुसार, 16FF + चिप्स 65% तेज हैं, 28HPM से दोगुने घनत्व वाले हो सकते हैं, या 70 कम बिजली की खपत कर सकते हैं। एनवीडिया अपने जीपीयू बनाने के लिए इन फायदों के इष्टतम संयोजन का उपयोग करता है। टीएसएमसी का दावा है कि यह मौजूदा 20 एनएम प्रक्रिया के इंजीनियरिंग विकास पर आधारित था, लेकिन फ्लैट ट्रांजिस्टर के बजाय फिनफेट ट्रांजिस्टर का इस्तेमाल किया गया था। कंपनी का कहना है कि यह तरीका स्क्रैप को कम करता है और प्लेट यील्ड को बढ़ाता है। इसका यह भी दावा है कि कंपनी के पास फास्ट ट्रांजिस्टर के साथ 20nm प्रोसेस नहीं था। फिर से, कंप्यूटर ग्राफिक्स की दुनिया 28 एनएम प्रक्रिया प्रौद्योगिकी पर चार साल से अधिक समय से "बैठी" है।


GP104 प्रोसेसर ब्लॉक आरेख

GM204 के उत्तराधिकारी में 7.2 बिलियन ट्रांजिस्टर होते हैं जो 314 मिमी 2 के क्षेत्र में स्थित होते हैं। तुलना करके, GM204 में 5.2 बिलियन ट्रांजिस्टर के साथ 398mm2 डाई क्षेत्र है। पूर्ण संस्करण में, एक GPU GP104 में चार ग्राफिक्स प्रोसेसिंग क्लस्टर (GPC) हैं। प्रत्येक GPC में पाँच थ्रेड / टेक्सचर प्रोसेसिंग क्लस्टर (TPC) और एक ROP इकाई शामिल है। टीपीसी एक स्ट्रीमिंग मल्टीप्रोसेसर एसएम और पॉलीमॉर्फ इंजन को जोड़ती है। SM 128 सिंगल प्रिसिजन CUDA कोर, 256 KB रजिस्टर मेमोरी, 96 KB शेयर्ड मेमोरी, 48 KB L1 कैश / टेक्सचर और आठ टेक्सचर यूनिट्स को एकीकृत करता है। पॉलीमॉर्फ इंजन की चौथी पीढ़ी में रेखापुंज ब्लॉक के सामने ज्यामिति पाइपलाइन के अंत में स्थित एक नया लॉजिक ब्लॉक शामिल है, यह एक साथ मल्टी-प्रोजेक्शन फ़ंक्शन (उस पर और अधिक) को नियंत्रित करता है। कुल मिलाकर, हमें 20 SM, 2560 CUDA कोर और 160 बनावट प्रसंस्करण इकाइयाँ मिलती हैं।


GP104 में एक स्ट्रीमिंग मल्टीप्रोसेसर (SM)

GPU बैक-एंड में आठ 32-बिट मेमोरी कंट्रोलर (256-बिट कुल बैंडविड्थ), आठ ROP और 256KB L2 कैश प्रति ब्लॉक शामिल हैं। परिणामस्वरूप, हमारे पास 64 ROP और 2 MB का साझा L2 कैश है। हालांकि एनवीडिया जीएम204 प्रोसेसर के ब्लॉक आरेख में चार 64-बिट नियंत्रक और 16 आरओपी दिखाए गए हैं, लेकिन उन्हें समूहीकृत और कार्यात्मक रूप से समकक्ष किया गया है।

GP104 के कुछ बिल्डिंग ब्लॉक्स GM204 के समान हैं, क्योंकि नया GPU अपने पूर्ववर्ती के "बिल्डिंग ब्लॉक्स" से बनाया गया था। कुछ भी गलत नहीं है। अगर आपको याद हो तो मैक्सवेल की वास्तुकला ने ऊर्जा दक्षता पर ध्यान केंद्रित किया और उन ब्लॉकों को नहीं हिलाया जो केप्लर के मजबूत बिंदु थे। ऐसी ही एक तस्वीर हम यहां देख रहे हैं।

चार एसएम जोड़ने से प्रदर्शन पर ध्यान देने योग्य प्रभाव नहीं पड़ सकता है। हालाँकि, GP104 की आस्तीन में कुछ तरकीबें हैं। पहला ट्रम्प कार्ड काफी अधिक घड़ी की गति है। बेस जीपीयू क्लॉक स्पीड 1607 मेगाहर्ट्ज है। तुलना के लिए GM204 स्पेक्स, 1126 मेगाहर्ट्ज का संकेत देते हैं। अधिकतम GPU बूस्ट फ़्रीक्वेंसी 1733 मेगाहर्ट्ज तक पहुंचती है, लेकिन हम EVGA प्रेसिजनएक्स उपयोगिता के बीटा संस्करण का उपयोग करके अपना नमूना 2100 मेगाहर्ट्ज तक लाए। ओवरक्लॉकिंग के लिए ऐसा हेडरूम कहां से आता है? GPU विकास के वरिष्ठ उपाध्यक्ष जॉन एल्बिन के अनुसार, उनकी टीम को पता था कि TSMC की 16FF + प्रक्रिया चिप की वास्तुकला को प्रभावित करेगी, इसलिए उन्होंने उच्च घड़ी की गति को रोकने वाली बाधाओं को दूर करने के लिए चिप के समय को अनुकूलित करने पर ध्यान केंद्रित किया। परिणामस्वरूप, GeForce GTX 980 में 4612 GFLOPs की सीमा की तुलना में GP104 एकल सटीक कंप्यूटिंग गति 8228 GFLOPs (आधार आवृत्ति पर) तक पहुंच गई। टेक्सल भरण दर 980 में 155.6 Gtex / s से कूद गई (GPU बूस्ट के साथ) 277, 3 जीटेक्स / एस।

जीपीयू GeForce GTX 1080 (GP104) GeForce GTX 980 (GM204)
एसएम 20 16
CUDA कोर की संख्या 2560 2048
GPU आधार आवृत्ति, मेगाहर्ट्ज 1607 1126
बूस्ट मोड में GPU आवृत्ति, MHz 1733 1216
संगणना गति, GFLOPs (आधार आवृत्ति पर) 8228 4612
बनावट इकाइयों की संख्या 160 128
स्पीड फिलिंग टेक्सल्स, Gtex / s 277,3 155,6
मेमोरी डेटा ट्रांसफर दर, जीबीपीएस 10 7
मेमोरी बैंडविड्थ, जीबी / एस 320 224
आरओपी इकाइयों की संख्या 64 64
L2 कैश आकार, एमबी 2 2
थर्मल पैकेज, डब्ल्यू 180 165
ट्रांजिस्टर की संख्या 7.2 अरब 5.2 अरब
क्रिस्टल क्षेत्र, मिमी2 314 398 मिमी
प्रक्रिया प्रौद्योगिकी, एनएम 16 28

बैक एंड में अभी भी 64 आरओपी और 256-बिट मेमोरी बस शामिल है, लेकिन एनवीडिया ने उपलब्ध बैंडविड्थ को बढ़ाने के लिए GDDR5X मेमोरी को लागू किया है। कंपनी ने नए प्रकार की मेमोरी को बढ़ावा देने के लिए बहुत प्रयास किया है, विशेष रूप से एचबीएम मेमोरी की पृष्ठभूमि के खिलाफ, जिसका उपयोग विभिन्न एएमडी वीडियो कार्ड और एचबीएम 2 में किया जाता है, जिसे एनवीडिया टेस्ला पी 100 में स्थापित करता है। ऐसा लग रहा है कि बाजार में अब HBM2 मेमोरी की कमी है, जबकि कंपनी HBM (चार 1GB स्टैक, या आठ 1GB स्टैक के कार्यान्वयन से जुड़ी कठिनाइयों) की सीमाओं को स्वीकार करने के लिए तैयार नहीं है। इस प्रकार, हमें GDDR5X वीडियो मेमोरी मिली, जिसकी आपूर्ति, जाहिरा तौर पर, भी सीमित है, क्योंकि GeForce GTX 1070 पहले से ही सामान्य GDDR5 का उपयोग करता है। लेकिन यह नए समाधान की खूबियों को ओवरराइड नहीं करता है। GeForce GTX 980 में GDDR5 मेमोरी की डेटा ट्रांसफर दर 7 Gbps थी। इसने 256-बिट बस में 224 GB/s बैंडविड्थ प्रदान की। GDDR5X 320GB / s थ्रूपुट (~ 43% वृद्धि) तक टकराते हुए, 10Gb / s पर शुरू होता है। एनवीडिया के अनुसार, बिजली की खपत में वृद्धि के बिना पुन: डिज़ाइन किए गए I / O सर्किटरी के कारण लाभ होता है।

मैक्सवेल आर्किटेक्चर ने कैश और कम्प्रेशन एल्गोरिदम को अनुकूलित करके बैंडविड्थ का अधिक कुशल उपयोग किया है, और पास्कल मेमोरी सबसिस्टम के उपलब्ध बैंडविड्थ का अधिक आर्थिक रूप से उपयोग करने के लिए नई दोषरहित संपीड़न विधियों के साथ उसी पथ का अनुसरण करता है। डेल्टा रंग संपीड़न एल्गोरिथ्म 2: 1 का लाभ प्राप्त करने का प्रयास करता है, और अधिक बार उपयोग के लिए इस मोड में सुधार किया गया है। एक नया 4: 1 मोड भी है, जिसका उपयोग उन मामलों में किया जाता है जहां प्रति पिक्सेल अंतर बहुत छोटा होता है। अंत में, पास्कल एक और नया 8: 1 एल्गोरिदम पेश करता है जो 2x2 ब्लॉक में 4: 1 संपीड़न लागू करता है, जिसके बीच का अंतर 2: 1 एल्गोरिदम का उपयोग करके संसाधित होता है।



अंतर स्पष्ट करना मुश्किल नहीं है। पहली छवि प्रोजेक्ट CARS गेम से एक असम्पीडित स्क्रीनशॉट दिखाती है। निम्न छवि उन तत्वों को दिखाती है जिन्हें मैक्सवेल कार्ड संपीड़ित कर सकता है और वे बैंगनी रंग के होते हैं। तीसरे शॉट में आप देख सकते हैं कि पास्कल सीन को और भी ज्यादा कंप्रेस करता है। एनवीडिया के अनुसार, यह अंतर बाइट जानकारी में लगभग 20% की कमी का अनुवाद करता है जिसे प्रत्येक फ्रेम के लिए मेमोरी से प्राप्त करने की आवश्यकता होती है।

एनवीडिया GeForce GTX 1080 पास्कल समीक्षा | संदर्भ कार्ड डिजाइन

एनवीडिया ने कार्ड डिजाइन के प्रति अपना दृष्टिकोण बदल दिया है। "संदर्भ" के बजाय, वह मानचित्र के अपने संस्करण को संस्थापक संस्करण (रचनाकारों का संस्करण) कहती है। यह नोटिस करना असंभव नहीं है कि GeForce GTX 1080 की उपस्थिति अधिक कोणीय हो गई है, लेकिन शीतलन प्रणाली साइड बार के माध्यम से गर्म हवा को बाहर निकालने के लिए उसी पुराने सिद्ध तंत्र का उपयोग करती है।

कार्ड का वजन 1020 ग्राम है और यह 27 सेमी लंबा है। यह स्पर्श के लिए काफी सुखद है, क्योंकि कूलर का आवरण न केवल धातु जैसा दिखता है, यह वास्तव में धातु से बना है, अधिक सटीक रूप से, एल्यूमीनियम। मैट सिल्वर भागों को वार्निश किया गया है और यदि कार्ड को बहुत सावधानी से नहीं संभाला जाता है तो वे जल्दी से खरोंच हो जाएंगे।

पीछे की प्लेट को दो भागों में बांटा गया है। यह केवल सजावट के रूप में कार्य करता है और इसमें शीतलन कार्य नहीं होता है। बाद में पता चलेगा कि यह फैसला कितना सही है। एनवीडिया एसएलआई का उपयोग करते समय इस प्लेट के तत्वों को हटाने की सिफारिश करता है ताकि एक दूसरे के करीब स्थापित कार्ड के बीच बेहतर वायु प्रवाह प्राप्त किया जा सके।

नीचे कुछ भी दिलचस्प नहीं है, हालांकि हमने देखा कि काले ढक्कन के हिस्से नीचे स्थित मदरबोर्ड के तत्वों के संपर्क में आ सकते हैं, जैसे कि चिपसेट कूलर और एसएटीए पोर्ट।

कार्ड के शीर्ष पर हम एक सहायक आठ-पिन पावर कनेक्टर देखते हैं। वीडियो कार्ड के आधिकारिक विनिर्देशों के साथ-साथ मदरबोर्ड स्लॉट से खींची गई 60W शक्ति को ध्यान में रखते हुए, ऐसा एक कनेक्टर नाममात्र 180W थर्मल पैकेज के लिए पर्याप्त होना चाहिए। स्वाभाविक रूप से, हम जांच करेंगे कि यह कार्ड वास्तव में कितनी शक्ति खींचता है, और क्या यह बिजली लाइनों को अधिभारित करता है।

दो SLI कनेक्टर भी हैं। नए पास्कल ग्राफिक्स कार्ड के साथ, एनवीडिया ने नए हाई-बैंडविड्थ ब्रिज पेश किए हैं। हम उन्हें बाद में और अधिक विस्तार से देखेंगे। संक्षेप में, अब तक केवल दो वीडियो कार्ड SLI कॉन्फ़िगरेशन आधिकारिक रूप से समर्थित हैं, और दोनों कनेक्टर GPU के बीच दोहरे चैनल इंटरफ़ेस को संचालित करने के लिए उपयोग किए जाते हैं।

I/O पैनल पर तीन फुल डिस्प्लेपोर्ट कनेक्टर उपलब्ध हैं। विनिर्देश डिस्प्लेपोर्ट 1.2 मानक निर्दिष्ट करते हैं, लेकिन डिस्प्लेपोर्ट 1.3 / 1.4 अनुरूप होने की उम्मीद है (कम से कम डिस्प्ले नियंत्रक नए मानकों को संभाल सकता है)। एक एचडीएमआई 2.0 आउटपुट और डुअल लिंक डीवीआई-डी भी है। आपको एनालॉग कनेक्टर्स की खोज करने की आवश्यकता नहीं है।

कार्ड के दूसरी तरफ हवा के सेवन के लिए एक बड़ा स्लॉट और मामले में कार्ड के अतिरिक्त निर्धारण के लिए तीन स्क्रू होल हैं।

कूलर डिजाइन और बिजली की आपूर्ति

बाहरी हिस्से की सावधानीपूर्वक जांच करने के बाद, एल्युमिनियम केसिंग के नीचे छिपी फिलिंग पर एक नज़र डालने का समय आ गया है। यह पहली नज़र में लग सकता है की तुलना में अधिक कठिन निकला। जुदा करने के बाद, हमने शिकंजा सहित मेज पर 51 भागों को गिना। यदि पंखे हटा दिए जाते हैं, तो 12 और जोड़े जाएंगे।

एनवीडिया अंत में एक वास्तविक वाष्प कक्ष का उपयोग करने के लिए वापस आ गया है। यह GPU के ऊपर चार स्क्रू के साथ बोर्ड से जुड़ा होता है।

केन्द्रापसारक प्रशंसक आपसे परिचित होना चाहिए। प्रत्यक्ष गर्मी लंपटता का अर्थ है एक स्थान पर हवा का सेवन, रेडिएटर फिन के माध्यम से इसका मार्ग और मामले से बाहर। कूलर कफन, जो एक फ्रेम के रूप में भी काम करता है, न केवल कार्ड को स्थिर करता है, बल्कि वोल्टेज कन्वर्टर्स और मेमोरी मॉड्यूल को ठंडा करने में भी मदद करता है।

सभी बाहरी घटकों को हटाने के बाद, हम मुद्रित सर्किट बोर्ड पर पहुंचते हैं। पिछले समाधानों के विपरीत, एनवीडिया छह-चरण बिजली योजना का उपयोग करता है। पांच चरण GPU की सेवा करते हैं, और शेष चरण GDDR5X मेमोरी को शक्ति प्रदान करते हैं।

बोर्ड पर आप दूसरे चरण के लिए जगह देख सकते हैं, जो खाली है।

GP104 GPU 314 मिमी 2 के क्षेत्र को कवर करता है, जो कि इसके पूर्ववर्ती की तुलना में बहुत छोटा है। प्रोसेसर के चारों ओर बोर्ड की अन्य परतों की रेखाएं दिखाई दे रही हैं। उच्च घड़ी आवृत्तियों को प्राप्त करने के लिए, कंडक्टर जितना संभव हो उतना छोटा होना चाहिए। सख्त आवश्यकताओं के कारण, एनवीडिया के भागीदारों को उत्पादन शुरू होने में अधिक समय लगने की संभावना है।

GDDR5X मेमोरी को माइक्रोन के 6HA77 चिप्स द्वारा दर्शाया गया है। वे बड़े पैमाने पर उत्पादन में चले गए, जैसा कि हमने एनवीडिया के नए ग्राफिक्स कार्ड की पिछली लीक छवियों में 6GA77 चिप्स देखे थे।

कुल आठ मेमोरी मॉड्यूल 32-बिट नियंत्रकों के माध्यम से 256-बिट मेमोरी बस से जुड़े हैं। 1251 मेगाहर्ट्ज की आवृत्ति पर, बैंडविड्थ 320 जीबी / एस तक पहुंच जाता है।

माइक्रोन के GDDR5X मॉड्यूल 190-पिन GDDR5 के बजाय 170-पिन पैकेजिंग का उपयोग करते हैं। वे थोड़े छोटे भी हैं: 14x12 मिमी के बजाय 14x10 मिमी। यानी इनका घनत्व अधिक होता है और इन्हें बेहतर कूलिंग की आवश्यकता होती है।

कार्ड को पलटते हुए, हमें दूसरे पावर कनेक्टर के लिए खाली जगह मिली। इस प्रकार, एनवीडिया पार्टनर पावर जोड़ने के लिए दूसरा सहायक कनेक्टर स्थापित कर सकते हैं, या मौजूदा को एक अलग स्थिति में ले जा सकते हैं।

बोर्ड में एक स्लॉट भी है जो आपको पावर कनेक्टर को 180 डिग्री घुमाने की अनुमति देता है।

संभावित उछाल को सुचारू करने के लिए कैपेसिटर सीधे GPU के नीचे स्थित होते हैं। इसके अलावा बोर्ड के इस तरफ PWM है (पहले यह सामने की तरफ स्थित था)। यह समाधान एनवीडिया भागीदारों को अन्य पीडब्लूएम नियंत्रकों को स्थापित करने की क्षमता देता है।

लेकिन वापस वोल्टेज नियामक के पीडब्लूएम नियंत्रक के पास। एनवीडिया की जीपीयू बूस्ट 3.0 तकनीक को वोल्टेज विनियमन आवश्यकताओं का एक नया सेट प्राप्त हुआ है, जिसके परिणामस्वरूप महत्वपूर्ण परिवर्तन हुए हैं। हमें 5 + 1 चरण सर्किट के साथ संयुक्त इंटरनेशनल रेक्टिफायर से IR3536A नियंत्रक देखने की उम्मीद थी, लेकिन एनवीडिया ने µP9511P का उपयोग किया। ओवरक्लॉकिंग के शौकीनों के लिए यह सबसे अच्छी खबर नहीं है, क्योंकि कार्ड एमएसआई आफ्टरबर्नर और गीगाबाइट ओसी गुरु जैसे उपकरणों के इंटरफेस और प्रोटोकॉल का समर्थन नहीं करता है। एक नए नियंत्रक के लिए स्विच, जो अभी तक अच्छी तरह से वर्णित नहीं है, तकनीकी मुद्दों के कारण सबसे अधिक संभावना है।

चूंकि पीडब्लूएम नियंत्रक वोल्टेज कनवर्टर के अलग-अलग चरणों को सीधे ड्राइव नहीं कर सकता है, एनवीडिया एमओएसएफईटी के गेट को चलाने के लिए 53603 ए चिप्स के साथ शक्तिशाली एमओएसएफईटी ड्राइवरों का उपयोग करता है। लेकिन कुछ अन्य विकल्पों की तुलना में, सर्किट का लेआउट साफ सुथरा दिखता है।

यहाँ विभिन्न प्रकार के MOSFETs हैं। वोल्टेज रूपांतरण के लिए 4C85N एक काफी लचीला दो-चैनल MOSFET है। यह बिजली आपूर्ति के सभी छह चरणों में कार्य करता है और संदर्भ डिजाइन के भार को संभालने के लिए पर्याप्त विद्युत और थर्मल भंडार हैं।


मुझे आश्चर्य है कि एनवीडिया की जीपीयू बूस्ट 3.0 तकनीक और संशोधित वोल्टेज नियामक सर्किटरी बिजली की खपत को कैसे प्रभावित करेगी। हम निश्चित रूप से इसकी जांच करेंगे।

एनवीडिया GeForce GTX 1080 पास्कल समीक्षा | एक साथ बहु-प्रोजेक्शन और Async कंप्यूट तकनीक

एक साथ बहु-प्रोजेक्शन इंजन

बढ़ी हुई कोर काउंट, क्लॉक स्पीड और 10Gbps GDDR5X मेमोरी हमारे द्वारा परीक्षण किए गए हर गेम को तेज करती है। हालांकि, पास्कल वास्तुकला में कई विशेषताएं शामिल हैं जिन्हें हम केवल आगामी खेलों में ही समझ पाएंगे।

नई सुविधाओं में से एक एनवीडिया एक साथ मल्टी-प्रोजेक्शन इंजन, या एक मल्टी-प्रोजेक्शन इंजन को कॉल करता है, जिसे पॉलीमॉर्फ इंजन में जोड़े गए हार्डवेयर यूनिट द्वारा दर्शाया जाता है। नया इंजन एक ही दृष्टिकोण से ज्यामितीय डेटा के 16 अनुमान तक बना सकता है। या यह स्टीरियोस्कोपिक छवि बनाने के लिए दृष्टिकोण को स्थानांतरित कर सकता है, हार्डवेयर के साथ 32 बार ज्यामिति की नकल करता है, जो कि प्रदर्शन दंड के बिना है जिसे आप एसएमपी के बिना इस प्रभाव को प्राप्त करने का प्रयास करने का अनुभव करेंगे।


वन-प्लेन प्रोजेक्शन

आइए इस तकनीक के फायदों को समझने की कोशिश करते हैं। उदाहरण के लिए, हमारे पास सराउंड कॉन्फ़िगरेशन में तीन मॉनिटर हैं। वे उपयोगकर्ता को "लपेटने" के लिए थोड़ा अंदर की ओर मुड़े हुए हैं, इसलिए इसे खेलना और काम करना अधिक सुविधाजनक है। लेकिन गेम इस बारे में नहीं जानते हैं और इमेज को एक प्लेन में रेंडर करते हैं, इसलिए यह उस जगह पर घुमावदार दिखाई देता है जहां मॉनिटर फ्रेम मिलते हैं, और पूरी तस्वीर विकृत दिखती है। इस तरह के एक विन्यास के लिए, एक प्रक्षेपण को सीधे कल्पना करना अधिक सही होगा, दूसरा प्रक्षेपण बाईं ओर, जैसे कि एक मनोरम कॉकपिट से, और तीसरा प्रक्षेपण दाईं ओर। इस प्रकार, पहले से घुमावदार पैनोरमा चिकना दिखाई देगा और उपयोगकर्ता के पास बहुत व्यापक देखने का कोण होगा। पूरे दृश्य को अभी भी रेखापुंज और चित्रित करने की आवश्यकता है, लेकिन GPU को दृश्य को तीन बार प्रस्तुत करने की आवश्यकता नहीं है, जिससे अनावश्यक भार समाप्त हो जाता है।


एंगल्ड डिस्प्ले पर गलत नजरिया



एसएमपी परिप्रेक्ष्य के साथ ठीक किया गया

हालांकि, एप्लिकेशन को वाइड व्यूइंग एंगल सेटिंग्स का समर्थन करना चाहिए और एसएमपी एपीआई कॉल का उपयोग करना चाहिए। इसका मतलब है कि इस सुविधा का लाभ उठाने से पहले गेम डेवलपर्स को इसमें महारत हासिल करनी होगी। हमें यकीन नहीं है कि वे मल्टी-मॉनिटर सराउंड कॉन्फ़िगरेशन वाले मुट्ठी भर उपयोगकर्ताओं में कितना प्रयास करने को तैयार हैं। लेकिन ऐसे अन्य अनुप्रयोग हैं जिनके लिए इस सुविधा को जल्द से जल्द लागू करना समझ में आता है।


सिंगल-पास स्टीरियो रेंडरिंग का उपयोग करके, एसएमपी प्रत्येक आंख के लिए एक प्रोजेक्शन बनाता है

एक उदाहरण के रूप में आभासी वास्तविकता को लें। उसे पहले से ही प्रत्येक आंख के लिए एक व्यक्तिगत प्रक्षेपण की आवश्यकता है। खेल आज केवल दो स्क्रीन पर अलग-अलग छवियों को प्रस्तुत करते हैं, सभी परिचर नुकसान और दक्षता में नुकसान के साथ। लेकिन चूंकि एसएमपी दो प्रक्षेपण केंद्रों का समर्थन करता है, इसलिए एनवीडिया सिंगल पास स्टीरियो फीचर का उपयोग करके दृश्य को एक पास में प्रस्तुत किया जा सकता है। ज्यामिति को एक बार संसाधित किया जाता है, और एसएमपी बाईं और दाईं आंखों के लिए अपना प्रक्षेपण बनाता है। फिर एसएमपी लेंस मैचेड शेडिंग नामक सुविधा के साथ काम करने के लिए अतिरिक्त अनुमान लगा सकता है।


लेंस मिलान छायांकन के साथ पहले पास के बाद की छवियां



अंतिम दृश्य जो हेडसेट को भेजा जाता है

संक्षेप में, लेंस मिलान छायांकन बड़ी मात्रा में काम से बचकर वीआर प्रतिपादन को और अधिक कुशल बनाने की कोशिश करता है जो सामान्य रूप से हेडसेट के लेंस विरूपण से मेल खाने के लिए ज्यामिति को विकृत करने के लिए पारंपरिक प्लानर प्रक्षेपण प्रदान करते समय किया जाता है (इसलिए पिक्सल बर्बाद हो जाते हैं जहां झुकने सबसे बड़ा है)... क्षेत्र को चतुर्भुजों में विभाजित करने के लिए एसएमपी का उपयोग करके इस प्रभाव का अनुमान लगाया जा सकता है। तो एक वर्ग प्रक्षेपण प्रदान करने और इसके साथ काम करने के बजाय, GPU ऐसे चित्र बनाता है जो लेंस विरूपण फ़िल्टर से मेल खाते हैं। यह विधि अतिरिक्त पिक्सेल के निर्माण को रोकती है। जब तक डेवलपर्स एचएमडी पर नजर रखने के लिए नमूना दर का पालन करते हैं या उससे अधिक हो जाते हैं, तब तक आपको गुणवत्ता में अंतर दिखाई नहीं देगा।

एनवीडिया के अनुसार, सिंगल पास स्टीरियो और लेंस मैचेड शेडिंग तकनीकों का संयोजन एसएमपी समर्थन के बिना जीपीयू की तुलना में वीआर में 2x प्रदर्शन प्रदान कर सकता है। यह आंशिक रूप से पिक्सेल प्रतिपादन से संबंधित है। प्रसंस्करण पिक्सेल से बचने के लिए लेंस मिलान छायांकन तकनीक का उपयोग करके, जिसे प्रस्तुत नहीं किया जाना चाहिए, संतुलित एनवीडिया प्रीसेट वाले दृश्य में प्रतिपादन दर 4.2MP / s (Oculus Rift) से 2.8MP / s तक गिर गई, इस प्रकार GPU पर एक शेडर लोड गिरा दिया गया आधा। सिंगल पास स्टीरियो, जो ज्यामिति को केवल एक बार संसाधित करता है (दूसरी आंख के लिए पुन: प्रस्तुत करने के बजाय) प्रभावी ढंग से आधे ज्यामिति को समाप्त कर देता है जिसे आज करने की आवश्यकता है। अब यह स्पष्ट हो गया है कि रेन-सन का क्या मतलब था जब उन्होंने कहा "दो बार प्रदर्शन और टाइटन एक्स की तुलना में तीन गुना दक्षता"।

अतुल्यकालिक गणना

पास्कल आर्किटेक्चर में एसिंक्रोनस कंप्यूटिंग में कुछ बदलाव भी शामिल हैं, जो कई कारणों से डायरेक्टएक्स 12, वीआर और एएमडी के वास्तुशिल्प लाभ से संबंधित हैं।

एनवीडिया मैक्सवेल आर्किटेक्चर से शुरू होने वाले ग्राफिक्स और गणना कार्यों के लिए स्थिर जीपीयू साझाकरण का समर्थन करता है। सिद्धांत रूप में, यह दृष्टिकोण अच्छा है जब दोनों ब्लॉक एक ही समय में सक्रिय होते हैं। लेकिन मान लीजिए कि प्रोसेसर के 75% संसाधन ग्राफिक्स के लिए समर्पित हैं, और इसने कार्य के अपने हिस्से को तेजी से पूरा किया। तब यह ब्लॉक निष्क्रिय हो जाएगा, कंप्यूटिंग ब्लॉक के काम के अपने हिस्से को पूरा करने की प्रतीक्षा कर रहा है। इस प्रकार, इन कार्यों को एक ही समय में करने के सभी संभावित लाभ खो जाते हैं। पास्कल गतिशील रूप से लोड को संतुलित करके इस समस्या का समाधान करता है। यदि ड्राइवर निर्णय लेता है कि एक पार्टीशन का कम उपयोग किया गया है, तो वह अपने संसाधनों को दूसरे की मदद करने के लिए स्विच कर सकता है, डाउनटाइम को रोक सकता है जो प्रदर्शन को नकारात्मक रूप से प्रभावित करता है।

एनवीडिया ने पास्कल में इंटरप्ट क्षमताओं में भी सुधार किया, यानी, बहुत कम निष्पादन समय के साथ अधिक "तत्काल" को हल करने के लिए वर्तमान कार्य को रोकने की क्षमता। जैसा कि आप जानते हैं, GPU अत्यधिक समानांतर मशीनें हैं जिनमें बड़े बफर होते हैं जो समान संसाधनों को एक दूसरे के बगल में व्यस्त रखने के लिए डिज़ाइन किए जाते हैं। एक निष्क्रिय शेडर बेकार है, इसलिए आपको इसे हर तरह से अपने वर्कफ़्लो में शामिल करने की आवश्यकता है।


VR के लिए, सबसे ताज़ा ट्रैकिंग डेटा कैप्चर करने के लिए जितनी देर हो सके रुकावट अनुरोध भेजना सबसे अच्छा है

एक बेहतरीन उदाहरण एसिंक्रोनस टाइम ताना (एटीडब्ल्यू) फीचर है जिसे ओकुलस ने रिफ्ट के साथ पेश किया था। ऐसे मामले में जहां वीडियो कार्ड 90Hz डिस्प्ले पर हर 11ms पर एक नया फ्रेम डिलीवर नहीं कर सकता है, ATW हेड पोजीशन करेक्शन के साथ आखिरी फ्रेम का उपयोग करके एक इंटरमीडिएट फ्रेम जेनरेट करता है। लेकिन ऐसा फ्रेम बनाने के लिए पर्याप्त समय होना चाहिए, और दुर्भाग्य से, ग्राफिक रुकावट बहुत सटीक नहीं है। वास्तव में, फर्मी, केप्लर और मैक्सवेल आर्किटेक्चर रेंडर-लेवल इंटरप्ट का समर्थन करते हैं, जिसका अर्थ है कि फ़्रेम को ड्रॉ कॉल के भीतर स्विच किया जा सकता है, संभावित रूप से एटीडब्ल्यू तकनीक को वापस पकड़ सकता है।

पास्कल ग्राफिक्स के लिए एक पिक्सेल-स्तरीय इंटरप्ट को लागू करता है, इसलिए GP104 पिक्सेल-स्तर पर वर्तमान ऑपरेशन को रोक सकता है, अपनी स्थिति को बचा सकता है, और एक अलग संदर्भ में स्विच कर सकता है। ओकुलस ने जिस मिलीसेकंड इंटरप्ट के बारे में लिखा है, उसके बजाय एनवीडिया 100 माइक्रोसेकंड से कम का दावा करता है।

मैक्सवेल आर्किटेक्चर में, कम्प्यूटेशनल यूनिट में पिक्सेल-स्तरीय इंटरप्ट के बराबर थ्रेड-स्तरीय इंटरप्ट के माध्यम से कार्यान्वित किया गया था। पास्कल भी इस तकनीक को बरकरार रखता है, लेकिन CUDA कम्प्यूटेशनल कार्यों में निर्देश-स्तर के व्यवधान के लिए समर्थन जोड़ता है। एनवीडिया के ड्राइवर फिलहाल इस फीचर को शामिल नहीं करते हैं, लेकिन यह जल्द ही पिक्सेल-लेवल इंटरप्ट के साथ उपलब्ध होगा।

एनवीडिया GeForce GTX 1080 पास्कल समीक्षा | आउटपुट पाइपलाइन, SLI और GPU बूस्ट 3.0

पास्कल डिस्प्ले चैनल: एचडीआर-रेडी

पिछले साल, हमने सोनोमा, कैलिफ़ोर्निया में एएमडी प्रतिनिधियों से मुलाकात की, ताकि उनके नए पोलारिस आर्किटेक्चर के कुछ विवरण साझा किए जा सकें, जैसे कि एचडीआर सामग्री पाइपलाइन और संबंधित डिस्प्ले।

आश्चर्य नहीं कि एनवीडिया की पास्कल वास्तुकला समान विशेषताओं से भरी हुई है, जिनमें से कुछ मैक्सवेल में भी उपलब्ध थीं। उदाहरण के लिए, GP104 प्रोसेसर में डिस्प्ले कंट्रोलर में 12-बिट रंग, BT.2020 वाइड कलर सरगम, SMPTE 2084 इलेक्ट्रो-ऑप्टिकल ट्रांसमिशन और HDCP 2.2 के साथ HDMI 2.0b का समर्थन है।

इस सूची में, पास्कल एक समर्पित हार्डवेयर इकाई के माध्यम से 4K60p पर 10/12-बिट रंग में त्वरित HEVC डिकोडिंग जोड़ता है जो HEVC संस्करण 2 का समर्थन करने का दावा करता है। अतीत में, Nvidia ने सॉफ़्टवेयर संसाधनों का उपयोग करके एक हाइब्रिड दृष्टिकोण का उपयोग किया था। इसके अलावा, एन्कोडिंग प्रति पिक्सेल आठ बिट रंग जानकारी तक सीमित थी। लेकिन हमारा मानना ​​है कि विवादास्पद विनिर्देशों का समर्थन करने के लिए Microsoft PlayReady 3.0 को एक तेज़ और अधिक कुशल समाधान की आवश्यकता है।

आर्किटेक्चर एचडीआर में रिकॉर्डिंग या स्ट्रीमिंग के लिए 4K60p पर 10-बिट रंग में एचईवीसी एन्कोडिंग का भी समर्थन करता है, एनवीडिया के पास इसके लिए एक समर्पित ऐप भी है। GP104 प्रोसेसर के एन्कोडिंग टूल और आने वाले गेमस्ट्रीम एचडीआर सॉफ़्टवेयर का उपयोग करके, आप एचडीआर-संगत टीवी से जुड़े शील्ड डिवाइस पर उच्च गतिशील रेंज गेम स्ट्रीम करने में सक्षम होंगे। शील्ड में प्रति पिक्सेल 10-बिट रंग के साथ एक मालिकाना HEVC डिकोडर है, जो छवि आउटपुट पाइपलाइन को और अधिक लोड करता है।

GeForce GTX 1080 GeForce GTX 980
एच .264 एन्कोडिंग हाँ (2x 4K60p) हां
HEVC एन्कोडिंग हाँ (2x 4K60p) हां
HEVC 10-बिट एन्कोडिंग हां नहीं
एच .264 डिकोडिंग हाँ (4K120p 240Mbps तक) हां
HEVC डिकोडिंग हाँ (4K120p / 8K30p 320Mbps तक) नहीं
वीपी 9 डिकोडिंग हाँ (4K120p 320Mbps तक) नहीं
डिकोडिंग HEVC 10/12-बिट हां नहीं

एचडीएमआई 2.0 बी को सपोर्ट करने के अलावा, GeForce GTX 1080 डिस्प्लेपोर्ट 1.2 प्रमाणित और DP 1.3 / 1.4 अनुरूप है। इस संबंध में, यह पहले से ही जारी होने वाली पोलारिस से आगे निकल गया है, जिसका डिस्प्ले कंट्रोलर अब तक केवल डीपी 1.3 का समर्थन करता है। सौभाग्य से एएमडी के लिए, 1.4 चश्मा एक तेज स्थानांतरण मोड नहीं दर्शाता है, और छत अभी भी एचबीआर 3 मोड द्वारा निर्धारित 32.4 जीबीपीएस पर सेट है।

जैसा कि पहले उल्लेख किया गया है, GeForce GTX 1080 फाउंडर्स एडिशन तीन डिस्प्ले पोर्ट आउटपुट, एक एचडीएमआई 2.0 बी कनेक्टर और एक डिजिटल डुअल-लिंक डीवीआई आउटपुट के साथ आता है। GTX 980 की तरह, नया उत्पाद एक साथ चार स्वतंत्र मॉनिटरों पर चित्र प्रदर्शित करने में सक्षम है। लेकिन दो डीपी 1.2 केबल के माध्यम से 5120x3200 रिज़ॉल्यूशन की तुलना में, जीटीएक्स 1080 का अधिकतम रिज़ॉल्यूशन 60Hz ताज़ा दर पर 7680x4320 पिक्सेल है।

SLI अब आधिकारिक तौर पर केवल दो GPU का समर्थन करता है

परंपरागत रूप से, हाई-एंड एनवीडिया वीडियो कार्ड एसएलआई बंडल में दो, तीन या चार त्वरक को जोड़ने के लिए दो कनेक्टर से लैस हैं। आमतौर पर, दोहरी GPU कॉन्फ़िगरेशन के साथ सर्वोत्तम स्केलिंग प्राप्त की जाती है। इसके अलावा, लागतें अक्सर उचित नहीं होती हैं, क्योंकि कई नुकसान होते हैं। हालांकि, कुछ उत्साही अभी भी प्रत्येक अतिरिक्त फ्रेम और दोस्तों को दिखाने के अवसर की खोज में तीन और चार ग्राफिक्स एडेप्टर का उपयोग करते हैं।

लेकिन स्थिति बदल गई है। नए गेम में प्रदर्शन स्केलिंग मुद्दों के कारण, इसमें कोई संदेह नहीं है कि DirectX 12-संबंधित, GeForce GTX 1080 केवल आधिकारिक तौर पर Nvidia के अनुसार दोहरे कार्ड SLI कॉन्फ़िगरेशन का समर्थन करता है। तो कार्ड को दो कनेक्टर्स की आवश्यकता क्यों है? नए एसएलआई पुलों के लिए धन्यवाद, दोहरे चैनल डेटा ट्रांसमिशन के लिए दोनों कनेक्टरों का एक साथ उपयोग किया जा सकता है। दोहरे चैनल मोड के अलावा, इंटरफ़ेस में I / O आवृत्ति भी है जो 400 मेगाहर्ट्ज से बढ़कर 650 मेगाहर्ट्ज हो गई है। नतीजतन, प्रोसेसर के बीच बैंडविड्थ दोगुनी से अधिक हो जाती है।


मध्य पृथ्वी में फ़्रेम रेंडरिंग समय: नए (ग्राफ़ में नीली रेखा) और पुराने (काले) SLI ब्रिज के साथ मॉर्डर की छाया

हालांकि, कई गेमर्स को तेज चैनल के लाभों का अनुभव नहीं होगा। यह प्रासंगिक होगा, सबसे पहले, उच्च रिज़ॉल्यूशन और ताज़ा दरों पर। एनवीडिया ने मध्य पृथ्वी में दो GeForce 1080 GTX का FCAT प्रदर्शन दिखाया: तीन 4K डिस्प्ले में शैडो ऑफ मॉर्डर। पुराने ब्रिज के साथ दो कार्ड्स को जोड़ने से फ्रेम टाइम फ़्रीक्वेंसी में लगातार उछाल आया, जो मंदी के रूप में प्रकट होने वाली अनुमानित सिंक्रोनाइज़ेशन समस्याओं को जन्म देता है। नए पुल के साथ, कूदने वालों की संख्या कम हो गई है, और वे कम स्पष्ट हो गए हैं।

एनवीडिया का कहना है कि यह सिर्फ एसएलआई एचबी ब्रिज नहीं है जो दोहरे चैनल मोड का समर्थन करता है। पहले से ही परिचित एलईडी-बैकलिट ब्रिज पास्कल कार्ड से कनेक्ट होने पर 650 मेगाहर्ट्ज की आवृत्ति पर डेटा संचारित कर सकते हैं। यदि आप 4K या उच्चतर में काम करना चाहते हैं तो लचीले या नियमित पुलों को मना करना बेहतर है। संगतता के बारे में विस्तृत जानकारी एनवीडिया द्वारा प्रदान की गई तालिका में पाई जा सकती है:

1920x1080 @ 60 हर्ट्ज 2560x1440 @ 120 हर्ट्ज + 2560x1440 4K 5K चारों ओर से घेरना
मानक पुल एक्स एक्स
एलईडी ब्रिज एक्स एक्स एक्स एक्स
उच्च डेटा दर (एचबी) ब्रिज एक्स एक्स एक्स एक्स एक्स एक्स

तीन- और चार-चिप कॉन्फ़िगरेशन को अस्वीकार करने का क्या कारण है? आखिरकार, कंपनी हमेशा अधिक बेचने और उच्च उत्पादकता हासिल करने का प्रयास करती है। यह निंदनीय रूप से कहा जा सकता है कि एनवीडिया एसएलआई में दो या चार कार्ड के बंडल के साथ फायदे के नुकसान की जिम्मेदारी नहीं लेना चाहता है, जब आधुनिक वीडियो गेम के लिए बाजार प्रतिपादन के लिए तेजी से सूक्ष्म और जटिल दृष्टिकोण का उपयोग करता है। लेकिन कंपनी का कहना है कि यह खरीदारों के सर्वोत्तम हित में काम कर रहा है क्योंकि माइक्रोसॉफ्ट गेम डेवलपर्स के लिए अधिक से अधिक मल्टीप्रोसेसर कॉन्फ़िगरेशन प्रबंधन क्षमताओं को जारी कर रहा है, जो बदले में मौजूदा फ्रेम-बाय के बजाय सिंगल-फ्रेम को-रेंडरिंग जैसी नई तकनीकों की खोज कर रहे हैं। -फ्रेम रेंडरिंग (एएफआर)।

उत्साही जो केवल गति रिकॉर्ड की परवाह करते हैं और ऊपर वर्णित कारकों में रुचि नहीं रखते हैं, वे अभी भी पुराने सॉफ़्टवेयर का उपयोग करके एसएलआई में तीन या चार जीटीएक्स 1080 को लिंक कर सकते हैं। उन्हें एनवीडिया से एक प्रोग्राम का उपयोग करके एक अद्वितीय "हार्डवेयर" हस्ताक्षर उत्पन्न करने की आवश्यकता है जो "अनलॉक" कुंजी का अनुरोध कर सकता है। स्वाभाविक रूप से, नए एचबी एसएलआई पुल दो से अधिक जीपीयू के साथ काम नहीं करेंगे, इसलिए आपको 650 मेगाहर्ट्ज पर तीन / चार जीपी 104 के काम को संयोजित करने के लिए खुद को पुराने एलईडी पुलों तक सीमित करना होगा।

GPU बूस्ट 3.0 एक नज़र में

अपने GPU से और भी अधिक प्रदर्शन निकालने के लिए, Nvidia ने GPU बूस्ट तकनीक को फिर से परिष्कृत किया है।

पिछली पीढ़ी (GPU Boost 2.0) में, एक निश्चित मान द्वारा स्लोप्ड वोल्टेज / फ़्रीक्वेंसी लाइन को स्थानांतरित करके घड़ी की आवृत्ति निर्धारित की गई थी। इन पंक्तियों के ऊपर संभावित हेडरूम आमतौर पर अप्रयुक्त छोड़ दिया गया था।


GPU बूस्ट 3.0 - एक वोल्टेज वृद्धि चरण द्वारा आवृत्ति बूस्ट सेट करना

अब GPU बूस्ट 3.0 आपको व्यक्तिगत वोल्टेज मानों के लिए आवृत्ति वृद्धि सेट करने की अनुमति देता है, जो केवल तापमान द्वारा सीमित हैं। इसके अलावा, आपको वक्र पर मूल्यों की पूरी श्रृंखला पर कार्ड की स्थिरता का प्रयोग और जांच करने की आवश्यकता नहीं है। एनवीडिया में इस प्रक्रिया को स्वचालित करने के लिए एक अंतर्निहित एल्गोरिथ्म है, जो आपके GPU के लिए एक वोल्टेज / आवृत्ति वक्र अद्वितीय बनाता है।