गो में दयनीय लोगों को बाहर निकालने वाला कृत्रिम दिमाग - क्या मशीनों का विद्रोह बस कोने के आसपास है?
गो में दयनीय लोगों को बाहर निकालने वाला कृत्रिम दिमाग - क्या मशीनों का विद्रोह बस कोने के आसपास है?

वीडियो: गो में दयनीय लोगों को बाहर निकालने वाला कृत्रिम दिमाग - क्या मशीनों का विद्रोह बस कोने के आसपास है?

वीडियो: गो में दयनीय लोगों को बाहर निकालने वाला कृत्रिम दिमाग - क्या मशीनों का विद्रोह बस कोने के आसपास है?
वीडियो: Nuclear Energy क्या Earth को बचाने की जगह इसके विनाश का कारण बन सकती है? (BBC Hindi) 2024, अप्रैल
Anonim

बहुत समय पहले नहीं, दक्षिण कोरियाई गो मास्टर और दुनिया के सबसे अधिक शीर्षक वाले खिलाड़ियों में से एक, ली सेडोल ने अपनी सेवानिवृत्ति की घोषणा की और एक नाटकीय बयान दिया: पागल प्रयासों के माध्यम से रेटिंग। अब एक अस्तित्व है जिसे दूर नहीं किया जा सकता है।"

ली ने डीपमाइंड द्वारा विकसित अल्फ़ागो कंप्यूटर के बारे में बात की, जिसे Google ने पांच साल पहले 650 मिलियन डॉलर में खरीदा था। 2016 में कोरियाई कार से हार गए, लेकिन तब से कृत्रिम बुद्धि केवल मजबूत हो गई है। सामान्य तौर पर, गो में किसी व्यक्ति पर कंप्यूटर की जीत को एक वास्तविक सफलता माना जाता है, जिससे संभावित रूप से दुनिया में बड़े पैमाने पर बदलाव हो सकते हैं। टर्मिनेटर पहले से ही क्षितिज पर है? आइए इसका पता लगाते हैं।

प्रोग्रामर ने लंबे समय से सर्वश्रेष्ठ मनुष्यों के साथ चुनौतीपूर्ण खेलों में कृत्रिम बुद्धिमत्ता की शक्ति का परीक्षण किया है। आईबीएम द्वारा विकसित डीप ब्लू कंप्यूटर ने 1997 में गैरी कास्परोव को शतरंज में हराया था। मैच से पहले कास्परोव ने सोचा: “यह सिर्फ एक कार है। मशीनें बेवकूफ हैं।"

लेकिन हार के बाद उन्होंने स्वीकार किया: "मुझे लगा - गंध - कि मेज पर एक नए प्रकार का दिमाग था।"

कास्पारोव को हराने के लिए, डीप ब्लू ने क्रूर कम्प्यूटेशनल शक्ति का उपयोग किया: प्रत्येक चाल के बाद, कार्यक्रम ने सभी संभावित परिदृश्यों की गणना की और इस डेटा के आधार पर निर्णय लिया। लेकिन गो के साथ, यह दृष्टिकोण डेटा की मात्रा के कारण काम नहीं करता है जिसे संसाधित करने की आवश्यकता होती है। चलते-फिरते, खिलाड़ी बारी-बारी से 19 तक बोर्ड पर काले और सफेद पत्थरों को रखते हैं। खेल का उद्देश्य जितना संभव हो उतना क्षेत्र पर कब्जा करना है, जबकि प्रतिद्वंद्वी के पत्थरों को बंद करना, उसे एक फायदा हासिल करने से रोकना है। सामान्य तौर पर, गो स्कूल के कई परिचित डॉट्स गेम के समान है - केवल अधिक कठिन।

बोर्ड के आकार के कारण, काले पत्थरों (शतरंज में - केवल 20) द्वारा किए गए पहले कदम के लिए 361 प्रकार पहले से ही संभव हैं। तदनुसार, प्रत्येक चाल के साथ, संभावित संरेखण का वृक्ष केवल बढ़ता है। पहली दो चालों के बाद, शतरंज में 400 संभावित विकास हैं, और 129,960 चल रहे हैं। गणितज्ञ जॉन ट्रॉम्प ने गणना की है कि संभावित संयोजनों की संख्या 171-अंकीय संख्या होगी।

इसलिए, गो के खेल में, लोगों को न केवल बुद्धि और गणना करने की क्षमता की आवश्यकता होती है, बल्कि शक्तिशाली अमूर्त सोच, मजबूत अंतर्ज्ञान - गुण जो कंप्यूटर में खराब विकसित होते हैं। अल्फागो के डेवलपर्स में से एक, डेमिस हसबिस ने कहा: "यह एक बहुत ही सहज ज्ञान युक्त खेल है। गो मास्टर्स अक्सर कहते हैं कि उन्होंने एक चाल चली क्योंकि यह सही लग रहा था।" उनके अनुसार, स्वामी एक विशेष सौंदर्य बोध विकसित करते हैं, और एक अच्छी स्थिति बस सुंदर दिखती है।

इस तथ्य के बावजूद कि प्रोसेसर हर साल अधिक शक्तिशाली और तेज होते गए, संभावनाओं के पेड़ पर चाल की खोज ने कृत्रिम बुद्धिमत्ता को केवल एक मजबूत शौकिया के स्तर तक पहुंचने की अनुमति दी। कंप्यूटर ने लोगों को मात दी, लेकिन कुछ ही पत्थरों में शुरुआत हुई। 2014 में, कंप्यूटर के लिए जाने के अग्रदूतों में से एक, डेविड फोटलैंड ने कहा कि कार्यक्रमों को मनुष्यों की तरह ही समस्या का सामना करना पड़ता है:

"कई खिलाड़ी एक निश्चित शौकिया शिखर पर पहुंच जाते हैं और मजबूत नहीं हो सकते। इस पठार को पार करने के लिए, आपको किसी प्रकार की मानसिक छलांग लगाने की आवश्यकता है, और कार्यक्रमों में समान समस्याएं हैं। आपको केवल स्थानीय लड़ाई ही नहीं, बल्कि पूरे बोर्ड को देखने की जरूरत है।" इस बौद्धिक बाधा को दूर करने और पेशेवरों के अंतर्ज्ञान और सौंदर्य बोध का अनुकरण करने के लिए, अल्फागो डेवलपर्स ने तंत्रिका नेटवर्क और गहन शिक्षण एल्गोरिदम को जोड़ा।

सबसे पहले, AlphaGo के तंत्रिका नेटवर्क को मानव खेलों का एक डेटाबेस खिलाया गया, जिसमें लगभग 30 मिलियन चालें शामिल थीं।उसके बाद, उन्होंने 57% समय में किसी व्यक्ति के पाठ्यक्रम की सही भविष्यवाणी करना सीखा, हालाँकि पिछला AI रिकॉर्ड 44% था। तब डेवलपर्स ने अल्फागो को खुद के खिलाफ खेलना सिखाया - इसलिए कंप्यूटर ने सबसे अधिक लाभदायक चालों को उजागर करने और नई रणनीति विकसित करने के लिए और भी बेहतर सीखा।

यह सब उन प्रक्रियाओं को युक्तिसंगत बनाने में मदद करता है जिन पर डीप ब्लू, जिन्होंने कास्पारोव को हराया, ने काम किया। अब सिस्टम न केवल सभी संभावित संयोजनों को खेलता है, बल्कि यह भी जानता है कि घटनाओं के विकास के लिए सबसे आशाजनक परिदृश्यों पर कैसे ध्यान केंद्रित किया जाए। इसके अलावा, वह उन परिस्थितियों में भी अपना असर पाती है, जिनका उसने पहले कभी सामना नहीं किया। और ऐसे, गो के पैमाने के कारण, बने रहे। नए तंत्र के कारण, अल्फ़ागो ने पहले बनाए गए सभी कंप्यूटर खिलाड़ियों को हरा दिया (जबकि उन्हें चार पत्थरों की शुरुआत दी गई) और पेशेवर लोगों को हराना शुरू कर दिया।

अक्टूबर 2015 में, अल्फा गो ने दो बार के यूरोपीय चैंपियन फ्रेंचमैन फैन हुई को हराया। उन्होंने पांच गेम खेले, किसी को भी बढ़त नहीं मिली और कंप्यूटर ने सभी पांचों में जीत हासिल की। यह पहला मौका था जब किसी पेशेवर व्यक्ति को किसी मशीन ने हराया था। मैच के बाद, हुई ने कहा कि उन्होंने बहुत कुछ सीखा है, और इस ज्ञान ने उन्हें अंतरराष्ट्रीय रैंकिंग में जोड़ने और बढ़ने में मदद की।

सिफारिश की: