
DeepMind के शोधकर्ता लंबे समय से इस बात पर काम कर रहे हैं कि मशीनें दृश्य जानकारी को मनुष्यों की तरह कैसे समझें. इंसान जब किसी दृश्य को देखता है तो वह केवल इमेज नहीं देखता वह गहराई, दूरी, रंग, पैटर्न, भावनाएं और संदर्भ सब कुछ जोड़कर एक नतीजे पर पहुंचता है. मशीनें यह पूरी प्रक्रिया काफी हद तक अलग तरीके से करती थीं लेकिन DeepMind के नए मॉडल ने इस अंतर को कम करने की दिशा में बड़ा कदम बढ़ाया है.

नई तकनीक का मकसद AI को मानव जैसी विज़ुअल कॉग्निशन देना है. इसके तहत मॉडल को एक ही चीज़ को कई एंगल, रोशनी, दूरी और मूवमेंट की स्थितियों में समझने की ट्रेनिंग दी जा रही है. इससे AI सिर्फ इमेज देखकर पहचान नहीं करेगा बल्कि उसके पीछे छिपे संदर्भ, पैटर्न और भविष्य की संभावनाओं को भी समझने लगेगा कुछ वैसा ही जैसा हमारा दिमाग करता है.

इससे सबसे बड़ा फायदा यह होगा कि AI गलतियों को काफी हद तक कम कर पाएगा. उदाहरण के लिए अभी कई AI सिस्टम मामूली शैडो, प्रतिबिंब या एंगल बदलने पर भी वस्तुओं को गलत पहचान लेते हैं. लेकिन DeepMind के इस मॉडल में इंसानी विज़न की तरह लचीलापन है जहां परिस्थितियां बदलें तो भी मूल जानकारी का सही अनुमान लगाया जा सके.

अगर यह तकनीक पूरी तरह कामयाब हो गई तो सेल्फ-ड्राइविंग कारें, सुरक्षात्मक सिस्टम, हेल्थकेयर स्कैनिंग, रोबोटिक्स और AR/VR दुनिया बिल्कुल नई ऊंचाइयों पर पहुंच सकती है. एक तरह से कहें तो यह खोज मशीनों को “आंखें” ही नहीं बल्कि समझ भी दे सकती है.

हालांकि ये सफर अभी शुरुआती चरण में है. विशेषज्ञों का मानना है कि इंसानी दिमाग की कॉग्निटिव क्षमता को पूरी तरह कॉपी करना मुश्किल है, लेकिन DeepMind की यह खोज यह साबित करती है कि भविष्य में AI और मानव विज़न के बीच का फर्क तेजी से कम होगा.
Published at : 16 Nov 2025 09:41 AM (IST)
टेक्नोलॉजी फोटो गैलरी
Read More at www.abplive.com