सैन फ्रांसिस्को, 9 दिसंबर (आईएएनएस)। गूगल एआई तकनीक को लागू करके आपके फोटो के जरिए आपकी गुजरी हुई लाइफ की कहानी बताएगा।
सीएनबीसी की रिपोर्ट के अनुसार, ‘प्रोजेक्ट एलमैन’ शीर्षक से सर्च रिजल्ट का उपयोग करने, यूजर्स की तस्वीरों में पैटर्न खोजने, एक चैटबॉट बनाने और ‘पहले असंभव सवालों का जवाब देने’ के लिए लेटेस्ट जेमिनी मॉडल जैसे बड़े भाषा मॉडल (एलएलएम) का उपयोग करने का विचार है।’
रिपोर्ट के अनुसार, “प्रोजेक्ट एलमैन उन कई तरीकों में से एक है, जिनसे गूगल एआई तकनीक के साथ अपने प्रोडक्ट्स को बनाने या सुधारने का प्रस्ताव दे रहा है।”
गूगल फ़ोटो के 1 बिलियन से अधिक यूजर्स और 4 ट्रिलियन फ़ोटो और वीडियो हैं। “प्रोजेक्ट एलमैन” लेबल और मेटाडेटा वाले पिक्सेल की तुलना में यूजर्स की तस्वीरों का अधिक गहराई से वर्णन करने के लिए बीते पलों की जीवनियों और बाद की तस्वीरों का उपयोग करके कॉन्टेक्स्ट चित्रित कर सकता है।
प्रोजेक्ट के अनुसार, “हम आपके जीवन पर आंखों से देखा गया दृश्य डाले बिना कठिन सवालों का जवाब नहीं दे सकते या अच्छी कहानियां नहीं बता सकते।”
परियोजना प्रस्तुति के अनुसार, ”हम एक सार्थक पलों की पहचान करने के लिए आपकी तस्वीरों में उनके टैग और स्थानों को देखते हैं। जब हम पीछे हटते हैं और आपके जीवन को उसकी संपूर्णता में समझते हैं, तो आपकी व्यापक कहानी स्पष्ट हो जाती है।”
“‘एलमैन चैट’ के साथ, चैटजीपीटी ऑपनिंग की कल्पना करें लेकिन यह पहले से ही आपके जीवन के बारे में सब कुछ जानता है। आप इससे क्या पूछेंगे?”
गूगल के एक प्रवक्ता ने कहा कि गूगल फ़ोटो ने हमेशा लोगों को उनकी फ़ोटो और वीडियो खोजने में मदद करने के लिए एआई का उपयोग किया है। और हम और भी अधिक उपयोगी अनुभवों को अनलॉक करने के लिए एलएलएम की क्षमता के बारे में उत्साहित हैं।
गूगल ने इस सप्ताह कई प्रमुख बेंचमार्क में अत्याधुनिक प्रदर्शन के साथ अपना अब तक का सबसे सक्षम और सामान्य मॉडल जेमिनी पेश किया।
आने वाले महीनों में जेमिनी गूगल के अधिक उत्पादों और सेवाओं जैसे सर्च, विज्ञापन, क्रोम और डुएट एआई में उपलब्ध होगा। गूगल के अनुसार, जेमिनी 1.0 की साफ मल्टीमॉडल तर्क क्षमताएं जटिल लिखित और दृश्य जानकारी को समझने में मदद कर सकती हैं।
–आईएएनएस
एफजेड/एबीएम