हाल ही में Google ने अपने Gemini 2.5 Flash Image मॉडल को पेश किया है, जिसे इंटरनली nano-banana नाम दिया गया है। यह नया AI मॉडल इमेज जनरेशन और एडिटिंग में डेवलपर्स को पहले से ज्यादा क्रिएटिव कंट्रोल और बेहतर आउटपुट क्वालिटी देगा।
इससे पहले आया Gemini 2.0 Flash अपनी स्पीड और सस्ती प्राइसिंग के लिए पॉपुलर हुआ था, लेकिन उसमें क्वालिटी और एडिटिंग प्रिसिशन को लेकर कुछ कमी बताई गई थी। अब नया वर्जन इन कमियों को दूर करने के लिए लाया गया है।
Gemini 2.5 Flash Image की ख़ासियत
Gemini 2.5 Flash Image में कई नए फीचर्स जोड़े गए हैं जो इसके पिछले वर्जन से ज्यादा पावरफुल हैं। इसमें Multi-Image Fusion की मदद से कई तस्वीरों को एक साथ मिलाकर एकदम रियलिस्टिक इमेज बनाई जा सकती है।
वहीं Character Consistency फीचर यह सुनिश्चित करता है कि कोई भी कैरेक्टर या प्रोडक्ट अलग-अलग बैकग्राउंड और एंगल्स में भी बिल्कुल एक जैसा दिखे। यह स्टोरीटेलिंग और ब्रांडिंग में मददगार साबित होगा।

इसके अलावा, Targeted Transformations यूज़र्स को नेचुरल लैंग्वेज कमांड्स से एडिट करने की सुविधा देता है। जैसे बैकग्राउंड ब्लर करना, ऑब्जेक्ट हटाना, पोज़ बदलना या फिर इमेज को कलराइज़ करना। मॉडल का World Knowledge Integration भी काफी एडवांस है। ये डायग्राम्स पढ़ सकता है, एजुकेशन में मदद कर सकता है और मुश्किल एडिटिंग इंस्ट्रक्शन्स को भी समझ सकता है।
साथ ही, Template Adherence फीचर एक जैसी डिज़ाइन वाली इमेजेस जैसे कर्मचारी आईडी कार्ड, रियल एस्टेट कार्ड्स या प्रोडक्ट मॉकअप्स बनाने के लिए है।
डेवलपर टूल्स और प्राइसिंग
Google ने Gemini 2.5 Flash Image को डेवलपर्स के लिए किफायती और आसान विकल्प बनाने की कोशिश की है। इसकी कीमत $30 प्रति 1 मिलियन टोकन्स तय की गई है, वहीं हर इमेज का खर्च लगभग $0.039 आता है।
इसके साथ ही Google AI Studio को भी अपग्रेड किया गया है। यहाँ पर डेवलपर्स अपने प्रोजेक्ट्स को तुरंत टेस्ट कर सकते हैं, रीमिक्स कर सकते हैं और GitHub पर सेव कर सकते हैं। मॉडल को ज्यादा डेवलपर्स तक पहुँचाने के लिए Google ने OpenRouter.ai और fal.ai जैसी कंपनियों के साथ साझेदारी की है। रिपोर्ट्स के मुताबिक कंपनी इस तकनीक को 3 मिलियन से ज्यादा डेवलपर्स तक उपलब्ध कराने की तैयारी में है।
सुरक्षा और ट्रांसपेरेंसी
सुरक्षा और पारदर्शिता को ध्यान में रखकर Google ने Gemini 2.5 Flash Image में SynthID Watermarking का इस्तेमाल किया गया है। जिससे हर AI-जेनरेटेड या एडिटेड इमेज पर एक इनविज़िबल वॉटरमार्क लगाया जाएगा। यह तकनीक से यूज़र्स यह समझ पाएंगे कि इमेज असली है या AI से बनाई गई है।
इसके अलावा, Google अभी भी मॉडल में सुधार कर रहा है, खासतौर पर लॉन्ग-फॉर्म टेक्स्ट रेंडरिंग, फैक्टुअल डिटेल्स की सटीकता और कैरेक्टर कंसिस्टेंसी को और बेहतर बनाने पर फोकस किया जा रहा है।
Gemini 2.5 Flash Image डेवलपर्स और क्रिएटर्स के लिए एक ऑल-इन-वन टूल बनकर सामने आया है। चाहे इमेज जनरेशन हो, एडिटिंग या फिर ब्रांडिंग के लिए कैरेक्टर कंसिस्टेंसी की बात हो, नया मॉडल हर जगह बेहतर रिज़ल्ट्स देने का दावा करता है। अब देखना दिलचस्प होगा कि आने वाले समय में यह स्टोरीटेलिंग, एजुकेशन, ई-कॉमर्स और डिज़ाइनिंग में क्या बदलाव लेकर आता है।
यह भी पढ़ें : Google Pixel 9 की कीमत गिरी, धमाकेदार ऑफर के साथ खरीदने का सुनहरा मौका