Google lance ce jeudi 20 novembre Nano Banana Pro, une déclinaison de Gemini 3 Pro dédiée à la génération d’images en 4K, capable de rivaliser avec les outils professionnels comme Photoshop.
Deux jours seulement après le séisme Gemini 3 Pro, Google maintient une cadence infernale. La firme de Mountain View dévoile une mise à jour majeure de son moteur visuel, baptisée officiellement « Gemini 3 Pro Image » mais que la communauté tech a déjà surnommée « Nano Banana Pro ».
Ce modèle ne se contente plus de générer des illustrations amusantes : il vise directement les graphistes et les directeurs artistiques. Selon l’annonce officielle, cette itération repousse les limites de la définition et de la compréhension contextuelle.
Une puissance de calcul au service de la 4K
L’époque des images carrées et floues est révolue. Nano Banana Pro débloque nativement la génération en ultra-haute définition (4K), une première pour un modèle grand public intégré à l’écosystème Google.
Le modèle excelle désormais dans la gestion des formats. Il permet de modifier le rapport d’aspect après coup ou de recadrer une scène sans perte de qualité, répondant ainsi à une demande critique des créateurs de contenu.
Au-delà des pixels, c’est la gestion du texte qui impressionne. D’après les tests présentés, l’IA peut générer des calligraphies complexes et des infographies fidèles à la réalité, là où les versions précédentes échouaient à écrire correctement plus de deux mots.
L’outil de composition ultime
Google positionne Nano Banana Pro comme un concurrent direct des logiciels de retouche traditionnels. Le modèle introduit une capacité de composition complexe, permettant de fusionner jusqu’à 14 images sources distinctes pour créer une scène cohérente.
La gestion de l’éclairage fait également un bond en avant. L’IA comprend les ombres portées et les sources lumineuses, permettant d’intégrer un objet dans une photo existante avec un réalisme troublant, simulant l’usage de calques Photoshop.
Pour les portraits, la stabilité est enfin au rendez-vous. Le système peut désormais conserver l’apparence de cinq visages différents au sein d’une même image, une prouesse technique qui ouvre la voie à la création de storyboards complets avec des personnages récurrents.
Traduction visuelle et intégration
L’une des fonctionnalités les plus spectaculaires reste la traduction in-situ. Nano Banana Pro peut scanner une image (comme une canette ou une affiche), traduire le texte dans une autre langue, et réécrire le visuel en conservant la police et le style d’origine.
Cette technologie est immédiatement déployée dans tout l’univers Google. Elle est accessible via NotebookLM, la plateforme développeurs Antigravity, ou encore Google Ads pour automatiser la déclinaison de publicités internationales.
Une tarification élitiste
Cette montée en gamme s’accompagne d’une inflation notable. Si les utilisateurs gratuits basculeront automatiquement sur l’ancien modèle (Nano Banana / Gemini 2.5 Flash) une fois leur quota épuisé, les professionnels devront payer le prix fort.
Selon la grille tarifaire dévoilée, une génération en 4K via l’API coûte environ six fois plus cher qu’une image standard. Google justifie ce surcoût par la puissance de calcul massive nécessaire au raisonnement multimodal de Gemini 3 Pro.
Transparence et sécurité avec SynthID
Face aux risques de désinformation, Google joue la carte de la responsabilité. L’application intègre désormais un vérificateur basé sur SynthID, capable de détecter les « tatouages numériques » invisibles laissés par le modèle.
Il suffit de demander au chatbot « Est-ce que cette image est générée par IA ? » pour obtenir une analyse instantanée des pixels. De plus, un filigrane visuel sera imposé à la majorité des utilisateurs, seuls les clients « Ultra » et Entreprise pouvant exporter des fichiers vierges de tout marquage.
