You are currently viewing Nano Banana, le nouveau générateur d’images de Google
À moins que vous n’ayez vécu ces derniers jours sur une île déserte sans connexion internet, vous avez sûrement vu fleurir dans votre fil LinkedIn quantité de comics tentant de vous amener à ouvrir des publications sur des sujets plus sérieux les uns que les autres… Nous avons fait le pari (trèèèèès risqué!) de vous en parler SANS aucune case de comics. Nous allons donc essayer d’être très brefs, parce que de nos jours, du texte sans illustration… 😉 Il faut bien le reconnaître, une fois encore, Google a frappé très fort! (Très!) loin des problèmes de positionnement relatif d’objets, d’affichage de textes et autres des premières solutions d’IA génératives d’il y a… à peine 2 ou 3 ans, il est maintenant possible de créer une bande dessinée complète rien qu’en fournissant un script. Ou d’intégrer différentes images en une seule, d’un style totalement différent. Ou… honnêtement, y a-t-il encore QUELQUE CHOSE qu’on ne puisse pas faire? La bonne nouvelle, c’est que vous pouvez le tester gratuitement. Il suffit d’aller dans Gemini et de sélectionner l’option «Créer des images». Et de décrire ce que vous voulez. Au-delà des commentaires dithyrambiques (et, il faut bien le reconnaître, justifiés), c’est aussi l’occasion de faire connaissance avec SynthID, la solution d’insertion de filigrane digital développée par DeepMind et introduite en 2023 par Google (voir https://youtu.be/9btDaOcfIMY). Quel que soit le type de fichier, un filigrane est introduit de façon à être indétectable pour l’humain mais identifiable par le détecteur SynthID (voir https://blog.google/technology/ai/google-synthid-ai-content-detector/):
  • Images: Le filigrane est inséré dans les images sous la forme d’un certain nombre de pixels dont la couleur est modifiée, de façon suffisamment faible pour que cette modification soit imperceptible pour l’œil humain, mais suffisamment importante pour que le détecteur numérique puisse l’identifier, même après les opérations classiques d’édition d’image (compression, découpage, rotation…).
  • Vidéos: Chaque image reçoit le même traitement que décrit ci-dessus pour les images.
  • Sons: Le fichier est converti en un spectrogramme, i.e. une représentation visuelle de l’évolution dans le temps du contenu fréquentiel du son. Le filigrane est alors intégré dans ce spectrogramme, puis le contenu sonore est reconstruit à partir de cette version modifiée.
  • Textes: Pour les fichiers textes, le filigrane est introduit durant la génération de chaque mot (ou token), en modifiant légèrement, de façon contrôlée, les distributions de probabilité de sélection de chaque mot possible pour cette position.
Selon les types de fichier, ce système d’insertion de filigrane digital est plus ou moins résistant aux manipulations courantes (éditions, conversions et autres).

Tout ceci suscite chez nous deux réflexions:

  1. Avec SynthID, Google se profile en champion de la protection des œuvres originales en fournissant à tout un chacun un outil permettant la détection des œuvres artistiques générées par (leur) IA… entraînée sur des données aux origines incertaines. Très fort!
  2. Devoir générer quelques cases de comics pour avoir une chance d’être lu… ou au moins survolé, en dit long sur l’état de l’attention dont nos cerveaux sont encore capables. Vous êtes arrivés jusqu’ici sans la moindre illustration? Savez-vous que vous êtes un être d’exception? 😉