Premesso che strumenti di Intelligenza Artificiale per la generazione di immagini ne esistono molti, con funzionalità specifiche, oggi vorrei fare questa distinzione:
- tool specifici per l'Image AI: sicuramente più dettagliati e complessi, con funzionalità avanzate; ho già dedicato discussioni apposite, vedi ad esempio Midjourney, Dezgo, Bing Image Creator vs NightCafe Creator, Adobe Firefly, Ideogram
- generazione di immagini tramite chatbot generico: qui è la maggiore comodità, se vogliamo qualcosa di "easy", fatto al volo tramite il solito chatbot generico che stiamo usando (in passato sono nati tutti come generazione testuale, più semplice da gestire, poi si sono pian piano evoluti e in molti oggi hanno la funzionalità multimodale, accettano immagini in input da elaborare e generano immagini su richiesta); le funzionalità qui non sono molto avanzate ma per una maggiore comodità e praticità sono comunque validi
Nello specifico, oggi studiamo il secondo caso, in particolare vediamo a confronto:
Per una maggiore accuratezza ho fatto una richiesta in inglese, che è la seguente:
Draw me a pink elephant near a blue Ford Mustang
Di default, Grok AI genera quattro immagini mentre gli altri ne generano una. Per quanto accurato, non ho specificato lo stile (realistico vs fantasy) quindi il chatbot ha avuto anche libera interpretazione. Vediamo quali sono i risultati.

Come ho detto, il software aveva libertà di interpretazione nello stile (realistico, fantasy, ecc). Per il resto, si può valutare la qualità dell'immagine, realismo, inquadratura. Direi che i primi due gestiscono meglio l'inquadratura (solo quella), per il resto la scena è sicuramente molto meno realistica; gli altri due tagliano un po' l'inquadratura, una rappresentazione comunque più realistica. Forse Google Gemini in questo esempio è risultato il miglior compromesso, a livello generale.
Cosa ne pensate, vi piacciono i risultati? Quale preferite fra questi? 🙂