Stefano200 diciamo che in generale l'Intelligenza Artificiale Generativa (testuale o anche multimodale quindi immagini, ecc) funziona così:
- prende un certo prompt in input
- cerca corrispondenze fra questo prompt e un proprio database (fisso oppure aggiornato real time con i dati del web, a seconda dei casi)
- il software NON ragiona, non comprende realmente la richiesta ma fornisce una risposta su base probabilistica come corrispondenza con il proprio database: letteralmente l'algoritmo mette in successione le parole, per formare un risultato "globalmente valido" (questo specialmente nel caso testuale, anche per gli altri casi multimodali comunque il concetto è simile); vedi più in dettaglio: Non riusciremo MAI a produrre una vera Intelligenza artificiale?
Quindi anche per quanto riguarda i tool che hai elencato (ti riferisci all'ImageAI in questo caso) il software interpreta il testo e lo confronta con un proprio database (di testo, di immagini, a seconda dei casi).
Come migliorare il risultato generato dall'IA (testo, immagini o qualunque modalità): diciamo che, pur restando nei limiti attuali della tecnologia (col tempo vedremo dei miglioramenti, ovviamente), è importante fornire bene il contesto, più dettagli possibile, per "indirizzare" al meglio il software e quindi il risultato da noi desiderato.