Buttate via pure i colori e i fogli di carta. Ma anche il talento e le capacità acquisite in anni di pratica e studio: adesso ChatGpt di OpenAI si è trasformato in un potente generatori di immagini, che si basa direttamente su GPT-4o, grazie al quale gli utenti hanno la possibilità di creare delle immagini partendo da delle conversazioni testuali.
La resa visiva è più precisa rispetto a quella di DALL-E3 ed è accessibile agli utenti che abbiano sottoscritto un abbonamento a ChatGPT Plus, Pro e Team. Lo strumento verrà rilasciato anche agli utenti gratuiti, ma in un secondo momento, dato l’elevato numero di domande che stanno arrivando.
Ma entriamo un po’ più nel dettaglio e cerchiamo di capire cosa prevedono le nuove funzioni che OpenAI ha implementato in ChatGPT.

ChatGPT permette di creare delle immagini
Arriva un’importante novità per ChatGPT. OpenAI, infatti, ha annunciato che il chatbot che si basa sull’intelligenza artificiale sarà in grado di generare delle immagini. Per farlo si appoggia sul modello GPT-4o, il quale, almeno fino ad oggi, si limitava unicamente a generare e a modificare dei contenuti testuali.
Indubbiamente la novità introdotta in questi giorni permetterà agli utenti di creare delle immagini molto più accurate e soprattutto dettagliate rispetto a DALL–E 3, il suo predecessore. Sarà necessario, però, dedicare all’operazione un po’ più di tempo.
La funzionalità relativa alla creazione delle immagine attraverso GPT-4o è disponibile attraverso Sora. Tra l’altro il nuovo sistema è in grado di modificare delle immagini già esistenti, anche quando al loro interno sono presenti delle persone. Grazie all’intelligenza artificiale è possibile intervenire su una serie di elementi in primo piano e sullo sfondo: tutte le operazioni possono essere effettuate in modo molto accurato e preciso.
Cosa è in grado di fare ChatGPT
OpenAI ha annunciato una novità che avrà un impatto dirompente in tutto il mondo dell’intelligenza artificiale generativa. Indubbiamente fino ad oggi ChatGPt era un chatbot avanzato, ma la sua capacità di disegnare era stata delegata a degli strumenti che operavano separatamente, come, per l’appunto, DALL-E. Adesso sono state implementate le sue capacità di elaborazione visiva.
In altre parole attraverso GPT-4o la possibilità di creare delle immagini è stata sostanzialmente integrata e il processo è diventato leggermente più sofisticato.
Ma quali sono le caratteristiche del nuovo modello? OpenAI spiega che è stato progettato per ottenere una migliore fedeltà visiva ed una maggiore precisione nei dettagli. La resa dei testi delle immagini è stata migliorata: in molti ricorderanno che nei modelli precedenti spesso e volentieri la scrittura risulta essere pressoché illeggibile o distorta. Per i professionisti delle immagini si aprono nuove porte, soprattutto grazie al fotoritocco automatizzato. Ma non solo: sarà possibile creare dei contenuti visivi personalizzati appoggiandosi su delle immagini esistenti.

I nuovi aspetti tecnologici
Non dobbiamo nemmeno dimenticare gli aspetti tecnologici che permettono a GPt-4o di lavorare e di generare le immagini. Gli sviluppatori hanno introdotto un approccio autoregressivo che permette al modello di generare delle immagini con una logica sequenziale: in altre parole lavora progressivamente sulle diverse sezioni che costituiscono la singola figura. Non genera l’intero contenuto con un semplice passaggio.
Siamo davanti, indubbiamente, ad un procedimento molto più lento rispetto ad altri modelli che lavorano in parallelo. Questo approccio, però, permette di migliorare la qualità e la precisione del risultato finale.
Se è vero che questa innovazione mette a disposizione una serie di nuove possibilità agli utenti – rendendo più semplice e creativa la creazione delle immagini – dall’altro introduce una serie di dubbi e perplessità per quanto riguarda i diritti d’autore. L’accessibilità a questi strumenti da parte di tutti gli utenti renderà difficile distinguere i contenuti prodotti con l’intelligenza artificiale da quelli creati dall’uomo.