di Davide Pellegrini
Sulla AI e sulla capacità adattativa degli algoritmi si è detto di tutto. Ad esempio, la produzione automatica e automatizzata di testi e immagini – da Dall-e a Midjourney per arrivare a Chat Gpt – si è trasformata nella fobia distopica di venire rimpiazzati da robot senzienti, in allineamento con le profezie di Asimov. Dietro la rielaborazione visual di midjourney si è intravisto il pericolo di una nuova stagione della creatività che può fare a meno dell”intuizione umana. Per farla breve, i copywriter e i graphic designer sono in allerta. Il ragionamento sui singoli strumenti si blocca al terrore preventivo, dimenticando o sottovalutando la centralità del ruolo dell’essere umano.
Eppure abbiamo più volte detto – e ci siamo trovati d’accordo – che la vera questione è di tipo linguistico. Il dialogo con le macchine implica la messa a punto di un’esattezza delle informazioni, una semantica che, vista la capacità di interpretazione del cervello, allo stato attuale è una dote esclusiva degli umani, grazie anche all’apporto creativo delle emozioni.
Prendiamo, come ha suggerito Fabio Lalli nel suo ultimo post, l’A.I. generativa, una delle più rilevanti categorie del machine learning. L’intelligenza crea contenuti in risposta ai suggerimenti dell’utente. Animazione, e video, immagini e testi, musica, creazione di personaggi e avatar virtuali.
Il paradigma che muove l’A.I. generativa è il rapporto tra l’input (informazione) e l’output (rielaborazione in una forma mediale):
- Text to Image (T2I)
- Text to Video (T2V)
- Text to Audio (T2A)
- Text to Text (T2T)
- Text to Motion (T2M)
- Image to Text (I2T)
- Audio to Text (A2T)
- Audio to Audio (A2A)
- Brain to Text (B2T)
- Text to Code (T2C)
- Text to 3D (T23D)
- Text to NFT (T2N)
- …. Text-to-Everything!
Da Gaming e rivoluzione dell’intelligenza artificiale generativa di Fabio Lalli
Appare più che evidente che il rapporto tra l’interprete e la macchina si dovrà basare sulla capacità di reciproca comprensione. I modelli, cosiddetti multimodali, permetteranno al designer/ progettista di stabilire la strategia per combinare suoni e musiche con parole e testi, immagini e animazioni, creando la direzione per il processo di sviluppo del contenuto. In questo senso, al processo di intelligenza artificiale verrebbe lasciato il compito di realizzare il prodotto in dettaglio. Quella parte che, oggi, siamo inclini a considerare come la fase di realizzazione tecnica.
Il fatto di dover immaginare il proprio lavoro come una sorta di upgrade nella direzione creativa è, però, una vera e propria rivoluzione. Chi lavora con la creatività, chi lavora sui testi, sulle immagini, non può fermarsi alla paura irrazionale di uno strumento poco conosciuto, ma deve approfittare dell’occasione per approfondirne gli aspetti complementari alle proprie necessità professionali. Deve saper valorizzare la propria personalità di interpretazione, avendo cura del proprio stile espressivo come fosse il reale valore aggiunto.
Di solito, quando scrivo, uso delle metafore. Sono il modo più semplice e immediato di far arrivare un concetto.
Abbiamo parlato di direzione creativa, in fondo. Pensiamo a un’orchestra. I musicisti, gli esecutori, sono lo strumento che in concreto attiva la performance dal punto di vista tecnico; il direttore, con la sua bacchetta, è quello che comunica, grazie a un complesso sistema di segni e gesti, la direzione da dare all’esecuzione. Quegli scatti di mano, quei ghirigori animati che vediamo – parlo da ammiratore profano – sono indicazioni precise. Poi, però, c’è la personalizzazione della comunicazione, c’è lo stile personale del Direttore rispetto a quello che si vuole dire al pubblico, comunicandolo prima di tutti ai musicisti.
Quando penso a questo parallelo mi viene in mente Leonard Bernstein. Il grande maestro diresse la Vienna Philarmonic nel 1984. Nel delizioso finale della sinfonia n.88 di Haydn, Bernstein mette da parte la bacchetta e usa solo i segni del viso. Ecco, questo credo sia il modo più originale che abbia mai visto per una direzione creativa. E questo è anche il senso di ciò che, con l’A.I. dovremmo e dovremo riuscire a fare nel nostro lavoro. Posare la bacchetta e lavorare con le emozioni più profonde.