Le AI della Disney: emozioni, vizi o virtù?

Paolo Benanti

7 mar 2018Tempo di lettura: 9 min

La Walt Disney ha sviluppato un sistema di intelligenza artificiale che decodifica il volto degli spettatori durante la visione di un film per determinare quanto il pubblico apprezza ogni singolo momento dello spettacolo. Quali scenari si aprono? Cosa comporta tutto questo?

Si è appena conclusa la conferenza Computer Vision e Pattern Recognition di IEEE, un acronimo di Institute of Electrical and Electronic Engineers - in italiano: Istituto degli ingegneri elettrici ed elettronici -, spesso pronunciato I triple E, un'associazione internazionale di scienziati professionisti con l'obiettivo della promozione delle scienze tecnologiche. In occasione di questo evento le novità presentate erano molteplici. Un side event molto interessante è quello tenuto all'interno di questa conferenza da Disney Research e Caltech. Questo consorzio tra il colosso dell'entertainment e la famosa università californiana ha prodotto un software in grado di tracciare le espressioni facciali di persone che guardano il film.

Il gruppo di ricerca ha chiamato il loro nuovo algoritmo "Variabilità fattoriale autocodificante" (Factorized Variational Autoencoders o FVAEs). Secondo gli ingegneri che lo hanno sviluppato, FVAEs è così efficace nel riconoscere espressioni facciali complesse che, dopo aver analizzato il volto di un singolo spettatore per circa dieci minuti, può addirittura prevedere le espressioni future di quel volto per tutto il resto del film. L'algoritmo "lavora" su un set di dati di milioni di punti di riferimento facciali che alimenta una rete neurale. Per costruire questo database i ricercatori hanno utilizzato telecamere a infrarossi per filmare il pubblico di 150 spettacoli di nove film, tra cui i recenti film Disney Star Wars: The Force Awaken , Zootopia, Inside Out, ecc.

Il sistema AI così addestrato è stato poi testato su altri e differenti segmenti di pubblico. Dopo aver tracciato i pattern di reazione facciale degli spettatori per alcuni minuti, FVAEs era quindi in grado di prevedere quando le persone in sala avrebbero sorriso o avrebbero riso legando questa previsione a momenti significativi nei film. Gli algoritmi di Disney e Caltech superano gli altri metodi di analisi predittiva dei concorrenti, anche quelli che lavorano con molti più dati. Le prospettive, a detta degli sviluppatori, sono molto interessanti. Con il progredire della ricerca, le FVAEs potrebbero anche presumibilmente monitorare altre emozioni come la paura e la tristezza.

Disney non è l'unica compagnia cinematografica che vuole capire meglio come reagiscono gli spettatori alla visione di un film. Negli ultimi cinque anni, Dolby Laboratories ha studiato la realizzazione di sistema di osservazione cinematografica a livello neurofisiologico, legando dei biosensori a dei volontari per seguire le loro reazioni mentre guardano i film. La Dolby esegue questi test per dimostrare che la loro tecnologia audio e visiva può suscitare risposte emotive più forti rispetto alla concorrenza.

Da un punto di vista tecnologico sarà interessante vedere come Disney, il secondo conglomerato di media più grande al mondo, utilizzi i dati che raccoglie tracciando i volti del pubblico. Siccome questo sistema di tracciamento facciale mediante AI potrebbe aiutare la Disney a capire le reazioni del pubblico molto meglio dei ricercatori del mercato umano, potremmo vedere a breve, per esempio, dei prodotti cinematografici che sono creati con l'ausilio delle AI per produrre emozioni di un certo tipo in maniera più profonda. Inoltre come ha sottolineato Yison Yue, docente di machine learning alla Caltech, in un comunicato stampa dopo la conferenza: "comprendere il comportamento umano è fondamentale per lo sviluppo di sistemi di intelligenza artificiale che abbiano una maggiore intelligenza comportamentale e sociale" sostenendo che le macchine devono poterci comprendere per interagire con le persone "che non sempre dicono esplicitamente di essere infelici o di avere qualche problema".

Di contro critici, attori e registi già si lamentano del fatto che le richieste degli studi di Hollywood stanno spogliando i direttori del loro controllo creativo. Sembra facile immaginare come sarà il processo di produzione e di editing quando i dirigenti potranno utilizzare l'intelligenza artificiale per garantire che ogni scena evochi la risposta emotiva desiderata.

A questo punto ci si deve chiedere anche cosa voglia dire una prospettiva AI-driven per il mondo dell'entertainment. Da sempre l’uomo sente l’esigenza di rappresentare ciò che vive; attraverso l’arte, la parola, la scrittura esprime la ricerca del significato del proprio essere nel mondo. Questi gesti, queste azioni non trovano spiegazioni sulla base del solo bisogno, inteso come soddisfazione materiale tesa alla sopravvivenza; è invece insita nell’uomo l’esigenza, il desiderio insopprimibile di raccontarsi, di raccontare le proprie esperienze a se stesso e agli altri per prendere coscienza di esse ed interiorizzarle. Quello che si vuole comprendere attraverso il racconto, è il valore dell’esperienza, il suo senso simbolico, il significato che essa acquisterà nella vita dell’individuo.

Noi siamo esseri “narrativi”, bio-grafici: sentiamo la necessità di segnalare al mondo la nostra esistenza; non ci accontentiamo semplicemente di essere, ma diventiamo ciò che siamo nel momento in cui troviamo uno spazio all’interno della Storia, lasciando segni, ovvero narrazioni. Vivere significa quindi tessere una storia (trama) e di conseguenza riuscire a comprendersi come soggetto, individuale e collettivo, di questa storia. Difatti nessuna esperienza può dirsi per l’uomo pienamente vissuta, finché essa non viene espressa attraverso la “parola” scritta, narrata, dipinta o musicata.Come uomini però, non sentiamo solamente il bisogno di raccontarci, ma anche il bisogno di comprendere dal racconto di altri come è fatta la vita. Per quanto oggi possa sembrare superato dai mezzi di comunicazione, che assorbono e bruciano nell’istante la relazione con gli altri, il valore formativo della narrazione è insostituibile.

Walter Benjamin nel suo saggio sul “Narratore” esprimeva già la crisi in cui la moderna dimensione del vivere ha posto l’esperienza del narrare: “Ormai non c’è più nessuno che sappia raccontare qualcosa come si deve.” (Walter Benjamin, Angelus Novus, Torino, Einaudi, 2006). Di fatti l’esperienza viva della narrazione offre all’essere umano ancora inesperto, orientamenti decisivi per il suo futuro. Approfittare di una memoria vivente è importante, non solo per conoscere le cause di ciò che è avvenuto, ma per essere testimoni del racconto di una memoria significativa, simbolica: vale a dire una memoria che riesca a plasmare il senso profondo di un’esistenza; una memoria orientata alla qualità del vivere, caratterizzata dalle ripetute scelte fra il bene e il male. Una memoria che non solo ha imparato come è fatta la vita, ma che si è anche resa conto, in termini insostituibilmente personali, di come la vita dovrebbe essere vissuta. Una memoria che è in grado di guardarsi alle spalle ed osservare la strada percorsa e che, grazie a questa retrospezione analitica, può essere d’esempio.Interrogata in questo modo, la memoria degli uomini può introdurre ad una personale esperienza del vivere.

Quello a cui assistiamo è una sottomissione del senso, il voler-dover narrare dell'uomo per dire un quid dell'humanum e dell'esperienza umana, all'effetto. Proviamo a chiarire questa mutazione con un'immagine. L'uomo ha la necessità di nutrirsi come ogni altro animale e pur tuttavia il modo con cui avviene questo nella nostra specie è assolutamente peculiare. L'uomo crea il suo cibo, con fantasia e sapienza cercando gusti, sapori e forme che trasmettono molto di più che una necessità biologica. In una pietanza c'è si la necessità di nutrirsi ma anche tutto uno specifico dell'uomo che permette di dire un piacere e un senso dell'humanum che non trova uguale. Ancora di più quel piatto preparato in quella maniera così unica e tipica, si pensi alla torta della nonna, è il luogo dove si trovano celebrazioni, emozioni e episodi di vita che rendono le nostre esistenze uniche e, diremmo, memorabili, cioè degne di essere ricordate. Se la torta della nonna, per rimanere nel nostro esempio, diviene un prodotto industriale, cioè non più prodotta dall'ingegno e dall'unicità della nonna, ci si passi il linguaggio metaforico, ma da una macchina non è detto che il sapore cambi ma potrebbe sparire l'unicum simbolico che la caratterizzava. Inoltre potrei cambiare la ricetta perché quello a cui sono interessato non è più il contesto che genera il processo creativo ma l'effetto che avrà nel suo fruitore.

Abbiamo ben esperienza di questo nell'industria alimentare: Michael Moss nel suo libro Grassi, dolci, salati, edito in Italia da Mondadori, mostra tutto questo. Nel libro l’autore spiega come le grandi aziende americane hanno puntato su questi tre ingredienti per rendere sempre più appetibili i cibi e fare raggiungere al consumatore il cosiddetto punto di beatitudine (bliss point). La teoria è molto interessante e concreta: le persone arrivano a desiderare quel prodotto, spinte da una sorta di dipendenza come se fosse una nuova droga. Per questo motivo si è arrivati a dire che la guerra al junk food deve utilizzare le stesse mosse della lotta contro il tabacco. La differenza sostanziale è che il cibo non è una scelta deliberata come le sigarette o l’alcol, ma una necessità e un bisogno primario.

Ora tutto questo potrebbe accadere nel cinema. Non più narrazioni che sono momenti creativi e unici che trasmettono quel quid della narrazione e che risuona in noi in emozioni e pensieri ma strumenti ingegnerizzati, grazie alle AI e ad algoritmi come le FVAEs, che producono delle emozioni con intensità e tipi tali che ci rendono dipendenti e soggetti a tali prodotti. Come oggi i nostri giovani sono soggetti e dipendenti al junk food. Come sottolineato da Michel Lacroix nel Il culto dell'emozione, edito da Vita e Pensiero, dalle profondità della società tecnologica e iperorganizzata riemerge oggi, prepotentemente, l’irrazionale come emozione forte, shock, turbamento. I media ne sono il veicolo più pervasivo, diffondendo – dai film, alle fiction, ai videogiochi – immagini capaci di suscitare emozioni altrettanto violente. Lacroix si chiede quali sono i rischi di questa trasformazione che, se da un lato rivaluta l’Homo sentiens accanto all’Homo sapiens, dall’altro tende a renderci sensibili solo alle catastrofi, ai massacri o, tutt’al più, a qualche vittoria sportiva? Perché rincorriamo solo le emozioni forti? Di fatto le AI potrebbero spingerci, come una volta si suoleva dire per i vizi, verso comportamenti sempre più dipendenti e sempre più deleteri dell'essere umano (gola, invidia, avarizia, ecc...). solo che i vizi tecnologici indotti dalle AI non sono frutti di tentazioni spirituali ma effetti di campagne di marketing e operazioni di mercato.

Vi è anche un'altra questione importante in questa relazione tra algoritmi ed emozioni. L’algoritmo ci permette di spiegare elementi umani come le emozioni: un emozione può essere intesa come un algoritmo biologico-evolutivo. Facciamo un esempio. Supponiamo che uno scimpanzé affamato veda una banana su un albero. Tra lui e il dolce spuntino si frappone un leone che, poco lontano, sonnecchia al limitare di una radura. Se noi ci trovassimo al posto dello scimpanzé, presa carta e penna, inizieremmo a calcolare la distanza tra noi e la banana, la distanza del leone, la velocità dell’animale e la velocità con cui possiamo correre. Fatti i dovuti calcoli potremmo capire se la banana può essere o meno raggiungibile. Evidentemente non vedremo mai il primate sedere a tavolino con un cappello da contabile impegnato a fare calcoli. Potremmo trovarci di fronte a uno scimpanzé pauroso che, visto il leone, preferisce saltare il pasto piuttosto che rischiare; o potrebbe trattarsi di uno scimpanzé coraggioso che, noncurante del predatore in agguato, tenta la corsa verso il frutto. Il destino dello scimpanzé, se non muore di fame e se non muore vittima dei denti di un felino, selezionerà il giusto bilanciamento di paura che serve per sopravvivere e farà sì che questo profilo emotivo venga passato alle future generazioni di scimpanzé.

Ma torniamo all’algoritmo. Di fatto è una sorta di ricetta culinaria: una sequenza di operazioni – prendere la pentola, mettere l’acqua, accendere il fuoco, aspettare che l’acqua bolla, … - che consentono, se seguite, di giungere a un risultato. È questo il motivo per cui l’algoritmo funziona così bene per la tecnologia: grazie ad esso, possiamo ottenere un risultato con una routine di azioni. Se applico la teoria degli algoritmi alle emozioni allora posso spiegare in un modo controllabile, fatto di input-output, questa scatola nera che sembrava determinare i comportamenti degli uomini. Però, rimanendo nell’analogia della ricetta culinaria, se un algoritmo ci può dire cosa c’è prima di un piatto di pasta e come ottenere la nostra pietanza, non è però in grado né di dirci nulla sul sapore unico degli ingredienti che utilizziamo, né su come, perché o con chi vogliamo mangiare quel piatto. Se le narrazioni diventano frutti di algoritmi invece che opere della creatività e dell'ingegno umano che cosa succederà? Quali gli esiti e quali gli effetti, specie sulle generazioni future?

Qui è racchiusa tutta la potenza e la fragilità di ridurre le emozioni ad algoritmi. Le emozioni non sono solo degli oggetti da capire nel loro scopo. Sono ingredienti che rendono la nostra vita non solo una cosa con uno scopo, ma piena di senso. Quella sera speciale, in cui a cena abbiamo passato dei momenti che ricordiamo come indimenticabili, è dovuta a quel sapore unico che le emozioni hanno contribuito a dare alla nostra vita. E le emozioni, queste scatole nere impredicibili, non sono il risultato di un algoritmo biologico mal progettato, bensì un unico che cambia il nostro tempo da una serie di momenti volti a ottenere uno scopo – funzionare – a una vita piena di senso – l’esserci.Solo strappando le emozioni a una logica funzionale algoritmica possiamo vivere la nostra identità umana, ed essere cercatori di senso. Allora se è possibile pensare, con alcuni sistemi etici, alle Ai con le categorie dei vizi, è possibile pensare anche ad un etica delle virtù. Quali virtù, algoritmiche chiaramente, deve possedere un AI per collaborare alla realizzazione dell'uomo e alla sua tutela?

#giovani #neuroscienze #Tecnologia #AI #BigData

Le AI della Disney: emozioni, vizi o virtù?

Post recenti