C'era un tempo in cui le società di software lasciavano inventare nuovo hardware agli altri. Per esempio l'impero di Google, fatto di ricerca e di annunci pubblicitari, è stato costruito su un'infrastruttura assemblata con componenti di altri. Ma la crescente competizione tra le aziende tecnologiche nel campo dell'AI ha convinto alcuni produttori di software a cambiare marcia. Oggi si registrano nuove direzioni.
Alcuni server di Google ora includono chip personalizzati per l'apprendimento automatico chiamati TPU. Questi chip sono stati progettati dalla società che li ha realizzati internamente per riuscire a ottenere maggiore potenza ed efficienza. Google ha anche iniziato a noleggiarli ai suoi clienti che utilizzano i suoi servizi di cloud computing. Facebook ha recentemente dichiarato di essere interessata a progettare chip simili per i propri data center. Entrambi sono in competizione con un gruppo di startup che creano chip dedicati per server dedicati alle AI. Queste startup hanno raccolto collettivamente centinaia di milioni di dollari l'anno scorso sul mercato degli investitori e molte sono cinesi.
Ma c'è un grande attore nello sviluppo delle AI che si sta chiedendo se quei soldi siano ben spesi: la Microsoft. Alla sua conferenza annuale Build, Microsoft suggerisce alle aziende con grandi ambizioni nel campo delle AI di evitare chip proprietari come quelli di Google. Secondo Microsoft il machine learning si sta evolvendo così velocemente che non ha senso scrivere le idee che abbiamo oggi sulle AI in modo permanente su chip di silicio: questi potrebbero presto dimostrarsi limitanti o obsoleti.
L'idea di Microsoft è di eseguire progetti AI su chip chiamati FPGA.
In elettronica digitale, un dispositivo Field Programmable Gate Array, solitamente abbreviato in FPGA, è un circuito integrato le cui funzionalità sono programmabili via linguaggi di descrizione dell'hardware (VHDL, Verilog, ecc.). Tali dispositivi consentono la realizzazione di funzioni logiche anche molto complesse, e sono caratterizzati da un'elevata scalabilità.
Nei chip FPGA il design può essere riprogrammato per supportare al volo nuove forme di software. Ciò consente a Microsoft di evitare di dover cimentarsi a progettare il silicio per i suoi server: si limita ad acquistare i suoi FPGA da Intel il colosso dei chip. Alcune aziende stanno già sposando la visione di Microsoft. Lunedì scorso, Microsoft ha annunciato che offre un nuovo servizio cloud sviluppato specificatamente per il riconoscimento di immagini. Il sistema è completamente basati sulla sua tecnologia FPGA, chiamata Project Brainwave. Una delle prime applicazioni è stata realizzata dalla divisione sanitaria di Nestle che la utilizzerà per analizzare la gravità dell'acne tramite le immagini inviate dai pazienti. Il software esaminerà le immagini per raccomandare il trattamento più appropriato e controllerà quanto è efficace.
Tra i clienti di Microsoft che hanno sottoscritto il programma c'è Jabil il noto produttore di elettronica che ha più di 90 fabbriche in tutto il mondo. La società implementerà un software appositamente sviluppato per controllare le immagini delle schede elettroniche contrassegnate come difettose nei test di fabbrica. Ryan Litvak, un manager del progetto, afferma che la tecnologia Project Brainwave di Microsoft è interessante perché consente di elaborare rapidamente le immagini, ma a un costo notevolmente inferiore rispetto ai chip grafici oggi comunemente utilizzati nei progetti di apprendimento automatico.
Secondo Microsoft i clienti che sfruttano Project Brainwave possono elaborare un milione di immagini per soli 21 centesimi utilizzando un modello standard di riconoscimento dell'immagine; inoltre una singola immagine può essere elaborata in soli 1,8 millisecondi. La società afferma che questo risultato oggi è migliore di qualsiasi altro servizio cloud rivale. Tuttavia la vera competitività della tecnologia Microsoft non sarà evidente fino a quando altre compagnie non avranno avuto la possibilità di testarlo confrontandole con altre opzioni. Queste includono tanto i TPU di Google quanto i chip grafici di Nvidia, i principali fornitori di progetti di apprendimento automatico.
Al momento non è chiaro quanto sarà applicabile il Brainwave di Microsoft. Gli FPGA non sono diffusamente usati nel cloud computing e quindi molte aziende non hanno le competenze necessarie per programmarli. Microsoft afferma che il suo servizio cloud può adattare il software di un cliente agli FPGA, ma inizialmente ne eseguirà solo un tipo quello della computer vision. Per ora, le aziende che desiderano applicare l'apprendimento automatico al testo o all'audio dovranno utilizzare altre piattaforme consolidate.
Nvidia non sta ferma mentre Microsoft e Google si inventano nuove idee nell'hardware per il machine learning. Recenti test della startup tedesca RiseML hanno rilevato che le ultime TPU di Google avevano prestazioni di picco simili agli ultimi chip di Nvidia durante l'addestramento del software di riconoscimento delle immagini, sebbene avessero dei vantaggi in termini di costi.
Un portavoce di Google ha affermato che i test RiseML sono stati ben disegnati, ma ha anche indicato una serie di test denominati DAWNBench dalla Stanford University, dove il software in esecuzione su TPU era più veloce e più economico dei chip Nvidia su un compito di riconoscimento di immagini.
Con molte aziende che si affrettano a implementare l'apprendimento automatico in tutte le aree della vita, è probabile che la concorrenza per inventare modi migliori per alimentare gli algoritmi di intelligenza artificiale sia destinata a intensificarsi. Microsoft potrebbe non essere nemmeno l'unica a fare annunci rivoluzionari nel concorso per migliorare l'hardware per le AI. Oggi, martedì, inizia la conferenza annuale degli sviluppatori di Google, un'occasione in cui, negli ultimi due anni, la compagnia ha sempre annunciato nuovi chip TPU.
Al di là della corsa tra i tre giganti, Google, Microsoft e Facebook, ci sembra interessante questa necessità di fusione hardware e software. Lasciamoci portare da qualche suggestiva metafora. Di fatto questa è una versione metaforica e informatica dell'eterno dilemma della relazione tra mente e cervello. La natura razionale che possediamo è una questione di software (la mente) o di hardware (il cervello). Le neuroscienze ci dicono che siamo embodied, cioè incarnati. Non esiste un software dell'uomo senza hardware e non esiste un hardware, il corpo, che genera il software. Se l'uomo è spirito incarnato e non due entità congiunte, qualsiasi sistema intelligente dovrà "condividere" analogicamente questa condizione.