I chip di ispirazione cerebrale stanno spingendo l’AI oltre il data center, consentendo un processo decisionale in tempo reale nei dispositivi. Ma mantenere la promessa richiede di ripensare l’infrastruttura dal silicio verso l’alto.
Immagina un drone che si intreccia in un magazzino con riflessi simili a insetti o un arto protesico che si adatta al suo utente in tempo reale. Questi non sono concetti futuri. Si tratta di punti di prova precoci per il computing neuromorfico, una nuova classe di hardware di intelligenza artificiale (AI) progettato per simulare il cervello umano.
I chip neuromorfici elaborano i dati utilizzando reti neurali addizionate (SNN) che si attivano solo per un input significativo, simile ai neuroni biologici. A differenza delle unità di elaborazione centrali (CPU) e delle unità di elaborazione grafica (GPU) che separano la memoria e le unità di elaborazione, il computing neuromorfo integra questi componenti per un’efficiente elaborazione parallela dei dati (vedere la Figura 1).
Il risultato è un consumo energetico notevolmente inferiore, tempi di risposta più rapidi e design compatti adatti ad ambienti vincolati all’edge. Ciò è importante più che mai, con una spesa globale per l’infrastruttura Edge che si prevede raggiungerà i 261 miliardi di dollari nel 2025, raggiungendo i 380 miliardi di dollari nel 2028.
Figura 1. Il chip neuromorfico singolo BrainScaleS-2 è uno dei sistemi utilizzati per le applicazioni di computing neuromorfico. Fonte: Aprire Neuromorphic.
Come funziona il computing neuromorfico
I chip neuromorfici integrano memoria e computing nella posizione esatta. Questo design evita il collo di bottiglia di von Neumann, che si verifica quando i dati si spostano costantemente tra unità di elaborazione e di memoria separate. Invece di sfornare continuamente i dati, questi chip funzionano in modo asincrono e attivano il calcolo solo quando l'ingresso del sensore cambia. Questo modello basato sugli eventi può ridurre al minimo l’elaborazione non necessaria e il consumo energetico fino a 100 volte rispetto ai sistemi convenzionali.
Loihi di Intel, ad esempio, simula oltre un milione di neuroni utilizzando solo 70 milliwatt. Le GPU tradizionali che eseguono carichi di lavoro simili possono consumare diversi watt o anche kilowatt, il che ne limita l’uso in ambienti remoti o mobili.
Vantaggi del computing neuromorfico
Il computing neuromorfo non riguarda i guadagni marginali. Rappresenta un cambiamento strutturale nel modo in cui l’AI funziona sull’edge.
Consumo energetico ultrabasso
Simulando il modo in cui i neuroni sparano solo quando necessario, i chip neuromorfici riducono il consumo energetico inattivo fino a 100 volte.
Bassa latenza
Le reti Spiking supportano tempi di risposta inferiori a 100 millisecondi, essenziali per la robotica, la diagnostica in tempo reale e i sistemi di controllo a circuito chiuso.
Elaborazione in parallelo
L’esecuzione asincrona consente a questi sistemi di elaborare più ingressi di sensori contemporaneamente senza creare un collo di bottiglia.
Tolleranza al rumore
I chip neuromorfi sono adatti ad ambienti caotici e possono elaborare dati incompleti o non strutturati in modo più efficace rispetto ai modelli di AI convenzionali.
Formato compatto
La riduzione delle esigenze di alimentazione e termiche consente l’implementazione in dispositivi integrati, eliminando la necessità di sistemi di raffreddamento di grandi dimensioni o l’offload sul cloud.
Insieme, queste caratteristiche suggeriscono che i sistemi neuromorfici potrebbero supportare un’AI efficiente e autonoma al di fuori del data center.
Casi d’uso del computing neuromorfo
Healthcare
I chip neuromorfici vengono esplorati per l’analisi ECG a bassa potenza e le protesi adattative che rispondono al movimento in tempo reale (vedere la Figura 3). Piattaforme come SpiNNaker e BrainScaleS hanno dimostrato la fattibilità dell’elaborazione simile a quella del cervello in contesti medici. I chip più recenti come Loihi di Intel si sono dimostrati promettenti nelle interfacce cervello-macchina, decodificando i segnali neurali per controllare gli arti robotici, aprendo la strada al ripristino della mobilità (vedere la Figura 2).
La ricerca sulle simulazioni molecolari e sul folding proteico tramite SNN potrebbe contribuire a ridurre i costi energetici, migliorando potenzialmente l’efficienza e l’accessibilità dello sviluppo di farmaci e dei trattamenti medici.
Figura 2. Immagine A (sinistra): Prototipo di braccio robotico montato su sedia a rotelle con controllo neuromorfo, dimostrato dall’autore di ricerca, Yuval Zaidel. Immagine B (destra): Architettura di controllo: Dati dell'accelerometro di elaborazione della rete neurale per l'adattamento in tempo reale della posizione. Fonte: Frontiere | Controllo adattivo di un braccio robotico montato su sedia a rotelle con letture di velocità neuromorficamente integrate e apprendimento online.
Modellazione climatica e fisica
Al CERN, sono stati utilizzati sensori basati su eventi che si ispirano ai principi neuromorfici per tracciare le particelle in ambienti rumorosi e ad alta produttività. Sandia National Laboratories utilizza chip simili per ridurre l’energia necessaria per le simulazioni climatiche, un campo tradizionalmente dominato dai supercomputer.
Robotica e IoT
Il Grasping Neural Process del Massachusetts Institute of Technology (MIT) ha dimostrato un braccio robotico alimentato da SNN addestrato su 1.000 geometrie e 5.000 oggetti, consentendo pickup affidabili in ambienti dinamici come i magazzini.
I ricercatori hanno utilizzato Dynamic Vision Sensors (DVS), fotocamere ispirate alla retina, per acquisire le variazioni della luce. Questi sensori consentono ai droni di navigare in spazi affollati con agilità simile a un insetto e latenza ultra bassa
Aziende come Prophesee hanno commercializzato sistemi di visione basati su eventi per una sorveglianza intelligente, riducendo la larghezza di banda e il fabbisogno energetico. I loro sensori possono raggiungere oltre 10.000 fotogrammi al secondo consumando meno energia.
Figura 3. Lo sviluppo di una neuroprotesi somatosensoriale si basa su tre pilastri principali: (1) Uso di modelli informatici per simulare il modo in cui il sistema nervoso risponde al contatto (segmento blu); (2) Test sugli animali per convalidare le strategie di neurostimolazione (segmento arancione); DRG: ganglio della radice dorsale. (3) Conduzione di sperimentazioni cliniche con esseri umani per valutare l’efficacia della tecnologia in scenari di vita reale (segmento verde). Fonte: Comunicazioni naturali.
Finanza e sicurezza informatica
IBM ha esplorato l’uso delle reti SNN per il rilevamento delle frodi. Hanno addestrato modelli che identificano i modelli nelle transazioni finanziarie con alta precisione. Questi sistemi possono adattarsi alle minacce emergenti con dati minimi.
Di cosa ha bisogno l’infrastruttura
Il supporto dei sistemi neuromorfici richiede più di aggiornamenti incrementali sull’edge. Richiede un’infrastruttura appositamente costruita (vedere la Figura 4) che si adatti alla domanda, si adatti ai carichi di lavoro in evoluzione e si adatti ad ambienti con spazio o limitazioni di potenza.
Ad esempio, il raffreddamento a liquido diretto sul chip può gestire il calore sporadico in modo più efficace rispetto alla sola aria. L’approccio Vertiv™ Coolchip, che combina raffreddamento a liquido e ad aria, aiuta a mantenere prestazioni stabili riducendo al contempo il consumo energetico complessivo. Allo stesso modo, i sistemi di alimentazione devono rispondere rapidamente a forti variazioni di corrente senza sovracostruzione, il che aumenta sia i costi che l’ingombro fisico. Sono necessarie anche interconnessioni ad alta velocità per supportare un’elaborazione rapida e localizzata dei dati.
Dal punto di vista operativo, i carichi di lavoro neuromorfici richiedono una mentalità diversa. Le SNN e le architetture asincrone sono fondamentalmente diverse dai modelli utilizzati nella maggior parte delle pipeline di formazione IA. I team devono capire come lavorare con i sistemi basati sugli eventi e come gestirli. I tecnici devono progettare in base a carichi imprevedibili e a comportamenti dinamici.
Figura 4. Ad esempio, le soluzioni modulari, come Vertiv™ Infrastructure Solutions con Vertiv™ CoolChip, che combinano il raffreddamento a liquido diretto su chip con strategie lato aria adattabili, sono già progettate per gestire carichi di lavoro ad alte prestazioni sull’edge come il computing neuromorfico.
Prepararsi per il futuro
Il computing neuromorfo non è un concetto. Sta già rimodellando il funzionamento dell’edge intelligence. Dalla robotica e l’assistenza sanitaria alla modellazione climatica e alla sicurezza informatica, le applicazioni sono qui. Ciò che è in ritardo è l’infrastruttura.
Se prevedi di implementare l’AI sull’edge, avrai bisogno di sistemi progettati per supportare questi nuovi carichi di lavoro. Ciò significa valutare la densità dei rack, le strategie termiche e la reattività dell’alimentazione. Significa anche investire in persone che comprendono questo nuovo paradigma di AI: neuroscienze, ingegneria e progettazione di sistemi.
L’evoluzione dell’AI Edge dipende dal modo in cui l’infrastruttura attuale risponde alle richieste emergenti.
Visita il Vertiv™ AI Hub per esplorare le soluzioni infrastrutturali progettate per le prestazioni neuromorfiche, sull’edge, in tempo reale e con efficienza scalabile.