Les puces d’inspiration cérébrale poussent l’IA au-delà du datacenter, permettant une prise de décision en temps réel dans les appareils. Mais tenir leurs promesses nécessite de repenser l’infrastructure à partir du silicium.
Imaginez un drone traversant un entrepôt avec des réflexes semblables à des insectes, ou un membre prothétique s’adaptant à son utilisateur en temps réel. Ce ne sont pas des concepts très futurs. Il s’agit de points de preuve précoces pour l’informatique neuromorphique, une nouvelle classe de matériel d’intelligence artificielle (IA) conçue pour imiter le cerveau humain.
Les puces neuromorphiques traitent les données à l’aide de réseaux de neurones spike (SNN) qui s’activent uniquement pour une entrée significative, similaire aux neurones biologiques. Contrairement aux unités de traitement centrales (CPU) et aux unités de traitement graphique (GPU) qui séparent les unités de mémoire et de traitement, l’informatique neuromorphique intègre ces composants pour un traitement parallèle efficace des données (voir Figure 1).
Il en résulte une consommation électrique considérablement plus faible, des temps de réponse plus rapides et des conceptions compactes adaptées aux environnements restreints en périphérie. Cela est plus important que jamais, avec des dépenses mondiales en infrastructure Edge qui devraient atteindre 261 milliards USD en 2025 à 380 milliards USD en 2028.
Figure 1. La puce neuromorphique unique BrainScaleS-2 est l’un des systèmes utilisés pour les applications informatiques neuromorphiques. Source : Ouverture neuromorphique.
Fonctionnement de l’informatique neuromorphique
Les puces neuromorphiques intègrent la mémoire et l’informatique à l’emplacement exact. Cette conception évite le goulot d’étranglement de von Neumann, qui se produit lorsque les données se déplacent constamment entre des unités de traitement et de mémoire distinctes. Au lieu de parcourir continuellement les données, ces puces fonctionnent de manière asynchrone et déclenchent le calcul uniquement lorsque l’entrée du capteur change. Ce modèle axé sur les événements peut minimiser le traitement inutile et réduire la consommation électrique jusqu’à 100 fois par rapport aux systèmes conventionnels.
Loihi d’Intel, par exemple, simule plus d’un million de neurones en utilisant seulement 70 milliwatts. Les GPU traditionnels exécutant des charges de travail similaires peuvent consommer plusieurs watts, voire kilowatts, ce qui limite leur utilisation dans des environnements distants ou mobiles.
Avantages de l’informatique neuromorphique
L’informatique neuromorphique ne concerne pas les gains marginaux. Il s’agit d’un changement structurel dans la façon dont l’IA fonctionne à la périphérie.
Consommation d’énergie ultra-faible
En imitant la façon dont les neurones ne se déclenchent que lorsque cela est nécessaire, les puces neuromorphiques réduisent jusqu’à 100 fois la consommation d’énergie inactive.
Faible latence
Les réseaux spiking prennent en charge des temps de réponse inférieurs à 100 millisecondes, essentiels pour la robotique, les diagnostics en temps réel et les systèmes de contrôle en boucle fermée.
Traitement parallèle
L’exécution asynchrone permet à ces systèmes de traiter simultanément plusieurs entrées de capteurs sans créer de goulot d’étranglement.
Tolérance au bruit
Les puces neuromorphiques sont bien adaptées aux environnements chaotiques et peuvent traiter les données incomplètes ou non structurées plus efficacement que les modèles d’IA conventionnels.
Conception compacte
La réduction des besoins en énergie et en refroidissement permet le déploiement dans les appareils intégrés, éliminant ainsi le besoin de systèmes de refroidissement de grande taille ou de déchargement vers le cloud.
Ensemble, ces fonctionnalités suggèrent que les systèmes neuromorphiques pourraient prendre en charge une IA efficace et autonome en dehors du datacenter.
Cas d’utilisation de l’informatique neuromorphique
Santé
Les puces neuromorphiques sont en cours d’étude pour l’analyse des ECG à faible puissance et les prothèses adaptatives qui répondent aux mouvements en temps réel (voir Figure 3). Des plateformes telles que SpiNNaker et BrainScaleS ont démontré la viabilité d’un traitement similaire au cerveau dans des contextes médicaux. Les puces plus récentes telles que Loihi d’Intel se sont avérées prometteuses dans les interfaces cerveau-machine, décodant les signaux nerveux pour contrôler les membres robotiques, ouvrant la voie à la restauration de la mobilité (voir Figure 2).
La recherche sur les simulations moléculaires et le pliage des protéines à l’aide de SNN pourrait aider à réduire les coûts énergétiques, améliorant potentiellement l’efficacité et l’abordabilité du développement de médicaments et des traitements médicaux.
Figure 2. Image A (gauche) : Prototype de bras robotique monté sur fauteuil roulant, contrôlé par neuromorphe, démontré par l’auteur de la recherche, Yuval Zaidel. Image B (droite) : Architecture de contrôle : Des données d’accéléromètre de traitement de réseau neuronal dynamiques pour une adaptation de position en temps réel. Source : Frontières | Contrôle adaptatif d’un bras robotique monté sur un fauteuil roulant avec lectures de vitesse intégrées de manière neuromorphique et apprentissage en ligne.
Modélisation et physique du climat
Au CERN, des capteurs basés sur des événements inspirés des principes neuromorphiques ont été utilisés pour suivre les particules dans des environnements bruyants et à haut débit. Sandia National Laboratories utilise des puces similaires pour réduire l’énergie requise pour les simulations climatiques, un champ traditionnellement dominé par les superordinateurs.
Robotique et IoT
Le Grasping Neural Process du Massachusetts Institute of Technology (MIT) a fait la démonstration d’un bras robotique alimenté par SNN formé sur 1 000 géométries et 5 000 objets, permettant des collectes fiables dans des environnements dynamiques tels que les entrepôts.
Les chercheurs ont utilisé des capteurs de vision dynamique (DVS), des caméras inspirées de la rétine, pour capturer les changements de lumière. Ces capteurs permettent aux drones de naviguer dans des espaces encombrés avec une agilité similaire à celle des insectes et une latence ultra-faible
Des entreprises comme Prophesee ont commercialisé des systèmes de vision basés sur les événements pour une surveillance intelligente, réduisant ainsi les besoins en bande passante et en énergie. Leurs capteurs peuvent atteindre plus de 10 000 images par seconde tout en consommant moins d’énergie.
Figure 3. Le développement d’une neuroprothèse somatosensorielle repose sur trois piliers principaux : (1) Utilisation de modèles informatiques pour imiter la façon dont le système nerveux répond au toucher (segment bleu) ; (2) Tests sur des animaux pour valider les stratégies de neurostimulation (segment orange) ; DRG : ganglion de la racine dorsale. (3) Mener des essais cliniques avec des humains pour évaluer l’efficacité de la technologie dans des scénarios réels (segment vert). Source : Communications sur la nature.
Finance et cybersécurité
IBM a exploré l’utilisation de SNN pour la détection de fraude. Ils ont formé des modèles qui identifient les tendances des transactions financières avec une haute précision. Ces systèmes peuvent s’adapter aux menaces émergentes avec un minimum de données.
Ce dont l’infrastructure a besoin
La prise en charge des systèmes neuromorphiques nécessite plus que des mises à niveau progressives en périphérie. Elle nécessite une infrastructure spécialement conçue (voir Figure 4) qui évolue avec la demande, s’adapte aux charges de travail changeantes et s’adapte aux environnements à espace ou à puissance restreint.
Par exemple, le refroidissement liquide direct-to-chip peut gérer la chaleur sporadique plus efficacement que l’air seul. L’approche Vertiv™ Coolchip, qui combine refroidissement liquide et refroidissement par air, permet de maintenir des performances stables tout en réduisant la consommation d’énergie globale. De même, les systèmes de distribution électrique doivent répondre rapidement aux changements de courant brusques sans surconstruction, ce qui augmente à la fois les coûts et l’empreinte physique. Des interconnexions haut débit sont également nécessaires pour prendre en charge un traitement rapide et localisé des données.
Du côté des opérations, les charges de travail neuromorphiques exigent un état d’esprit différent. Les SNN et les architectures asynchrones sont fondamentalement différents des modèles utilisés dans la plupart des pipelines d’entraînement IA. Les équipes doivent comprendre comment travailler avec des systèmes axés sur les événements et comment les entretenir. Les ingénieurs doivent concevoir autour de charges imprévisibles et d’un comportement dynamique.
Figure 4. Par exemple, les solutions modulaires, telles que les solutions d’infrastructure Vertiv™ avec Vertiv™ CoolChip, qui combinent le refroidissement liquide direct-to-chip avec des stratégies adaptables côté air, sont déjà conçues pour gérer les charges de travail haute performance à la périphérie, comme l’informatique neuromorphique.
Se préparer à l’avenir
L’informatique neuromorphique n’est pas un concept. Elle remodèle déjà le fonctionnement de l’intelligence Edge. De la robotique et de la santé à la modélisation climatique et à la cybersécurité, les applications sont là. Ce qui est en retard, c’est l’infrastructure.
Si vous prévoyez de déployer l’IA à la périphérie, vous aurez besoin de systèmes conçus pour prendre en charge ces nouvelles charges de travail. Cela signifie évaluer la densité des racks, les stratégies thermiques et la réactivité énergétique. Cela signifie également investir dans des personnes qui comprennent ce nouveau paradigme d’IA : neurosciences partielles, ingénierie partielle, conception de systèmes partiels.
L’évolution de l’IA Edge dépend de la manière dont l’infrastructure actuelle répond aux demandes émergentes.
Visitez le Vertiv™ AI Hub pour explorer les solutions d’infrastructure conçues pour les performances neuromorphiques, à la périphérie, en temps réel et avec une efficacité qui s’adapte.