Les puces d’inspiration cérébrale propulsent l’IA au-delà du data center, permettant une prise de décision en temps réel dans les appareils. Cependant, tenir leurs promesses nécessite de repenser l’infrastructure à partir du silicium.
Imaginez un drone traversant un entrepôt avec des réflexes semblables à des insectes, ou un membre prothétique s’adaptant à son utilisateur en temps réel. Il ne s’agit pas de concepts d’un futur distant. Ce sont des preuves précoces de l’informatique neuromorphique, une nouvelle classe de matériel d’intelligence artificielle (IA) conçue pour imiter le cerveau humain.
Les puces neuromorphiques traitent les données en utilisant des réseaux de neurones à impulsions (SNN) qui ne s’activent que pour une entrée significative, similaire aux neurones biologiques. Contrairement aux unités de traitement centrales (CPU) et aux unités de traitement graphique (GPU) qui séparent les unités de mémoire et de traitement, l’informatique neuromorphique intègre ces composants pour un traitement efficace des données en parallèle (voir Figure 1).
Il en résulte une consommation électrique considérablement plus faible, des temps de réponse plus rapides et des conceptions compactes adaptées aux environnements restreints en périphérie. Cela est plus important que jamais, avec des dépenses mondiales en infrastructure Edge qui devraient atteindre 261 milliards de dollars en 2025 à 380 milliards de dollars en 2028.
Figure 1. La puce neuromorphique unique BrainScaleS-2 est l’un des systèmes utilisés pour les applications informatiques neuromorphiques. Source : L'Open Neuromorphique.
Fonctionnement de l’informatique neuromorphique
Les puces neuromorphiques intègrent la mémoire et le calcul en un même endroit. Cette conception évite le goulot d’étranglement de von Neumann, qui se produit lorsque les données se déplacent constamment entre des unités de traitement et de mémoire séparées. Au lieu de traiter continuellement les données, ces puces fonctionnent de manière asynchrone et ne déclenchent le calcul que lorsque l’entrée du capteur change. Ce modèle piloté par les événements peut minimiser le traitement inutile et réduire la consommation électrique jusqu’à 100 fois par rapport aux systèmes conventionnels.
Loihi d’Intel, par exemple, simule plus d’un million de neurones en utilisant seulement 70 milliwatts. Les GPU traditionnels exécutant des charges de travail similaires peuvent consommer plusieurs watts, voire kilowatts, ce qui limite leur utilisation dans des environnements distants ou mobiles.
Avantages de l’informatique neuromorphique
L'informatique neuromorphique ne se résume pas à des gains marginaux. Elle représente un changement structurel dans la façon dont l’IA fonctionne à la périphérie.
Consommation d’énergie ultra-faible
En imitant la manière dont les neurones ne s’activent que lorsque c’est nécessaire, les puces neuromorphiques réduisent la consommation électrique inactive jusqu’à 100 fois.
Faible latence
Les réseaux à impulsions soutiennent des temps de réponse inférieurs à 100 millisecondes, essentiels pour la robotique, les diagnostics en temps réel et les systèmes de contrôle en boucle fermée.
Traitement parallèle
L’exécution asynchrone permet à ces systèmes de traiter simultanément plusieurs entrées de capteurs sans créer de goulot d’étranglement.
Tolérance au bruit
Les puces neuromorphiques sont bien adaptées aux environnements chaotiques et peuvent traiter les données incomplètes ou non structurées plus efficacement que les modèles d’IA conventionnels.
Conception compacte
La réduction des besoins en énergie et en refroidissement permet le déploiement dans les appareils intégrés, éliminant le besoin de larges systèmes de refroidissement ou de déchargement vers le cloud.
Ensemble, ces fonctionnalités suggèrent que les systèmes neuromorphiques pourraient prendre en charge une IA efficace et autonome en dehors du data center.
Cas d’utilisation de l’informatique neuromorphique
Santé
Les puces neuromorphiques sont en cours d’étude pour l’analyse des ECG à faible puissance et les prothèses adaptatives qui répondent aux mouvements en temps réel (voir Figure 3). Des plateformes comme SpiNNaker et BrainScaleS ont démontré la viabilité d’un traitement similaire au cerveau dans des contextes médicaux. Les puces plus récentes telles que Loihi d’Intel ont montré des résultats prometteurs dans les interfaces cerveau-machine, décodant les signaux neuronaux pour contrôler les membres robotiques, ouvrant la voie à la restauration de la mobilité (voir Figure 2).
La recherche sur les simulations moléculaires et le repliement des protéines utilisant les SNN pourrait aider à réduire les coûts énergétiques, améliorant potentiellement l’efficacité et l’accessibilité financière du développement de médicaments et des traitements médicaux.
Figure 2. Image A (gauche) : Prototype de bras robotique monté sur fauteuil roulant à commande neuromorphique, démontré par l’auteur de la recherche, Yuval Zaidel. Image B (droite) : Architecture de contrôle : Réseau de neurones à impulsions traitant les données d'accéléromètre pour l'adaptation de position en temps réel. Source : Frontières | Contrôle adaptatif d’un bras robotique monté sur fauteuil roulant avec lectures de vitesse intégrées de manière neuromorphique et apprentissage en ligne.
Modélisation climatique et physique
Au CERN, des capteurs basés sur des événements inspirés des principes neuromorphiques ont été utilisés pour suivre les particules dans des environnements bruyants et à haut débit. Sandia National Laboratories utilise des puces similaires pour réduire l’énergie requise pour les simulations climatiques, un domaine traditionnellement dominé par les supercalculateurs.
Robotique et IoT
Le Grasping Neural Process du Massachusetts Institute of Technology (MIT) a démontré un bras robotique alimenté par SNN, entraîné sur 1 000 géométries et 5 000 objets, permettant des saisies fiables dans des environnements dynamiques comme les entrepôts.
Les chercheurs ont utilisé des capteurs de vision dynamique (DVS), des caméras inspirées de la rétine, pour capturer les changements de lumière. Ces capteurs permettent aux drones de naviguer dans des espaces encombrés avec une agilité similaire à celle des insectes et une latence ultra-faible
Des entreprises comme Prophesee ont commercialisé des systèmes de vision basés sur les événements pour une surveillance intelligente, réduisant ainsi les besoins en bande passante et en énergie. Leurs capteurs peuvent atteindre plus de 10 000 images par seconde tout en consommant moins d’énergie.
Figure 3. Le développement d’une neuroprothèse somatosensorielle repose sur trois piliers principaux : (1) Utilisation de modèles informatiques pour imiter la manière dont le système nerveux répond au toucher (segment bleu) ; (2) Tests sur des animaux pour valider les stratégies de neurostimulation (segment orange) ; DRG : ganglion de la racine dorsale. (3) Réalisation d’essais cliniques avec des humains pour évaluer l’efficacité de la technologie dans des scénarios réels (segment vert). Source : Nature Communications.
Finance et cybersécurité
IBM a exploré l’utilisation de SNN pour la détection de fraude. Ils ont entraîné des modèles qui identifient les tendances des transactions financières avec une haute précision. Ces systèmes peuvent s’adapter aux menaces émergentes avec un minimum de données.
Ce dont l’infrastructure a besoin
Soutenir des systèmes neuromorphiques nécessite plus que des mises à niveau progressives en périphérie. Elle nécessite une infrastructure spécialement conçue (voir Figure 4) qui évolue avec la demande, s’adapte aux charges de travail changeantes et convient aux environnements à espace ou à puissance restreints.
Par exemple, le refroidissement liquide direct peut gérer les pics de chaleur plus efficacement que l’air seul. L’approche de Vertiv™ Coolchip, qui combine le refroidissement liquide et le refroidissement par air, permet de maintenir des performances stables tout en réduisant la consommation d’énergie globale. De même, les systèmes d’alimentation électrique doivent répondre rapidement aux variations brusques de courant sans surdimensionnement, ce qui augmenterait à la fois les coûts et l'encombrement physique. Des interconnexions haut débit sont également nécessaires pour soutenir un traitement rapide et localisé des données.
Du côté des opérations, les charges de travail neuromorphiques exigent un état d’esprit différent. Les SNN et les architectures asynchrones sont fondamentalement différents des modèles utilisés dans la plupart des chaînes d’entraînement IA. Les équipes doivent comprendre comment travailler avec des systèmes pilotés par les événements et comment les entretenir. Les ingénieurs doivent concevoir autour de charges imprévisibles et d’un comportement dynamique.
Figure 4. Par exemple, les solutions modulaires, telles que les solutions d’infrastructure Vertiv™ avec Vertiv™ CoolChip, qui combinent le refroidissement liquide direct avec des stratégies adaptables côté air, sont déjà conçues pour gérer les charges de travail haute performance à la périphérie, comme l’informatique neuromorphique.
Se préparer pour l’avenir
L’informatique neuromorphique n’est pas un concept. Elle remodèle déjà le fonctionnement de l’intelligence en périphérie. Depuis la robotique et la santé jusqu’à la modélisation climatique et à la cybersécurité, les applications sont là. C'est au niveau de l'infrastructure que le retard se fait sentir.
Si vous prévoyez de déployer l’IA à la périphérie, vous aurez besoin de systèmes conçus pour supporter ces nouvelles charges de travail. Cela implique d’évaluer la densité des racks, les stratégies de refroidissement et la réactivité électrique. Cela signifie également investir dans des personnes qui comprennent ce nouveau paradigme d’IA : neuroscience partielle, ingénierie partielle, conception de systèmes partiels.
L’évolution de l’IA en périphérique (Edge AI) dépend de la manière dont l’infrastructure actuelle répond aux exigences émergentes.
Visitez le Vertiv™ AI Hub pour explorer les solutions d’infrastructure conçues pour les performances neuromorphiques, à la périphérie, en temps réel et avec une efficacité qui évolue.