Aller au contenu principal

NEURONIC

BiNary nEURal netwOrks based oN CMOS/RRAM hybrid archItecture and logic in memory Concept for sensor fusion application
Coordinatrice / Coordinateur du projet :
Cadre :
AAPG ANR
Durée :
60 MOIS
Date de démarrage :
Résumé :

Project main objective:

NEURONIC aims at the fabrication of a neural network hardware accelerator associating CMOS circuitry and fully embedded Resistive Memory (RRAM). This digital accelerator will perform inference using a revolutionary “XNOR-NET” concept based on logic in memory computing, with record-breaking low energy consumption.

Résumé :

Le projet NEURONIC ambitionne la fabrication d'un accélérateur matériel de réseaux de neurones binaires à base de technologie hybride CMOS/RRAM utilisant le concept de calcul dans les mémoires. Cet accélérateur permettra de réaliser de l'inférence en exploitant un concept révolutionnaire : le «XNOR-NET». Il réalisera ainsi des opérations de fusion de données avec une sobriété énergétique inégalée jusqu'ici.

En intelligence artificielle les réseaux de neurones profonds sont aujourd'hui largement étudiés, mais leur simulation sur des cartes graphiques gaspille une énergie considérable lors des échanges de données entre mémoires et processeurs. Dernièrement, l’approche « XNOR-NET » a permis de remplacer les multiplications 32 ou 64 bits par des opérations booléennes, simplifiant considérablement l'architecture du circuit, limitant d’autant l’empreinte mémoire.  Mais de manière assez surprenante et grâce à la redondance intrinsèque des réseaux de neurones, la simplification drastique apportée par les XNOR-NET ne dégrade que faiblement les performances.

Basé sur ce concept de XNOR-NET, dans le cadre du projet NEURONIC, nous fabriquerons un circuit intégré révolutionnaire qui réalisera de l'inférence, en évitant le transfert des poids synaptiques, grâce à des mémoires RRAM embarquées permettant un calcul local avec une approche logique dans la mémoire. Notre solution permettra un traitement minimal en énergie comparativement aux solutions actuelles  qui incluent des processeurs et sont contraintes par la capacité des mémoires pour enregistrer l'historique des données et les échanges.

L’application visée est de la fusion multi-capteurs qui agrègent des données pour produire une information plus précise. Cette application se base sur l’extraction de traits caractéristiques permettant d’obtenir des tailles de réseaux réduites, adaptées aux technologies visées.

L’efficacité énergétique de notre solution sera exceptionnelle grâce aux éléments suivants :

  • Une partie des calculs sera directement effectuée avec une approche de logique en mémoire permettant d’éviter le transfert des poids synaptiques.
  • L’approche XNOR-NET permet de réduire l’empreinte mémoire autorisant le stockage des poids dans des RRAM embarquées. De plus, cette caractéristique permettra de couper l’alimentation lors de la non utilisation du circuit et d’avoir à disposition instantanément les poids synaptiques lors de la remise sous tension.
  • Le circuit étant dédié à l'inférence, l'apprentissage sera réalisé hors-ligne et une seule programmation sera nécessaire avant d’utiliser le circuit.

Nous estimons que la combinaison de ces facteurs permettrait de réduire la consommation d'un facteur x1000 par rapport à une solution classique.

Deux générations de circuits NEURONIC seront développées : la première génération utilisant des transistors comme éléments de sélection (1T1R), puis une seconde génération exploitant une technologie de sélecteurs en cours de développement (1S1R) qui permet un gain considérable en surface. L’architecture du circuit reposera sur la conception à façon des blocs mémoires et de leur logique associée selon diverses options d’organisation mémoire. L’architecture du démonstrateur complet sera ensuite définie en utilisant une approche « top-down » permettant d’intégrer les optimisations classiques des systèmes numériques, à savoir virtualisation, multiplexage et « pipe-line » pour adapter l’architecture à la complexité du réseau XNOR-NET.

Plusieurs groupes américains et asiatiques s'intéressent au concept de XNOR-NET à base de RRAM. Toutefois, les architectures proposées sont de type « cross-point » pour réaliser l'inférence de manière analogique ce qui peut entrainer des problèmes de conversion et de fiabilité. Nous estimons que notre approche entièrement numérique est plus robuste et plus efficace en terme de surface. Toutefois, cette compétition internationale permet de mesurer l'urgence de financer le projet NEURONIC.

Equipes et entreprises impliquées :