Dojo est la plateforme de superordinateur personnalisée de Tesla, conçue dès le départ pour l'apprentissage automatique (ML) de l'IA. Toutefois, à mesure que le développement se poursuit, Dojo servira pour l'entraînement vidéo à partir des données vidéo provenant de sa flotte de véhicules. Pour rappel, le constructeur automobile dispose déjà d'un grand superordinateur basé sur le GPU NVIDIA qui est l'un des plus puissants au monde, et d'un centre de données contenant 30 Po (soit 30 000 000 Go) d'images stockées. Mais le nouveau superordinateur Dojo de l'entreprise utilise des puces et une infrastructure entièrement conçue par Tesla.
Avec ce superordinateur, l'entreprise affirme pouvoir remplacer 72 racks de GPU composés de 4 000 GPU par seulement quatre armoires Dojo. Lors de l'événement "Tesla AI Day" l'année dernière, les responsables du programme ont révélé la première puce et les premières tuiles d'entraînement de Dojo, qui se transformeront par la suite en un cluster Dojo complet ou "ExaPod". Vendredi, Tesla a annoncé qu'il devrait être achevé au premier trimestre 2023. L'entreprise prévoit d'en construire sept au total à Palo Alto. Dans un système à 10 armoires, Tesla a déclaré que le Dojo ExaPod franchirait la barrière de l'ExaFlop de calcul.
Le système contient 1,3 To de SRAM haute vitesse et 13 To de DRAM à large bande passante. Depuis 2021, le développement de Dojo a franchi quelques étapes importantes, notamment l'installation de la première armoire Dojo, des tests de charge de 2,2 MW, et la société a annoncé qu'elle travaille désormais à un rythme de construction d'une tuile par jour. Bill Chang, l'ingénieur système principal de Tesla pour Dojo, a déclaré : « nous savions que nous devions réexaminer chaque aspect de l'infrastructure du centre de données afin de supporter notre refroidissement et notre densité de puissance sans précédent ».
L'équipe a dû développer son propre système de refroidissement et d'alimentation à haute puissance pour alimenter les armoires Dojo. C'est à peu près l'état actuel du développement de la plateforme Dojo. Chang a déclaré vendredi que Tesla a fait sauter la sous-station de son réseau électrique local lorsqu'il a testé l'infrastructure au début de l'année. « Au début de l'année, nous avons commencé à tester la charge de notre infrastructure d'alimentation et de refroidissement et nous avons pu la pousser au-delà de 2 MW avant de provoquer une panne de notre sous-station et de recevoir un appel de la ville », a-t-il déclaré.
Vendredi, Tesla a également exécuté le modèle d'IA "Stable Diffusion" à l'aide de 25 matrices Dojo, créant une image générée par l'IA à partir de l'invite : "Cybertruck on Mars". Tesla a en outre profité de l'événement pour tenter de recruter davantage de talents, et a déclaré que l'équipe était dans les temps pour terminer le premier ExaPod. Mais pourquoi un constructeur automobile développe-t-il le superordinateur le plus puissant du monde ? Eh bien, Tesla vous dirait qu'il ne s'agit pas seulement d'un constructeur automobile, mais d'une entreprise technologique qui développe des produits pour accélérer la transition vers une économie durable.
Elon Musk, PDG de Tesla, a déclaré qu'il était logique de proposer Dojo en tant que service, peut-être pour s'attaquer à AWS de Jeff Bezos ou à d'autres acteurs du cloud computing et du calcul haute performance (HPC), et l'a décrit comme un "service que vous pouvez utiliser et qui est disponible en ligne, où vous pouvez former vos modèles beaucoup plus rapidement et pour moins d'argent". Mais plus précisément, Tesla a besoin de Dojo pour étiqueter automatiquement les vidéos de formation de sa flotte de véhicules électriques et former ses réseaux neuronaux pour construire son système de conduite autonome, l'Autopilot.
En effet, Dojo change la donne, car il a été entièrement développé en interne, depuis la base. Cette initiative interne contraste avec les initiatives internes des équipementiers concurrents qui s'appuient sur de multiples fournisseurs de niveau 1 pour répondre à leurs besoins variés en matière de conduite autonome. Des géants de la technologie comme Google, avec son unité de traitement Tensor, adoptent une approche similaire pour développer des puces d'IA personnalisées. Tesla pourrait emprunter la même voie, puisqu’auparavant, l'entreprise s'approvisionnait en processeurs auprès de Nvidia pour ses véhicules.
Mais il a décidé de développer ses propres puces. Il a été motivé par le fait que les puces de Nvidia sont plus chères et offrent des performances nettement inférieures à celles de l'unité personnalisée de Tesla, qui est axée sur la réalisation de véhicules entièrement autonomes grâce aux caméras et aux données visuelles. Ainsi, Dojo est susceptible d'être beaucoup plus efficace dans la formation des réseaux neuronaux d'IA et des modèles d'apprentissage profond nécessaires pour pousser Tesla vers des véhicules entièrement automatisés. De plus, on s'attend à ce qu'il améliore la sécurité des programmes Autopilot et FSD (Full Self-Driving).
Tesla utilise des caméras pour lire l'état de la chaussée et offrir un confort supérieur à ses passagers. De plus, les capteurs de caméra sont prêts à prendre en charge d'autres fonctionnalités qui amélioreront l'expérience à bord du véhicule. La flotte de Tesla, qui compte près de trois millions de véhicules, devrait parcourir plus de 100 millions de kilomètres d'ici la fin de l'année, ce qui signifie que le volume de données capturées par les véhicules va croître de manière exponentielle, tout comme la quantité de calcul nécessaire pour traiter ces données.
De tous ces points de vue, Dojo pourrait s'avérer un atout essentiel. En outre, avec Dojo, Tesla souligne les avantages de sa stratégie unique d'intégration verticale, qui lui permet de contrôler les principaux aspects de la chaîne de valeur, de la fabrication à la vente, du matériel aux logiciels, des produits aux services… La plateforme de superordinateur Dojo pourrait permettre à Tesla de progresser vers des véhicules entièrement autonomes et pourrait également renforcer les capacités du robot humanoïde Optimus, alimenté par l'IA de l'entreprise, qui a également été présenté vendredi.
Et vous ?
Quel est votre avis sur le sujet ?
Que pensez-vous du nouveau supercalculateur de Tesla ?
Selon vous, quels pourraient être les avantages de Dojo pour Tesla ?
Voir aussi
L'Allemagne accueillera Jupiter, le premier supercalculateur exascale d'Europe connu publiquement, d'après une annonce d'EuroHPC JU
Voyager, le tout premier supercalculateur alimenté par les puces d'IA générique d'Intel, il permettra aux scientifiques d'optimiser des algorithmes pour les modèles d'apprentissage automatique
LUMI, le supercalculateur le plus récent et le plus puissant d'Europe, est destiné à résoudre des problèmes mondiaux et favorise une transformation verte
Atos annonce le nouveau supercalculateur BullSequana XH3000 de classe exascale, avec une puissance six fois supérieure à celle de la génération précédente, disponible au quatrième trimestre 2022