IdentifiantMot de passe
Loading...
Mot de passe oublié ?Je m'inscris ! (gratuit)

Vous êtes nouveau sur Developpez.com ? Créez votre compte ou connectez-vous afin de pouvoir participer !

Vous devez avoir un compte Developpez.com et être connecté pour pouvoir participer aux discussions.

Vous n'avez pas encore de compte Developpez.com ? Créez-en un en quelques instants, c'est entièrement gratuit !

Si vous disposez déjà d'un compte et qu'il est bien activé, connectez-vous à l'aide du formulaire ci-dessous.

Identifiez-vous
Identifiant
Mot de passe
Mot de passe oublié ?
Créer un compte

L'inscription est gratuite et ne vous prendra que quelques instants !

Je m'inscris !

Google dévoile deux nouveaux TPU conçus pour « l'ère des agents » : cette nouvelle génération de puces d'IA Tensor se compose de deux puces distinctes, l'une dédiée à l'inférence et l'autre à l'entraînement

Le , par Jade Emy

46PARTAGES

6  0 
Lors de sa conférence annuelle Cloud Next 26, Google Cloud a officiellement annoncé le début de « l’ère des agents ». En tête de cette initiative se trouvent les Tensor Processing Units (TPU) de huitième génération de Google et une nouvelle plateforme complète pour la création d’agents IA autonomes. Google a présenté deux puces spécialisées de 8e génération pour répondre aux besoins de calcul massifs des agents autonomes : TPU 8t (entraînement) : Conçue pour la création de modèles à grande vitesse, et TPU 8i (Inference) : Optimisée pour l'exécution d'agents IA en temps réel.Google affirme : « Ensemble, ces TPU de 8e génération offriront évolutivité, efficacité et capacités pour les charges de travail de formation, de service et d’agents. »

Une unité de traitement tensoriel (TPU) est un circuit intégré spécifique à une application (ASIC) de type unité de traitement neuronal (NPU) développé par Google pour l'apprentissage automatique basé sur les réseaux neuronaux. TensorFlow, Jax et PyTorch sont des frameworks pris en charge par les TPU. Google a commencé à utiliser les TPU en interne en 2015, puis les a mises à la disposition de tiers en 2018, à la fois dans le cadre de son infrastructure cloud et en proposant à la vente une version plus petite de la puce.

Lors de sa conférence annuelle Cloud Next 26, Google Cloud a officiellement annoncé le début de « l’ère des agents », dévoilant une vaste gamme de solutions matérielles et logicielles destinées à transformer les entreprises en « entreprises agentiques ». En tête de cette initiative se trouvent les Tensor Processing Units (TPU) de huitième génération de Google et une nouvelle plateforme complète pour la création d’agents IA autonomes. L’équipe Cloud a présenté une vision dans laquelle l’IA ne se contente pas de répondre à des questions, mais accomplit de manière proactive des processus métier complexes.

Le PDG de Google, Sundar Pichai, a félicité l’équipe Cloud qui a travaillé sur cette innovation au cours de l’année écoulée. Il a déclaré : « Google Cloud connaît une dynamique incroyable : nos modèles traitent désormais plus de 16 milliards de jetons par minute via l'utilisation directe de l'API par nos clients (contre 10 milliards au trimestre dernier). Cette semaine, lors de Cloud Next, nous dévoilons une gamme extraordinaire de nouveaux partenariats et d'innovations, notamment notre nouvelle plateforme Gemini Enterprise Agent, le nouveau centre de contrôle permettant de créer, de faire évoluer, de gérer et d'optimiser les agents. Nous lançons également nos TPU de 8e génération pour prendre en charge les charges de travail agentiques les plus exigeantes. Félicitations à notre équipe Google Cloud, et un immense merci à nos partenaires qui construisent l'avenir avec nous. »

Au cœur de la « révolution de l’IA agentique » se trouve la nouvelle infrastructure d’hyperordinateur IA de Google. Google a présenté deux puces spécialisées de 8e génération pour répondre aux besoins de calcul massifs des agents autonomes :

- TPU 8t (entraînement) : Conçue pour la création de modèles à grande vitesse, cette puce peut être déployée jusqu’à 9 600 TPU dans un seul superpod. Elle offre trois fois la puissance de traitement de la génération précédente et deux fois les performances par watt.

- TPU 8i (Inference) : Optimisée pour l'exécution d'agents IA en temps réel, la puce 8i offre des performances par dollar supérieures de 80 %. Elle est conçue pour une « latence quasi nulle », garantissant que les agents IA peuvent réagir et exécuter des tâches instantanément.

Google a également annoncé qu'il serait parmi les premiers à proposer les systèmes Vera Rubin NVL72 de Nvidia, offrant ainsi aux clients la flexibilité de choisir la meilleure architecture pour leurs besoins spécifiques.


Au-delà du matériel, Google a lancé la plateforme Gemini Enterprise Agent. Il s'agit d'un « guichet unique » permettant aux équipes techniques de créer, de faire évoluer et de gérer des agents IA. La plateforme comprend un « Agent Studio » pour le développement low-code et une « orchestration d'agent à agent », qui permet à différents agents IA de se déléguer des tâches entre eux de manière transparente.

Google a souligné que l'ère des agents nécessite une nouvelle approche des données et de la sécurité. Le nouveau Agentic Data Cloud s'éloigne des archives réactives pour s'orienter vers des « systèmes d'action », permettant aux agents de raisonner en temps réel sur l'ensemble du patrimoine de données d'une entreprise. Pour protéger ces systèmes autonomes, Google a lancé Agentic Defense. Cette plateforme de cybersécurité combine les informations sur les menaces de Google avec la plateforme de sécurité de Wiz afin de détecter de manière proactive les « dérives de raisonnement » ou les comportements suspects des agents avant qu'ils n'aient un impact sur l'activité.

Cette annonce confirme les efforts de Google dans la course à l'IA. Elle intervient quelque mois après que Geoffrey Hinton, le « parrain de l'IA », a estimé que Google est en train de rattraper OpenAI dans la course à l'IA. Hinton s'est également dit surpris que Google ait mis autant de temps à dépasser ses concurrents. Il a déclaré : « Je pense qu'il est en fait plus surprenant que Google ait mis autant de temps à dépasser OpenAI. Je pense qu'à l'heure actuelle, ils commencent à le dépasser ».

Geoffrey Hinton avait également affirmé que Google dispose d'un avantage en matière de puces IA. Outre le lancement réussi de son modèle d'IA, la création de ses propres puces est un « avantage considérable » pour Google, a fait remarquer Hinton. Il a déclaré : « Google dispose de nombreux chercheurs très compétents et, bien sûr, d'une grande quantité de données et de nombreux centres de données. Je pense que Google va gagner. »

Voici l'annonce de Google :

Nos TPU de huitième génération : deux puces pour l'ère de l'agentique

Aujourd’hui, lors de la conférence Google Cloud Next, nous présentons la huitième génération de Tensor Processor Unit (TPU) sur mesure de Google, qui sera bientôt disponible avec deux architectures distinctes et spécialement conçues pour l’entraînement et l’inférence : le TPU 8t et le TPU 8i. Ces deux puces sont conçues pour alimenter nos supercalculateurs sur mesure, afin de prendre en charge tout, de l’entraînement de modèles de pointe et du développement d’agents aux charges de travail d’inférence massives. Les TPU alimentent depuis des années les principaux modèles de base, notamment Gemini. Ensemble, ces TPU de 8e génération offriront évolutivité, efficacité et capacités pour les charges de travail de formation, de service et d’agents.

À l’ère des agents IA, les modèles doivent raisonner pour résoudre des problèmes, exécuter des workflows en plusieurs étapes et apprendre de leurs propres actions dans des boucles continues. Cela impose de nouvelles exigences à l'infrastructure, et les TPU 8t et TPU 8i ont été conçus en partenariat avec Google DeepMind pour prendre en charge les charges de travail d'IA les plus exigeantes et s'adapter à l'évolution des architectures de modèles à grande échelle.

Les TPU ont établi la norme pour un certain nombre de composants de supercalcul ML, notamment les calculs numériques sur mesure, le refroidissement par liquide, les interconnexions sur mesure et bien plus encore, et nos TPU de huitième génération sont l'aboutissement de plus d'une décennie de développement. Le principe clé à l'origine de la conception des TPU d'origine reste d'actualité : en personnalisant et en co-concevant le silicium avec le matériel, les réseaux et les logiciels, y compris l'architecture des modèles et les exigences des applications, nous pouvons offrir une efficacité énergétique et des performances absolues nettement...
La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !