OpenAI vient de dévoiler Jalapeño, sa première puce d'inférence maison développée avec Broadcom en seulement neuf mois. L'aspect le plus fascinant : ce sont les propres modèles d'OpenAI qui ont accéléré la conception de la puce.
Par Jérémy Collovray

Pas encore de commentaire. Lancez la discussion !
Ce jeudi 25 juin, OpenAI et Broadcom ont dévoilé Jalapeño, la première puce d'intelligence artificielle entièrement conçue par OpenAI. Son nom de code tranche avec la froideur habituelle de l'industrie des semi-conducteurs, mais derrière ce clin d'oeil culinaire se cache une ambition sérieuse : réduire la dépendance d'OpenAI à Nvidia, la firme qui a raflé la mise sur le matériel IA depuis des années.
Ce qui distingue Jalapeño des puces maison d'Amazon ou de Google, c'est la façon dont elle a été fabriquée. OpenAI a mobilisé ses propres modèles d'intelligence artificielle pour accélérer le processus de design matériel, de l'architecture mémoire à l'optimisation des réseaux internes. Résultat : neuf mois entre l'idée initiale et la sortie de fabrication, un délai exceptionnel dans l'industrie des semi-conducteurs où les cycles de développement dépassent habituellement les trois à cinq ans. L'IA, en quelque sorte, a contribué à construire sa propre future infrastructure physique.
Jalapeño est une puce d'inférence, c'est-à-dire optimisée pour faire fonctionner des modèles déjà entraînés, comme ChatGPT ou les assistants de code d'OpenAI, et non pour la phase d'entraînement initial, bien plus gourmande en calcul. Les tests préliminaires annoncent des performances par watt nettement supérieures aux alternatives actuelles, en particulier sur les modèles de code en temps réel. La production commerciale est prévue pour la fin de l'année 2026, avec Broadcom en charge de la fabrication et Celestica pour l'intégration en serveur.
Nvidia ne devrait pas trembler tout de suite : OpenAI reconnaît avoir besoin de ses GPU pour l'entraînement de ses modèles dans un avenir prévisible. Mais l'inférence représente l'essentiel des coûts opérationnels au quotidien, c'est le moteur qui tourne en permanence pour répondre à chaque requête de chaque utilisateur. Sur ce segment précis, une puce maison peut transformer radicalement l'économie du service, en réduisant la facture énergétique et en libérant OpenAI des contraintes d'approvisionnement qui ont régulièrement ralenti le déploiement de ses modèles.
Les grandes entreprises d'IA veulent en contrôler les fondations physiques. Quand l'outil commence à concevoir les outils qui le font tourner, la boucle se referme d'une façon que peu d'industries ont jamais connue.