Le développeur de puces IA, Cerebras Systems, va rendre public ses dossiers dans un contexte de croissance rapide des revenus

Cerebras Systems Inc., le développeur de la puce d'intelligence artificielle WSE-3 de la taille d'une tranche, a déposé aujourd'hui une demande d'introduction en bourse.

Cette décision intervient environ 18 mois après la première tentative de la société de coter ses actions. Elle a déposé une introduction en bourse en septembre 2024, mais s'est retiré la paperasse à la fin de l'année dernière. Cerebras avait expliqué à l'époque que son dépôt initial d'introduction en bourse « ne reflétait plus l'état actuel de nos activités ».

En 2024, le fabricant de puces a perdu 485 millions de dollars sur un chiffre d'affaires de 290,3 millions de dollars. L'année dernière, le bénéfice a atteint 87,9 millions de dollars. Les revenus de Cerebras ont augmenté de 76 % sur la même période, pour atteindre 510 millions de dollars.

La société a révélé dans le dossier d'introduction en bourse d'aujourd'hui qu'elle avait obtenu une facilité de crédit renouvelable de 125 millions de dollars auprès de Morgan Stanley. Les fonds serviront à financer des accords avec des développeurs et des opérateurs de centres de données. Cerebras étend la capacité de son centre de données pour soutenir la croissance de ses services Training Cloud et Inference Cloud, qui donnent accès à l'infrastructure d'IA hébergée.

Les services de la société sont alimentés par sa puce phare WS-3. Il s'agit d'un accélérateur d'IA 58 fois plus grand que le B200, une carte graphique haut de gamme de Nvidia Corp. qui a fait ses débuts en 2024 et reste très populaire. Le WSE-3 contient 4 000 milliards de transistors organisés en 900 000 cœurs.

Selon Cerebras, Morgan Stanley augmentera sa ligne de crédit renouvelable jusqu'à 850 millions de dollars après l'introduction en bourse. La société a également révélé dans le dossier qu'elle avait reçu un prêt distinct d'un milliard de dollars d'OpenAI Group PBC.

En décembre dernier, le développeur ChatGPT a accepté d'acheter une infrastructure d'inférence d'une valeur de 750 mégawatts auprès de Cerebras. Le fabricant de puces a révélé aujourd'hui que l'accord valait plus de 20 milliards de dollars. De plus, cela donne à OpenAI la possibilité d’ajouter 1,25 gigawatts supplémentaires de capacité jusqu’en 2030.

Cerebras a émis des bons de souscription OpenAI pour acheter jusqu'à 33,4 millions d'actions. Ces bons de souscription seront acquis si le développeur de modèles d'IA met en œuvre son projet d'achat de 2 gigawatts de capacité de calcul d'ici 2030. Cerebras a déclaré dans son dossier d'introduction en bourse que le contrat « représente une partie substantielle de nos revenus projetés au cours des prochaines années ».

Le mois dernier, Cerebras encré un accord de puce de haut niveau avec un autre client de haut niveau. Amazon Web Services Inc. a accepté de déployer le WSE-3 dans ses centres de données dans le cadre d'une nouvelle « architecture désagrégée ».

Le flux de travail via les invites de processus des grands modèles de langage comprend deux étapes appelées étapes de pré-remplissage et de décodage. L'architecture désagrégée d'AWS utilisera ses puces AWS Trainium développées en interne pour effectuer des calculs de pré-remplissage. Le WSE-3, quant à lui, sera responsable de la phase de décodage.

Les calculs de décodage sont similaires à ceux utilisés par le workflow de pré-remplissage, mais ils nécessitent plus de bande passante mémoire. Il s'agit d'une mesure de la vitesse à laquelle les données peuvent circuler entre les circuits logiques et mémoire d'une puce. Le WSE-3 fournit 27 pétaoctets par seconde de bande passante mémoire, soit plus de 200 fois la quantité offerte par l'interconnexion NVLink de Nvidia.

La feuille de route des produits de Cerebras « inclut le développement d'une solution de service d'inférence désagrégée », a déclaré la société dans son dossier d'introduction en bourse. « L'inférence désagrégée permettrait à Cerebras de fonctionner aux côtés d'autres architectures, servant de moteur de décodage hautes performances tandis que d'autres systèmes gèrent le pré-remplissage. »

Le dossier laisse entendre que la plate-forme d'inférence désagrégée de Cerebras fonctionnera avec d'autres puces tierces en plus de Trainium. Il est possible que l'offre prévue soit construite sur une version du CS-3, l'appliance du centre de données de l'entreprise. Il combine un seul WSE-3 avec un équipement de refroidissement, des composants de gestion de l'alimentation et d'autres matériels de support. Un outil logiciel intégré appelé Cerebras Cluster Manager permet de relier des milliers d'appliances CS-3 en un seul cluster.

Cerebras prévoit de coter ses actions au Nasdaq sous le symbole « CBRS ».

Photo de : Cérébras

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine