La start-up britannique de puces d'inférence Fractile empoche 220 millions de dollars pour accélérer la consommation de jetons

La start-up britannique de puces d'inférence d'intelligence artificielle Fractile Ltd. a annoncé aujourd'hui avoir clôturé une ronde de financement de série B de 220 millions de dollars.

La société a été fondée en 2022 par Walter Goodwin (photo), ingénieur en puces formé à l'Université d'Oxford, qui en est le directeur général. Il a aidé à concevoir les puces d'inférence spécialisées de Fractile, ciblant les charges de travail alimentées par des modèles d'IA entraînés.

Selon Goodwin, la société cible ce qu'elle considère comme la principale contrainte à laquelle sont confrontés les modèles frontières les plus avancés au monde, à savoir le temps qu'il leur faut pour générer des résultats après y avoir été invité. À mesure que les modèles d’IA grandissent et deviennent de plus en plus sophistiqués, ils nécessitent désormais des dizaines de millions de « jetons », qui constituent l’unité de mesure de base de l’informatique avancée, pour résoudre des problèmes difficiles ou accomplir les tâches assignées. Cependant, ces tokens nécessitent de déplacer de nombreuses données entre le processeur et sa mémoire associée, ce qui augmente la latence, et donc le temps de réponse aux requêtes.

Pour contourner ce problème, Fractile a développé une nouvelle puce logique dotée d'une architecture qui connecte la mémoire pour qu'elle s'insère dans un rack de serveur standard. La conception permet de réduire la latence et d'optimiser la bande passante sans sacrifier la vitesse, a indiqué la société. Bien que Fractile ait gardé les spécifications techniques du fonctionnement de ses puces près de sa poitrine, Goodwin a déclaré au Wall Street Journal qu'il n'utilise pas de mémoire traditionnelle à large bande passante, ni de mémoire statique à accès aléatoire ou SRAM sur puce. Cela suggère qu'il est basé sur une conception entièrement nouvelle.

Selon Goodwin, les puces de Fractile peuvent aider à accélérer considérablement les charges de travail d'IA, et également à en permettre de toutes nouvelles qui ne sont pas possibles sur les unités de traitement graphique standard, qui sont les puces d'IA les plus largement utilisées aujourd'hui.

« Compresser un mois de travail en une journée, un week-end de calcul en laboratoire en une pause-café rendra tout ce travail radicalement plus rapide, mais cela rendra également des cas d'utilisation de l'IA beaucoup plus ambitieux économiquement viables », a écrit Goodwin dans un article de blog annonçant le cycle. « Le travail déterminant du 21e siècle sera marqué par le moteur d’inférence délivrant d’immenses et diffuses chaînes de recherche intellectuelle, dans la découverte de médicaments, en génie logiciel, en découverte de matériaux, dans tout domaine où l’humanité bénéficiera d’un pur travail intellectuel pour résoudre des problèmes complexes. »

De telles affirmations alléchantes seront mises à l’épreuve en temps voulu, et Fractile devra montrer qu’il peut être à la hauteur s’il veut se démarquer sur un marché de plus en plus concurrentiel pour les puces d’inférence spécialisées. Ces dernières années, de nombreux spécialistes des puces d'inférence ont émergé, dans l'espoir de prendre des parts de marché à Nvidia Corp., le leader du marché des puces d'IA.

Ces concurrents incluent Cerebras Systems Inc. et ses puces WSE-3 de la taille d'une assiette, qui ciblent également les charges de travail de production d'IA. Cerebras devrait entrer en bourse demain via une introduction en bourse qui permettra de lever au moins 5,5 milliards de dollars, la plus grande introduction en bourse du secteur depuis des années.

D'autres rivaux incluent SambaNova Systems Inc., qui a récemment cimenté un partenariat avec Intel Corp., et des startups telles que Untether AI Inc. et Graphcore Inc. Elle affronte également Nvidia elle-même, qui a récemment lancé l'unité de traitement linguistique Groq 3 pour les charges de travail d'inférence, et des géants du cloud public tels qu'Amazon Web Services Inc. et Google Cloud, qui disposent également de puces d'inférence dédiées. OpenAI Group PBC pourrait être un autre rival, car on pense actuellement qu'il travaille avec Broadcom Inc. et Taiwan Semiconductor Manufacturing Co. Ltd. sur sa propre conception de puce d'inférence.

La start-up britannique de puces d'inférence Fractile empoche 220 millions de dollars pour accélérer la consommation de jetons

Photo de : Fractile