Omen AI lève 31 millions de dollars pour aider les centres de données à éviter des temps d'arrêt coûteux grâce à la surveillance continue du liquide de refroidissement

La startup de surveillance du liquide de refroidissement des centres de données, Omen AI Inc., tente de résoudre l'un des défis les plus urgents mais les moins connus du secteur de l'intelligence artificielle après avoir levé aujourd'hui 31 millions de dollars en financement de série A.

Le problème qu’Omen AI tente de résoudre concerne les bactéries, qui peuvent étonnamment causer des problèmes importants aux puces AI refroidies par liquide. Alors que les centres de données tentent d'intégrer de plus en plus d'unités de traitement graphique dans chaque rack pour augmenter la taille des clusters, ces puces chauffent de plus en plus. Mais le liquide utilisé pour empêcher ces chips de cuire devient plus accueillant pour les bactéries à mesure que ces chips deviennent chaudes.

Dans une interview avec TechCrunch, le fondateur et directeur général d'Omen AI, Zach Laberge, a expliqué que les centres de données utilisent un liquide de refroidissement composé d'eau et d'un additif destiné à supprimer la croissance des bactéries. Cependant, il est parfois nécessaire d'ajouter un peu plus d'eau à ce mélange pour que les copeaux puissent être poussés encore plus fort. Plus d’eau permet au liquide d’absorber plus de chaleur, mais plus le mélange est humide, plus il risque d’être contaminé – non seulement par des bactéries, mais aussi par de minuscules morceaux de métal, parfois microscopiques, et d’autres particules. Le problème est que ceux-ci peuvent à terme empêcher le liquide de circuler comme il le devrait dans le système.

La solution standard consiste à rincer occasionnellement le système, à vider le liquide de refroidissement et à le remplacer par un nouveau mélange. Mais cela signifie mettre hors ligne un rack entier de serveurs pendant cinq ou six heures d'affilée, ce qui peut coûter des millions de dollars aux opérateurs de centres de données. Omen AI propose une alternative avec un système capable de surveiller en permanence la santé du liquide de refroidissement et de détecter les problèmes avant qu'un rinçage ne devienne nécessaire. « Vous ne risquez pas d'énormes temps d'arrêt parce que vous n'avez aucune idée de ce qui se passe chimiquement », a expliqué M. Laberge.

À seulement 21 ans, Laberge est un âge incroyablement jeune pour un fondateur d’entreprise d’infrastructures. Mais il ne manque pas d'expérience. Il a fondé sa première entreprise en 2020 alors qu'il avait encore 14 ans, levant 3 millions de dollars pour intégrer des capteurs aux engins de construction afin que ces machines puissent être mieux entretenues. Laberge a rapidement abandonné ses études pour diriger cette entreprise, avec le plein soutien de ses parents.

Il a lancé Omen en 2024 et ciblait à l'origine le même secteur avec l'idée de construire un système capable de surveiller le fluide contenu dans leurs systèmes pneumatiques, afin que les opérateurs n'aient pas à constamment prélever des échantillons et à les envoyer à un laboratoire pour analyse. L'un des clients d'Omen est le fabricant d'équipements de construction et d'exploitation minière Caterpillar Inc., qui fournit également des turbines et des générateurs pour la production d'électricité sur site dans les centres de données. Lorsque le boom de l'IA a déclenché une construction massive de centres de données à travers le monde, certains concessionnaires Caterpillar se sont fortement impliqués dans ces projets de construction et ont finalement demandé à Omen s'il leur était également possible de surveiller les bâtiments.

C’est à ce moment-là que Laberge s’est rendu compte que les centres de données dépendaient énormément des fluides, depuis leurs systèmes CVC jusqu’aux systèmes de refroidissement des puces. « Prélever un échantillon, l'expédier à un laboratoire et attendre des jours pour obtenir les résultats est dangereusement insuffisant lorsque vous protégez des milliards d'infrastructures GPU et exploitez des machines industrielles », a-t-il déclaré. « Omen AI a été conçu pour éviter les pannes catastrophiques. Nous aidons les centres de données à pousser leur matériel jusqu'à la limite absolue, libérant ainsi des performances de calcul que les opérateurs ne savaient pas qu'ils avaient. »

La société compte désormais parmi ses clients une douzaine d'opérateurs de centres de données, dont Tensorwave, le néocloud qui se concentre exclusivement sur les GPU d'Advanced Micro Devices Inc. Ces clients peuvent choisir entre installer un réseau de capteurs permanent qui se connecte directement au système fluide d'un rack de serveur pour suivre en continu la teneur en métal, la biocontamination et les modèles d'usure, ou une unité de diagnostic portable qui peut être amenée sur n'importe quelle machine pour un diagnostic immédiat. Dans les deux cas, ils surveillent le liquide de refroidissement pour plus de 21 signatures élémentaires, remplaçant ainsi l'ancien modèle « échantillonner et attendre » par une intelligence continue et en temps réel.

Pour Omen AI, il s’agit d’un marché en pleine croissance. Les densités de racks des centres de données IA ont augmenté bien au-delà de ce que les systèmes de refroidissement par air peuvent gérer, c'est pourquoi les investisseurs cherchent de plus en plus à financer des startups capables d'améliorer l'efficacité des systèmes de refroidissement liquide. C'est pourquoi Iceotope a pu lever 26 millions de dollars en financement de série B en mai. Omen AI fait face à un autre concurrent plus direct, Pyxis Lab Inc., qui a lancé le mois dernier son propre système de surveillance de la chimie des liquides de refroidissement.

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine