Sail Research lève 80 millions de dollars pour optimiser les agents d'IA à long terme

La startup d'inférence d'intelligence artificielle Sail Research Inc. a annoncé aujourd'hui avoir levé 80 millions de dollars de financement pour une valorisation de 450 millions de dollars.

Sail Research exploite une plate-forme cloud que les développeurs peuvent utiliser pour exécuter des agents d'intelligence artificielle à long terme. Selon l'entreprise, son infrastructure permet aux agents d'effectuer des tâches qui prennent plusieurs semaines. De plus, Sail Research affirme pouvoir exécuter de telles charges de travail à une fraction du prix facturé par ses concurrents.

La société affirme que sa plate-forme est alimentée par des versions personnalisées de plusieurs moteurs d'inférence open source. Un moteur d'inférence est un outil qui réduit l'utilisation matérielle des modèles d'IA. L'un des outils les plus utilisés dans cette catégorie est vLLM, qui doit en partie sa popularité à un algorithme appelé PagedAttention. L'algorithme accélère l'inférence en permettant aux modèles d'IA d'utiliser plus efficacement la mémoire intégrée des cartes graphiques.

Sail Research exécute des agents IA dans des machines virtuelles basées sur Linux appelées Sailboxes. Les développeurs peuvent personnaliser chaque machine virtuelle en installant une image, un ensemble de modules logiciels et paramètres de configuration. De plus, la plateforme permet de relier plusieurs Sailbox dans un ensemble d’agents IA.

Un agent IA accomplit des tâches à long terme en les décomposant en petites étapes et en les accomplissant les unes après les autres. Certaines étapes nécessitent que l'agent attende qu'un système externe récupère les données. Selon Sail Research, sa plateforme permet d'arrêter les agents IA pendant qu'ils attendent et ainsi de réduire les coûts d'infrastructure.

La société a évalué sa plateforme à l'aide d'un benchmark appelé BrowseComp-Plus avant l'annonce de financement d'aujourd'hui. Le test mesure la capacité des agents IA à effectuer des tâches de recherche en ligne complexes qui prennent beaucoup de temps. Selon Sail Research, sa plateforme a atteint un nouveau score élevé de 90,72 % tout en supportant un dixième des coûts d'inférence des services concurrents.

« Contrairement à un humain qui attend devant un clavier (priorité absolue : la vitesse), les agents ont besoin d'évolutivité, de fiabilité et de coûts durables », a écrit le co-fondateur et PDG Neil Movva dans un communiqué. article de blog. « Sail retrouve cette efficacité partout dans la pile : nous choisissons soigneusement nos puces, écrivons des moteurs d'inférence personnalisés et exploitons un contrôleur global qui utilise pleinement chaque ordinateur de notre flotte. »

Sail Research utilisera son financement nouvellement levé pour améliorer son infrastructure d'inférence.

Photo: Recherche de voile

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine