Parasail lève 32 millions de dollars pour son cloud d'inférence payant par jeton

La start-up d'infrastructure d'intelligence artificielle Parasail Inc. a annoncé aujourd'hui avoir levé 32 millions de dollars en financement de démarrage.

La location d'unités de traitement graphique auprès d'un fournisseur de cloud nécessite souvent que les entreprises signent des accords d'approvisionnement à long terme. Cela n’est souvent pas pratique pour les startups disposant de ressources limitées et les entreprises travaillant sur des projets pilotes d’IA à petite échelle. Parasail exploite une plate-forme cloud optimisée pour l'inférence, AI Supercloud, qui permet aux clients d'acheter de la capacité GPU sur une base de paiement par jeton sans contrat à long terme.

La carte graphique la plus avancée actuellement proposée par la société est la H200, lancée par Nvidia Corp. début 2024. Le fabricant de puces a depuis introduit deux nouvelles générations de GPU qui offrent des performances nettement meilleures. Certains GPU de Parasail fonctionnent dans des clusters gérés en interne, tandis que d'autres sont hébergés par des partenaires. La société aurait a accès aux GPU de 40 centres de données dans plus de 15 pays.

La suppression des contrats GPU à long terme n'est pas le seul moyen par lequel la plate-forme Parasail rationalise l'inférence. La société affirme que les développeurs peuvent déployer des charges de travail d’IA avec seulement 5 lignes de code. Une fois qu'un modèle est opérationnel, Parasail automatise les tâches administratives telles que la configuration du noyau. Les noyaux sont les extraits de code optimisés pour le GPU qui constituent un modèle d'IA.

Parasail permet aux clients d'accéder aux puces de plusieurs manières. Il existe deux options d'hébergement sans serveur qui automatisent une grande partie du travail généralement impliqué dans la gestion des clusters GPU. Parasail propose également des points de terminaison dédiés, des environnements matériels qui offrent une certaine simplicité pour de meilleures performances.

Les développeurs peuvent adapter la configuration de leurs points de terminaison dédiés à chaque charge de travail d'IA. Parasail permet de définir comment et quand une nouvelle capacité GPU est ajoutée lorsque le trafic vers un modèle d'IA augmente. De plus, les points de terminaison dédiés prennent en charge une méthode de compression de réseau neuronal appelée quantification qui réduit les coûts d'inférence.

La gamme d'offres d'infrastructure de Parasail est complétée par un service de traitement par lots. Il est destiné aux charges de travail d'IA qui traitent de gros volumes de données et privilégient la rentabilité plutôt que les performances. Un éditeur scientifique, par exemple, pourrait utiliser le service pour résumer les archives d’articles universitaires.

« L'IA est en train de devenir l'infrastructure de base des logiciels modernes. Mais la couche d'infrastructure elle-même n'a pas suivi le rythme », a déclaré Mike Henry, fondateur et PDG de Parasail. « Nous avons construit Parasail pour que les équipes puissent déployer une IA personnalisée à grande échelle sans négocier de contrats, gérer un approvisionnement fragmenté en GPU ou embaucher des équipes d'ingénierie de performance. »

La société utilisera son capital nouvellement levé pour améliorer les fonctionnalités d'optimisation de la charge de travail d'inférence de sa plateforme. De plus, Parasail prévoit de renforcer son écosystème de partenaires et d'investir dans des initiatives de commercialisation.

Photo: Unsplash

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine