Pinecone lance Nexus en avant-première publique pour apporter des connaissances commerciales aux agents IA

Pinecone Systems Inc., une société d'infrastructure d'intelligence artificielle fournissant des bases de données vectorielles entièrement gérées, a lancé mercredi la préversion publique de Pinecone Nexus, qui organise et distribue des connaissances d'entreprise pour les agents d'IA.

L’ère de l’IA agentique est arrivée et elle repose sur les données. La manière dont ces données sont transmises aux agents d’IA devient le pipeline qui décide de la différence entre des réponses précises et l’oubli. L’industrie continue de travailler dur pour trouver la manière de récupérer les informations brutes, de les conditionner et de les transmettre de manière à ce que l’IA puisse les utiliser.

Les collaborateurs manipulent déjà facilement des données provenant de sources multiples en sachant où chercher, grâce à une boussole interne ancrée dans la mémoire institutionnelle. Posez-leur une question et ils se rappellent qu'ils doivent consulter les wikis, les documents sur les ressources humaines, les notes de réunion, les tickets d'assistance et les dossiers financiers pour trouver ce dont ils ont besoin. Les agents IA n'ont pas ce niveau de connaissances. Au lieu de cela, ils ont besoin de cadres, de graphiques et de systèmes de connaissances pour reconstruire ce genre de sentiment de « Je ne sais pas cela par tête, mais je sais où le trouver » à chaque fois que vous les appelez.

Pinecone Nexus est conçu pour organiser l'accès aux connaissances pour les agents IA, leur permettant de raisonner sur des dizaines de fichiers à la fois, sans en récupérer de petits morceaux.

Ce que Nexus apporte à l'industrie

Les agents d'IA ont besoin d'accéder aux données, Nexus fournit donc d'abord des connecteurs pour les récupérer et les importer. Cela inclut le téléchargement de fichiers locaux, Box et Microsoft OneLake en direct aujourd'hui. Google Drive, Slack, GitHub, Notion, Confluence et S3 seront bientôt en préparation.

L'équipe d'ingénierie qui met en place un agent IA travaille dans un conteneur de projet appelé espace de travail qui organise les données en contextes, qui définissent les données sous forme d'ensembles ou de domaines de connaissances. Les équipes individuelles construisent leur propre espace de travail et l'utilisent pour maintenir leur propre base de connaissances cognitives pour leurs agents IA.

Cela passe par la couche de conservation de Nexus, qui utilise des modèles appelés manifestes pour transformer les documents bruts en artefacts de connaissances correspondant à leur contenu.

Essentiellement, Nexus fournit un cadre qui explique le « où trouver ce que vous cherchez » sous-jacent pour l’agent IA. Ceci est similaire à la façon dont un employé ayant plus de trois ans d'expérience dans l'entreprise sait quelle partie des archives financières consulter pour les données d'acquisition ou où chercher la logique métier la plus récente pour le portail Web.

Cela diffère de l'ingénierie rapide, où les utilisateurs ou les ingénieurs doivent apprendre à l'agent où consulter l'heure de la requête, tandis que les manifestes permettent à l'agent de comprendre où se trouvent les connaissances pendant leur conservation. Cela permet aux experts du domaine d'être informés de la catégorisation des informations, garantissant ainsi qu'elles sont prêtes lorsque l'agent IA les récupère.

Dans les benchmarks, Pinecone a déclaré que Nexus avait démontré des performances et une précision élevées.

« Nous pouvons facilement créer une base de données vectorielles et exécuter RAG (et recherche agentique) sur notre corpus de documentation », Jesse Barbour, scientifique en chef des données de Q2 Holdings Inc., une société de solutions de technologies financières basée à Austin. « Le plus difficile est d’amener un agent à rassembler de manière fiable et efficace les bonnes connaissances pour répondre à des questions véritablement difficiles. »

Selon Barbour, Nexus a répondu à des questions d'assistance complexes avec une précision de 95 %. Cela a également permis de maintenir les coûts des jetons à un niveau bas, ce qui en fait une couche de connaissances attrayante à mesure que les prix de l'inférence de l'IA augmentent.

Dans un autre exemple, un fournisseur anonyme de protection et de sécurité des données a testé Nexus sur une tranche de documents contenant des informations répandues, y compris des procès-verbaux de réunions municipales, ce qui signifie que les questions pouvaient traverser plusieurs documents et fragments.

La conservation de 598 documents en 12 types d'artefacts structurés a coûté 2,31 $ et a pris 34 minutes. Les requêtes ultérieures ont atteint une précision d’environ 90 %, contre une référence de 65 % pour le pipeline de génération augmentée par récupération standard de l’industrie.