Un généraliste publie un modèle de base d'intelligence robotique GEN-1 hautement performant

Startup d'intelligence artificielle Généraliste AI Inc.une startup axée sur l'intelligence robotique incarnée, a sorti GEN-1un modèle de base très performant pour l'apprentissage des robots et la maîtrise des tâches physiques.

Le nouveau modèle, qui a fait ses débuts vendredi, arrive à peine cinq mois après le lancement de l'entreprise. lancé GEN-0une nouvelle classe de modèles de base robotique qui a permis à l'entreprise de former des modèles d'IA en s'entraînant directement sur des données brutes de mouvement.

Selon l’entreprise, GEN-1 représente un formidable pas en avant dans le domaine de l’intelligence robotique. Il permet aux machines de maîtriser rapidement les tâches, d’apprendre des interactions, de réagir rapidement et de relever les défis à un rythme jamais vu auparavant. Sur plusieurs tâches, il a un taux de réussite qui dépasse les 99 %. Il peut également exécuter des tâches presque trois fois plus rapidement que les modèles de pointe actuels et récupérer plus rapidement des interruptions.

Les chercheurs ont déclaré avoir travaillé sur trois domaines principaux : la fiabilité, la vitesse et l’improvisation.

Bien que la plupart des modèles puissent déjà répéter des tâches de manière fiable dans le monde réel, ils sont limités à des mouvements répétitifs spécifiques à une tâche et souffrent d'une complexité réduite en effectuant des actions plus simples. GEN-1 est conçu pour gérer des tâches étape par étape plus longues, telles que l'assemblage d'articles, le pliage de plusieurs pièces de linge et d'autres tâches qui nécessitent un raisonnement complexe dans le temps et dans l'espace sans se confondre.

La vitesse est également souvent un problème avec la robotique, qui ralentit souvent lorsque trop d'objets se trouvent dans le champ de vision ou se déplacent trop rapidement. Une partie du problème pour la plupart des modèles consiste à transmettre assez rapidement ce qu'ils voient au moteur de raisonnement, en traduisant la vision en langage et en données d'entraînement. Cela ralentit souvent le mouvement, ce qui peut entraîner des écarts et des bégaiements. Comme mentionné ci-dessus, l’équipe a réussi à accélérer presque trois fois, ce qui a permis d’obtenir des mouvements plus fluides.

Par exemple, le modèle peut assembler une boîte en 12,1 secondes environ, ce qui, selon la société, est environ 2,8 fois plus rapide que le modèle de pointe le plus proche du secteur. GEN-0 et pi-0, un autre modèle d'intelligence robotique bien connu de Physical Intelligence, ont mis 34 secondes pour une boîte identique.

Ces deux innovations se rejoignent dans le troisième résultat, qui est le plus important : la capacité à se remettre des interruptions, à apprendre des changements de l'environnement, des erreurs et des changements. En termes humains, c'est de l'improvisation.

Lorsque quelque chose n'a pas tout à fait de sens, qu'une pièce sort d'un trou, qu'une boîte rate sa cible ou qu'une porte ne se verrouille pas, un humain revient généralement en arrière et termine l'action. Une IA peut avoir de nombreuses réactions différentes, notamment une réévaluation forcée, une rupture de modèle ou l’échec de la tâche. Il se peut même qu’il ne se souvienne plus de la manière de réagir face au même événement dans le futur. L’humain le ferait.

Les chercheurs affirment que GEN-1 peut réagir de manière créative à ces facteurs en s’adaptant rapidement aux « problèmes » de l’environnement, tels que des objets qui glissent, des loquets défaillants, des objets qui se déforment ou des choses qui ne se passent pas comme prévu. Il abordera les choses sous différents angles, ajustera sa réflexion et essaiera différents modèles jusqu'à ce que quelque chose fonctionne.

Un exemple classique pourrait être le pliage d’une chemise. Amener le tissu exactement là où vous le souhaitez n'est pas toujours une tâche facile : il peut flotter, s'enrouler, se déformer et se froisser. Parfois, la chemise se retourne même. Lorsque ces situations se présentent, l’IA s’adapte rapidement pour réparer le désordre et le gérer sans créer un problème pire.

Les chercheurs ont déclaré que le modèle planifie et fonctionne autour de sa formation de manière moins rigide que ses données de formation. En termes plus humains : il sort des sentiers battus.

Bien que les chercheurs de Generalist aient eu des choses élogieuses à dire sur GEN-1, ils ont ajouté que toutes les tâches n'atteignaient pas le taux de réussite de 99 %. Certaines tâches complexes ne parvenaient pas à atteindre cette barre ambitieuse, en particulier à une vitesse et une fiabilité raisonnables pour être utiles au quotidien.