Ineffable Intelligence Ltd., une startup britannique d'intelligence artificielle fondée il y a quelques mois, a levé 1,1 milliard de dollars en financement de démarrage.
Ineffable Intelligence est dirigé par l’éminent chercheur en IA David Silver. Il a auparavant travaillé plus d'une décennie chez DeepMind, l'unité d'apprentissage automatique d'Alphabet Inc.. Il était le principal développeur du projet révolutionnaire AlphaGo modèle que le laboratoire a lancé en 2016.
AlphaGo a battu le joueur de Go le mieux classé au monde dans une série de matchs regardés par plus de 200 millions de personnes. DeepMind a ensuite utilisé les technologies qui sous-tendaient le modèle pour créer une IA optimisée pour les mathématiques appelée AlphaProof. En 2024, AlphaProof est devenu le premier réseau de neurones à remporter une médaille aux Olympiades internationales de mathématiques.
Les modèles d'IA répondent aux questions des utilisateurs sur la base des connaissances existantes qu'ils collectent à partir de sources telles que le Web public. Selon FilaireIneffable Intelligence cherche à construire un modèle d'IA capable d'acquérir des connaissances entièrement nouvelles. La startup estime qu’un tel algorithme, qu’elle qualifie de superapprenant, pourrait accélérer les projets de recherche scientifique et d’ingénierie.
Ineffable Intelligence prévoit de développer le superapprenant en utilisant l'apprentissage par renforcement. Il s'agit d'une méthode courante de formation en IA qui se prête, entre autres tâches, à la création de grands modèles de langage.
Le concept principal de l’apprentissage par renforcement est de fournir à une IA des exemples de tâches et d’observer dans quelle mesure elle les accomplit. Cette surveillance est généralement assurée par un deuxième réseau neuronal, moins avancé, appelé modèle enseignant. Le modèle d'enseignant fournit à l'IA en cours de formation un retour d'information qu'elle utilise pour affiner son résultat.
Il existe de nombreuses mises en œuvre de l’apprentissage par renforcement. Une approche courante consiste à équiper un modèle d’IA d’une base de données des situations courantes qu’il rencontrera en production. Cette approche, connue sous le nom d’apprentissage par renforcement basé sur un modèle, accélère la formation en IA.
D'autres techniques d'apprentissage par renforcement n'utilisent pas de base de données et donnent plutôt la priorité à l'adaptabilité du modèle. Une autre méthode, RLHF, fournit le modèle d'enseignant qui guide le processus de formation en IA avec les commentaires des humains. Les commentaires humains peuvent améliorer considérablement la qualité des résultats de l’IA.
L'apprentissage par renforcement est généralement appliqué à des modèles qui ont déjà été calibrés via un processus appelé pré-formation. Ineffable Intelligence prévoit de sauter cette étape. De plus, elle placera ses modèles d’IA dans des simulations qui leur permettront d’apprendre les uns des autres.
AlphaGo, le modèle d'IA développé par Silver chez DeepMind, a utilisé une approche similaire. Il a joué des millions de matchs de Go contre lui-même pour développer de nouvelles tactiques qui n'étaient pas disponibles dans les ensembles de données d'entraînement.
L'augmentation d'Ineffable Intelligence intervient deux mois après AMI Labs Inc., une autre start-up d'IA en phase de démarrage avec un fondateur éminent, sécurisé 1,03 milliard de dollars de financement. Le directeur général Yann LeCun avait déclaré à l'époque que l'entreprise prévoyait de développer des modèles mondiaux optimisés pour des tâches telles que le raffinement de la conception des composants d'avions.