Meituan Inc., basée à Pékin, en Chine, a lancé aujourd'hui son grand modèle de langage open source LongCat-2.0 de nouvelle génération, déclarant que la société a formé le modèle de 1,6 billion de paramètres sur des puces et des clusters de calcul chinois nationaux.
Le plus grand point à retenir de ce modèle colossal n’est pas seulement la version open source, c’est aussi le matériel national.
Meituan peut initialement sembler un endroit improbable pour les modèles d’IA. Souvent décrite comme la réponse chinoise à DoorDash, l'entreprise a commencé comme la principale plate-forme de livraison de nourriture du pays, mais a évolué vers une combinaison de services comprenant la réservation de voyages et de loisirs, la découverte et l'évaluation d'entreprises locales et les services de covoiturage.
La société s’est lancée sur la scène du développement de modèles d’IA dès 2023 lorsqu’elle a acquis la startup Light Year Beyond pour 281 millions de dollars, mais n’a annoncé ses propres projets internes de développement d’un modèle d’IA qu’en 2025.
À un niveau élevé, LongCat-2.0 suit un modèle de mélange d'experts similaire à celui de Mistral AI et DeepSeek. Il utilise une architecture de routeur interne qui sélectionne un ensemble organisé d'« IA expertes » par jeton plutôt que d'éclairer l'ensemble du modèle en même temps. Cela offre une efficacité de base pour le déploiement et l'inférence des modèles, permettant aux modèles MoE d'évoluer sur du matériel moins cher sans avoir besoin de déployer l'intégralité du modèle pour calculer chaque jeton.
Pesant 1 600 milliards de paramètres, le modèle n’est pas léger et il offre une fenêtre contextuelle de 1 million de jetons. Cela signifie que les utilisateurs peuvent saisir d’énormes quantités de données à la fois. À titre de comparaison, il se situe aux côtés de modèles MoE tels que DeepSeek-R1-0528 et le GPT-OSS open source d'OpenAI Group PBC, qui mettent l'accent sur des empreintes d'activation plus petites et des fenêtres contextuelles standard de 128 000 jetons, tandis que LongCat-2.0 se concentre sur le fait d'être très lourd et de fournir un contexte long.
La société a publié des références pour le modèle, avec des modèles industriels à source fermée ultra-puissants tels que Gemini de Google LLC, GPT-5.5 d'OpenAI et Claude Opus d'Anthropic PBC. La société a déclaré avoir conçu LongCat-2.0 pour fonctionner comme un « cerveau », ou le noyau, des agents d’IA et des harnais de codage tels que Claude Code, OpenClaw et Hermes.
Meituan a déclaré que le modèle offre de solides performances en matière de compréhension du code, de modifications au niveau du référentiel, d'exécution de tâches automatisées et de flux de travail agents. L'objectif est de fournir aux développeurs un outil stable et efficace qui utilise un modèle pour orchestrer les objectifs à long terme et la gestion des tâches.
L'alignement des puces nationales
Selon la société, le nouveau modèle a été à la fois formé et optimisé pour les clusters nationaux de circuits intégrés spécifiques aux applications d'IA, une position qui est nécessaire car la Chine a été par intermittence empêchée d'accéder aux unités de traitement graphique et chipsets basés sur CUDA les plus puissants de Nvidia Corp.
Bien que les puces Nvidia puissent actuellement être acheminées vers la Chine, les turbulences provoquées par les contrôles à l'exportation ont incité le pays à rechercher des alternatives. Selon un rapport de Bernstein, une société mondiale de recherche et de courtage d'actions, on estimait qu'en 2025 Nvidia détenait environ 40 % de part de marché en Chine pour les puces d'IA, soit à peu près égalée par Huawei Technologies Co., Ltd. Bernstein prédit que la part de marché de Nvidia chutera de 8 % cette année, donnant à Huawei une marge de croissance.
L'origine de la formation du modèle signifie qu'il fonctionnera de manière fiable et probablement performante sur les puces disponibles en Chine, tout en réduisant la dépendance à l'égard des logiciels spécifiques à Nvidia et sa domination du marché. La société a déclaré avoir été formée sur les « superpods » ASIC, ce qui suggère un déploiement en entreprise au sein du même écosystème et non sur du matériel tiers.
Avec 1 600 milliards de paramètres, LongCat-2.0 n’apparaîtra pas de sitôt sur le matériel grand public, et il est peu probable qu’il s’exécute sur site pour la plupart des charges de travail d’entreprise. À cette taille, il vivra dans un centre de données ou un environnement cloud, où il pourra être distribué sur des clusters d'inférence haute densité sous gestion, avec un parallélisme de modèles. S'il est réellement architecturé comme le prétend Meituan, alors son raisonnement principal est portable sur d'autres matériels, mais les optimisations de performances resteront sur les puces nationales.