Gemini 3 est là : la nouvelle IA de Google arrive sur le moteur de recherche avec le « Mode AI » et promet de détruire ChatGPT et ses autres concurrents

Google a présenté Gemini 3, son nouveau modèle d'intelligence artificielle. L’entreprise l’appelle son système de raisonnement le plus avancé à ce jour (quelqu’un s’attendait-il à autre chose ?). De Mountain View, ils mentionnent qu'il a été spécialement conçu pour capturer la profondeur et les nuances des interactions.

La chose la plus importante pour l'utilisateur est que Gemini 3 sera disponible en standard dans le moteur de recherche Google renouvelé via le mode AI. C'est la première fois que Google intègre les capacités de son modèle d'IA de pointe directement dans le moteur de recherche dès le premier jour.

Cette nouvelle version est également disponible aujourd'hui dans l'application Gemini, ainsi que pour les développeurs via AI Studio, Vertex AI et sa nouvelle plateforme de développement d'agents, Google Antigravity. Le modèle Gemini 3 Pro est lancé en version préliminaire. Il inclut la prise en charge de 30 nouvelles langues, dont le catalan, le basque et le galicien.

Raisonnement et dossier de preuve « niveau PhD »

Selon les données fournies par Google, le Gemini 3 Pro surpasse « considérablement » son prédécesseur, le 2.5 Pro, dans tous les principaux tests de référence en matière d'IA.

Il est en tête du classement LMArena avec 1 501 points, dépassant de 50 ELO le modèle précédent qui détenait le record, Gemini 2.5 Pro. Bien sûr, il convient de rappeler ici le fiasco de Llama 4 dans l'arène, lorsque Meta a utilisé un modèle qui n'était plus celui qu'il avait mis entre les mains des utilisateurs.
Google revendique un raisonnement de « niveau PhD » en obtenant 37,5 % au Humanity's Last Exam (sans outils) et 91,9 % au GPQA Diamond.
Établit une nouvelle norme en mathématiques avec 23,4% dans MathArena Apex, là où ses rivaux ne dépassent pas 1,6% (Claude Sonnet 4,5)
En compréhension multimodale (texte, images, vidéos), il atteint des scores de 81% en MMMU-Pro et de 87,6% en Vidéo-MMMU.

Autre nouveauté, le modèle sera plus direct : Google assure préférer proposer des informations précieuses plutôt que de recourir à des clichés, en disant « ce que vous avez besoin d'entendre, pas seulement ce que vous voulez entendre ». C'est probablement quelque chose que nous remarquerons bientôt (comme le manque « d'humanité » de GPT-5 contre 4o) au lancement), mais la question est de savoir ce que nous remarquerons d'autre. Le grand défi : que Gemini 3 Pro ne paraisse pas plus « bête » avec le temps.

Pour les problèmes plus complexes, Gemini 3 propose le mode Deep Think. Avec ce mode, toujours selon ses tests, Google a encore amélioré les résultats, atteignant 41,0% dans Humanity's Last Exam et 45,1% dans ARC-AGI 2 (avec exécution de code). L'accès à Deep Think sera disponible pour les abonnés Google AI Ultra dans les semaines à venir.

Applications multimodales et fenêtre contextuelle

L'une des grandes nouveautés est la capacité de synthétiser de manière fluide des informations selon différentes modalités (texte, images, vidéo, audio et code). Ceci est réalisé grâce à sa fenêtre contextuelle de 1 million de jetons.

Cela permet par exemple à l’utilisateur de déchiffrer et de traduire des recettes manuscrites dans différentes langues pour créer un livre de recettes familial. Vous pouvez également analyser des vidéos sportives, comme un match de pickleball, pour identifier les domaines à améliorer et générer un plan d'entraînement.

Une autre application consiste à analyser des articles universitaires complexes et à générer du code pour créer des guides interactifs et des visualisations qui aident à comprendre le matériel.

Agents de planification et plateforme antigravité

Gemini 3 est le meilleur modèle de codage collaboratif et autonome créé par Google. En tête du classement de Arène de développement Web avec un score ELO impressionnant de 1 487.

Pour en profiter, Google lance Google Antigravity. Il s'agit d'une nouvelle plateforme de développement basée sur des agents. Les agents antigravité ont un accès direct à l'éditeur, au terminal et au navigateur.

Selon l'entreprise, ces agents peuvent planifier et exécuter de manière autonome des tâches logicielles complexes et de bout en bout. Pour le démontrer, ils donnent le chiffre obtenu dans le benchmark Vending-Bench 2, qui teste la planification à long terme dans une entreprise simulée. Dans ce test, Gemini 3 Pro atteint 5 478 dollars, contre 573 pour Gemini 2.5 Pro ou 3 838 pour Claude Sonnet.

Images | Google