Gemini Omni Flash et Nano Banana 2 Lite de Google prennent en charge la création de contenu multimédia fluide à moindre coût

Google LLC améliore ses capacités d'intelligence artificielle générative pour les créateurs avec le lancement de deux nouveaux modèles axés sur les médias dans la plateforme Gemini Enterprise Agent.

Les nouveaux ajouts sont Gemini Omni Flash et Nano Banana 2 Lite, et selon Google, ils sont conçus pour une génération d'images et de vidéos de meilleure qualité à des prix inférieurs, avec certains des rapports coût-performance les plus compétitifs actuellement disponibles. Avec les nouveaux modèles, les créateurs bénéficieront de délais de génération d'actifs plus courts et de coûts de production réduits, ce qui leur permettra de créer davantage de contenu multimédia de haute qualité à grande échelle, a déclaré Google.

La plateforme d'agents Gemini Enterprise est conçue pour les entreprises qui souhaitent déployer des agents d'IA autonomes à grande échelle. Il s'est avéré particulièrement populaire auprès des créateurs et des spécialistes du marketing numérique, leur fournissant un environnement unifié leur permettant d'intégrer des outils multimédias sophistiqués dans des flux de travail agents et de rationaliser la création de contenu automatisée. Ainsi, plutôt que de basculer entre différents éditeurs de vidéos et d’images, ils peuvent concevoir, créer, remixer et publier des ressources numériques à partir d’un emplacement centralisé.

Disponible en avant-première publique à partir d'aujourd'hui, Gemini Omni Flash est un modèle multimodal avancé destiné à la génération vidéo et audio haut de gamme. Selon Michael Gerstenhaber, vice-président de la gestion des produits chez Google Cloud, il s'agit de l'un des modèles les plus agressifs de ce type, les utilisateurs ne facturant que 10 cents par seconde de sortie vidéo. Le modèle se distingue par ses outils d'édition conversationnelle, qui permettent aux utilisateurs d'échanger des personnages, d'ajuster les angles de caméra et de rallumer les scènes en utilisant uniquement des commandes en langage naturel.

Les créateurs peuvent également télécharger des vidéos, du texte et des images sur le modèle pour faciliter la génération de contenu, en lui demandant de refléter le style de ces entrées dans ses propres sorties, par exemple. Gemini Omni Flash excelle dans la génération de vidéo avec audio synchronisé, a déclaré Gerstenhaber. La société a également introduit des fonctionnalités de synchronisation du texte et des actions dans le modèle afin de garantir que tout texte dans les vidéos apparaît fluide et lisible, même s'il y a un mouvement à l'écran ailleurs.

Les premiers utilisateurs ont déjà largement utilisé les nouvelles fonctionnalités de Gemini Omni Flash. Le géant mondial du marketing WPP plc a intégré le modèle à sa plateforme agentique WPP Open pour permettre un meilleur contrôle sur la production de contenu généré par l'IA. Nishant Tahilramani, directeur créatif de la plateforme vidéo IA Invideo Inc., s'est dit particulièrement impressionné par les capacités d'effets visuels du modèle et par la manière dont ils permettent de mélanger les techniques de réalisation de films traditionnelles avec les outils d'IA sur les mêmes productions.

Quant au Nano Banana 2 Lite, il a été optimisé principalement pour la vitesse brute. Gerstenhaber a déclaré qu'il pouvait produire des images de haute qualité et de qualité professionnelle en seulement quatre secondes, afin que les créateurs puissent répéter leurs idées aussi vite qu'ils peuvent les imaginer.

Selon Gerstenhaber, Nano Banana 2 Lite a bénéficié d'améliorations significatives en termes de qualité visuelle par rapport à son prédécesseur, désigné sous le nom de Gemini 2.5 Flash Image. Par exemple, il possède une « connaissance du monde » plus complète qui lui permet de mieux générer des maquettes localisées.

Par exemple, si quelqu'un souhaite générer une toile de fond des Highlands écossaises, Nano Banana 2 Lite créera une scène qui reflète parfaitement le lieu. Le modèle prend également en charge une meilleure cohérence des personnages pour des tâches telles que le storyboard.

Une fois de plus, le premier accueil est très prometteur. Idan Yonas, directeur du contenu et de l'innovation IA chez Artlist Ltd., société de plateforme d'actifs créatifs, a déclaré que la vitesse de génération rapide du modèle signifie que la génération est désormais plus rapide que l'idéation, permettant aux créateurs de rester « à l'intérieur de l'idée » au lieu de se laisser distraire en attendant une barre de progression.

Un autre client est la plate-forme de conception Figma Inc., qui utilise le modèle dans le canevas Figma Weave pour permettre une itération de mise en page plus rapide. Pendant ce temps, Manus AI l'a intégré dans des flux de travail autonomes pour prendre en charge la création rapide d'actifs visuels dans des pages Web et des présentations de diapositives, indique-t-il.

Gerstenhaber a déclaré que Nano Banana 2 Lite est disponible à partir d'aujourd'hui avec un débit provisionné via la plateforme d'agent Gemini Enterprise, et Gemini Omni Flash devrait être déployé « bientôt ». Les deux nouveaux modèles prennent en charge les informations d'identification de contenu CP2A et les filigranes SynthID qui garantissent l'authenticité de tous les médias qu'ils génèrent.

Newsletter

Rejoignez notre newsletter pour des astuces chaque semaine