L’adoption de l’intelligence artificielle grand public s’accélère à un rythme vertigineux et vous le vivez très certainement. Google annonce que Gemini a plus que doublé sa base d’utilisateurs en un an, passant de 400 millions à plus de 900 millions de personnes par mois à travers le monde. Et pour répondre à cette demande massive, la firme de Mountain View insuffle une dimension inédite à son écosystème : l’ère des agents autonomes.

Un écosystème réinventé : du modèle ultrarapide à la vidéo sur mesure
Au cœur de cette offensive technologique se trouve tout d’abord Gemini 3.5 Flash, la toute nouvelle itération de modèle conçue par Google pour allier une vitesse d’exécution fulgurante à des capacités de raisonnement de pointe. Cette puissance brute s’accompagne d’une refonte esthétique et ergonomique totale baptisée « Neural Expressive » (que j’ai découvert ce matin sur mobile). Terminées les réponses sous forme de blocs de texte austères. L’interface adopte un design dynamique, un peu plus coloré, riche en animations et retours haptiques, capable de générer en temps réel des graphiques interactifs, des frises chronologiques ou des narrations vidéo. Gemini Live y est désormais nativement intégrée, avec un micro recalibré pour capter les pensées à voix haute sans coupure intempestive, et l’arrivée prochaine de dialectes régionaux. Et le résultat est vraiment convaincaint :


Pour les créateurs, Google introduit Gemini Omni. Ce modèle de génération vidéo permet de transformer des requêtes textuelles, des images ou des rushes de smartphone en productions cinématographiques de haute qualité. Par simple discussion, l’utilisateur peut ajuster les zooms, modifier les arrière-plans ou même intégrer son propre avatar IA photoréaliste et vocal au sein de la vidéo. Ce n’est pas une simple itération de Veo mais vraiment une rupture dans la création vidéo, c’est vraiment impressionnant et en même temps effrayant pour l’avenir de la production humaine :
L’avènement des agents : Daily Brief et Gemini Spark
La véritable rupture qui fait le titre de cet article réside dans la capacité de l’IA à agir de manière proactive. Deux nouveautés majeures vont incarner ce tournant ce :
- Daily Brief : cet agent propose chaque matin un condensé hautement personnalisé pour commencer la journée. En s’exécutant de manière transparente à travers Gmail ou Google Calendar, il ne fait pas que résumer les courriels urgents et les rendez-vous, il hiérarchise les priorités en fonction des objectifs de l’utilisateur et suggère des actions immédiates.
- Gemini Spark : il se présente comme un bras droit numérique fonctionnant sous Gemini 3.5 et adossé à l’infrastructure Antigravity, cet agent travaille en continu 24/7 dans le Cloud, même lorsque le téléphone est verrouillé ou l’ordinateur fermé. Profondément intégré à Workspace, Spark pourra être sollicité pour tous types de demandes. Par exemple Il peut trier des relevés bancaires pour débusquer des abonnements cachés, compiler les e-mails scolaires pour concevoir un agenda familial partagé, ou synthétiser des notes de réunion complexes pour générer un document officiel et un projet de mail de lancement. Son contexte d’ouverture est grand et l’est encore plus au travers de son protocole MCP permettant la communication avec des applications tierces telles que Canva, OpenTable, Instacart… Il sera disponible qu’à partir de la semaine prochaine aux USA et pour les abonnés Gemini Ultra (oui, il faut pouvoir supporter les machines virtuelles).
Gemini s’empare du bureau sur Mac
Dès cet été, l’application Gemini sur MacOS, que j’utilise de temps à autre sur Macbook Neo, intégrera nativement Gemini Spark pour automatiser des flux de travail locaux et interagir directement avec les fichiers de la machine. De plus, une fonction vocale avancée permettra de dicter ses pensées de manière fluide : l’IA analysera le contexte de l’écran pour retranscrire et reformater instantanément le texte à l’emplacement exact du curseur, en éliminant les hésitations de langage.

Fondateur de Chromebook Live/Tech Live et de la société de services Blicom et passionné de Chromebook, je vous partage les actualités incontournables sur les Chromebooks et Chrome OS ainsi que mes retours d’expérience sur ces sujets avec une approche utilisateur mais business aussi. Localisation : Paris & Internet.
