Ciència

Google Meet tradueix veus en temps real

La traducció de veu amb Gemini, en beta a anglès i espanyol, s’ampliarà aviat a italià, alemany i portuguès

Google ha aprofitat el Google I/O 2025 per reforçar el seu lideratge en intel·ligència artificial amb una sèrie de novetats que deixen ChatGPT d’OpenAI en una posició més relegada. La primera i més destacada és la traducció de veu en temps real a Google Meet: els usuaris d’AI Pro i Ultra poden activar a la seva sessió una traducció bidireccional gairebé instantània entre anglès i espanyol, amb la promesa d’incorporar més idiomes en les properes setmanes. Aquesta funció, impulsada pel model multimodal de Gemini desenvolupat per DeepMind, manté el timbre i l’expressivitat originals, i redueix dràsticament la latència perquè les converses de grup flueixin amb naturalitat.

A més, Google ha presentat Gemini 2.5 Pro amb el nou mode Deep Think, que destaca per la seva capacitat de raonament avançat. Segons les dades de la companyia, aquest mode ha obtingut un 49,4% en la prova Usamo 2025 i supera amb escreix els resultats de Gemini 2.5 estàndard, de Gemini 2.5 Flash i de les tecnologies d’OpenAI o3 i o4-mini. Els benchmarks de programació (LiveCodeBench v6) i multimodalitat (MMMU) també situen Deep Think per sobre de la resta, amb puntuacions superiors al 80%.

Paral·lelament, Google ha llançat Veo 3 i Image 4, els seus nous models generatius de vídeo i imatge. Veo 3 inclou suport natiu per a efectes de so, diàlegs o sorolls ambientals, un avenç sense precedents en IA de vídeo. Image 4, en canvi, és fins a deu vegades més ràpid que la versió anterior i ofereix més qualitat, resolució 2 K i millor manejament de textos en les imatges. Tots dos models són accessibles a través de l’app de Gemini (en beta per a Veo 3 i general per a Image 4) i s’integraran en Workspace.

El llançament de Flow, una eina que combina Gemini, Veo 3 i Imagen 4, permet generar clips cinematogràfics a partir de simples instruccions i arxius de referència, amb controls professionals de càmera i possibilitat d’estendre vídeos existents. Aquesta aposta de la companyia de Mountain View que lidera Sundar Pichai per l’“IA universal” situa Google en una posició de privilegi en la cursa pels agents i els assistents intel·ligents, amb funcions que ja es desplegaran aquesta tardor per a empreses i usuaris particulars de Google AI Ultra.

Emprova’t la roba amb IA
El nou mode IA del cercador combina Gemini amb un gràfic de 50 milions de productes per oferir recomanacions personalitzades segons els teus gustos, el lloc i la temporada. A més, et permet carregar una foto de cos sencer per emprovar-te virtualment qualsevol peça, ajustant automàticament talles i estils. Aquesta experiència transforma la compra en línia en temps real.
Jules, l’agent programador
Google ha llançat Jules, un agent autònom basat en Gemini 2.5 Pro, capaç de llegir, escriure, corregir i provar codi sense intervenció humana. Treballa en paral·lel al teu projecte en un entorn aïllat de Google Cloud, presenta un pla de raonament abans d’actuar i mostra les modificacions de manera clara perquè les revisis.


Identificar-me. Si ja sou usuari verificat, us heu d'identificar. Vull ser usuari verificat. Per escriure un comentari cal ser usuari verificat.
Nota: Per aportar comentaris al web és indispensable ser usuari verificat i acceptar les Normes de Participació.
[X]

Aquest és el primer article gratuït d'aquest mes

Ja ets subscriptor?

Fes-te subscriptor per només 48€ per un any (4 €/mes)

Compra un passi per només 1€ al dia