Google anunció una función innovadora en Google Meet: traducción de voz en tiempo real entre inglés y español , que mantiene la voz original del hablante . Presentada durante el evento Google I/O 2025 , la herramienta está impulsada por el modelo de inteligencia artificial Gemini y se encuentra disponible en fase beta para usuarios de los planes Google AI Pro y AI Ultra .
Traducción en Google Meet
La nueva función permite que usuarios que hablen en inglés o español sean entendidos al instante en el idioma contrario , sin perder el tono ni el timbre de su voz. Utiliza una técnica de clonación vocal que simula un doblaje en vivo, generando una experiencia más natural.
“ La conversación fluye como si todos hablaran el mismo idioma ”, explicó un vocero de Google durante la presentación. La IA analiza el audio en tiempo real y entrega una traducción casi sin latencia.
La función apunta a facilitar reuniones internacionales, equipos multilingües y eventos globales. Se espera que transforme la comunicación empresarial y académica.
Funciona, pero aún no para todos
Por el momento, la herramienta está en fase beta y disponible solo para usuarios suscritos a los planes AI Pro y AI Ultra . No se ha informado cuándo llegará a más usuarios o al plan gratuito.
Además, solo traduce entre inglés y español . Google confirmó que ampliará el soporte a más idiomas, aunque sin fechas definidas ni lenguas confirmadas.
Pese al entusiasmo, se advierte que la herramienta podría presentar errores, especialmente en contextos técnicos, con acentos regionales marcados o en entornos con mucho ruido .
Una estrategia más amplia de Google con la IA
Esta innovación se suma a otros anuncios realizados en Google I/O 2025 , como mejoras en generación de contenido y procesamiento de lenguaje natural. Google busca integrar la IA en herramientas de colaboración para facilitar la productividad global.
La traducción en tiempo real representa un salto respecto a soluciones anteriores. A diferencia de traductores automáticos tradicionales, esta tecnología preserva la identidad vocal del usuario , lo que mejora la comprensión y reduce el impacto emocional del cambio de voz.