Aunque los chatbots de IA parecían la tecnología más avanzada hace solo dos años, los asistentes de IA multimodal son ahora la nueva frontera, con empresas lanzando rápidamente asistentes de voz impulsados por IA. Microsoft es la más reciente en unirse a esta carrera.
El martes, Microsoft presentó una versión actualizada de Copilot, destacando especialmente la inclusión de Copilot Voice, un asistente de voz que puede ser interrumpido para tener conversaciones continuas contigo y responder a tus emociones.
Copilot Voice tiene cuatro voces diferentes: Wave, Meadow, Grove y Canyon. Está disponible en todas las plataformas donde puedas acceder a Copilot, incluyendo la app, el sitio web y Windows. ¿La mayor ventaja? Es gratuito para todos los usuarios.
Esto significa que, a diferencia del Modo de Voz de ChatGPT, no necesitas gastar $20 al mes en una membresía premium de IA para usarlo. Aunque el asistente de Google, Gemini Live, también es gratuito con la app de Gemini, está limitado solo a usuarios de Android, mientras que Copilot Voice no lo está.
Entonces, ¿qué tan bien funciona en una conversación? Hoy tuve la oportunidad de probarlo en el evento de Microsoft Copilot y Windows en Nueva York, y me dejó impresionado.
Al conversar con la opción de voz “Wave,” una voz masculina y animada, me sorprendió lo entusiasta que fue el asistente desde el principio. A pesar del ruido de fondo, entendió claramente cada palabra que dije, incluso sin tener que pronunciar cada palabra con cuidado como normalmente lo haría con un asistente de voz.
También llevó la conversación con respuestas rápidas, ingeniosas y, quizás lo más importante, oportunas, sin perder el ritmo. Las respuestas también eran relevantes en contexto, algo que suele ser un problema con los asistentes de voz, que no siempre entienden la intención de lo que dices y, como resultado, dan respuestas extrañas.
En una demostración diferente, una representante de Microsoft pidió a Copilot Voice que la ayudara a resolver el problema de querer adoptar un perro sin que su pareja estuviera de acuerdo. Copilot Voice trabajó diligentemente en el problema, haciendo preguntas de seguimiento para entender mejor la situación y ofreciendo soluciones bastante sólidas, comparables a lo que sugeriría un ser humano.
Entonces, la pregunta clave: ¿cómo se compara con Gemini Live y el Modo de Voz de ChatGPT? En mi experiencia, lo encontré igual de bueno, funcionando de manera casi idéntica. La única gran diferencia es que cualquiera puede aprovecharlo sin tener que pagar una suscripción o poseer un dispositivo específico, lo cual es una ventaja para mí.
El despliegue del Modo de Voz comienza hoy. Si estás interesado en acceder a él, crea una cuenta de Microsoft, descarga la app gratuita de Copilot si planeas usarlo en tu teléfono, o actualiza la app si ya la tienes instalada.
Al momento de escribir esto, tengo acceso a la versión actualizada de Copilot en mi iPhone 16 Pro desde mi cuenta gratuita.