OpenAI anunció el martes a través de Twitter que comenzará a implementar su función de Voz Avanzada, así como cinco nuevas voces para la IA conversacional, para los suscriptores de los planes Plus y Teams a lo largo de esta semana. Los suscriptores de los planes Enterprise y Edu podrán acceder a esta función a partir de la próxima semana.
La función de Voz Avanzada se irá activando en todos los usuarios de Plus y Teams en la app de ChatGPT durante la semana.
Mientras esperabas pacientemente, hemos agregado Instrucciones Personalizadas, Memoria, cinco nuevas voces y mejorado los acentos.
También puede decir “Perdón por la tardanza” en más de 50 idiomas. pic.twitter.com/APOqqhXtDg
— OpenAI (@OpenAI) 24 de septiembre de 2024
Voz Avanzada, que funciona con el modelo GPT-4o, permite a los usuarios prescindir de los mensajes de texto y hablar directamente con el chatbot como lo harían con otra persona. Fue anunciada por primera vez en el evento de Actualización de Primavera de OpenAI y lanzada en julio a un grupo selecto de suscriptores de ChatGPT Plus para probar la beta del sistema. Ahora, todos los suscriptores pagos podrán probar esta función.
La compañía también presentó cinco nuevas voces para el chatbot: Arbor, Maple, Sol, Spruce y Vale (puedes escucharlas ahora mismo). Estarán disponibles tanto en los modos de Voz Estándar como Avanzada, uniéndose a las cuatro voces —Breeze, Juniper, Cove y Ember— que ChatGPT ya ofrece. OpenAI también mencionó que, aunque el video y el uso compartido de pantalla no están disponibles actualmente en Voz Avanzada, esas capacidades se lanzarán más adelante.
Además, OpenAI está incorporando un par de herramientas para mejorar las capacidades de Voz Avanzada y alinearlas más con la experiencia del chatbot basado en texto: memoria e instrucciones personalizadas. Cuando se lanzó por primera vez, Voz Avanzada solo podía hacer referencia a la información de la conversación actual. Con la función de memoria, la IA podrá recordar detalles de conversaciones anteriores, reduciendo la necesidad de que los usuarios repitan información. De manera similar, las instrucciones personalizadas permiten establecer reglas para que el modelo las siga al generar respuestas. Por ejemplo, podrías indicar que las respuestas relacionadas con programación se presenten en Python.
Los suscriptores de Plus y Teams recibirán una notificación dentro de la app cuando la función esté disponible en sus cuentas. Desafortunadamente, Voz Avanzada no está disponible en la UE, el Reino Unido, Suiza, Islandia, Noruega y Liechtenstein.
ChatGPT no es la única IA que puede conversar directamente con sus usuarios. El anuncio del martes se produce menos de dos semanas después de que Google lanzara Gemini Live para todos los usuarios, incluidos aquellos con planes gratuitos.