- OpenIA destacó que esta tecnología permite crear voces realistas en solo segundos
La empresa tecnológica OpenAI anunció el lunes 25 de septiembre que su chatbot con inteligencia artificial (IA), ChatGPT, brindará a los usuarios la posibilidad de conversar en voz alta con la herramienta digital.
Esta función, que estará disponible para las personas que se suscriban al servicio ChatGPT Plus de OpenAI, permitirá que los usuarios elijan una voz entre cinco personajes con nombres como Juniper, Breeze y Ember para que tengan la sensación de mantener una conversación “más humana”.
OpenAI indica además que esta tecnología permite crear voces realistas en solo segundos.
“Nuestra nueva tecnología de voz es capaz de crear voces sintéticas realistas a partir de tan solo unos segundos de voz real. Esto abre las puertas a muchas aplicaciones creativas y da herramientas de accesibilidad. Sin embargo, estas capacidades también presentan nuevos riesgos, como la posibilidad de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude”.
La empresa tecnológica mencionó además las colaboraciones que ha realizado con otras compañías para ofrecer más ventajas a sus usuarios.
“También estamos colaborando de manera similar con otros. Por ejemplo, Spotify está utilizando el poder de esta tecnología para el piloto de su función de traducción de voz, que ayuda a los podcasters a ampliar el alcance de su narración traduciendo podcasts a idiomas adicionales con las propias voces de los podcasters”.

Otras funciones
Entre las características que ChatGPT ofrece a los usuarios se encuentran, información detallada sobre una receta que se desee preparar con solo tomar una foto a la nevera y mostrar los ingredientes que se encuentran dentro de esta.
“La voz y la imagen te brindan más formas de usar ChatGPT en tu vida. Cuando estés en casa, saca fotografías de tu refrigerador y despensa para saber qué hay para cenar (y haz preguntas para obtener una receta paso a paso)”, informa la empresa en un comunicado.
Quienes deseen contar un cuento a los niños antes de dormir, también podrán pedirle ayuda al programa.
La empresa tecnológica asegura que las personas que tengan dudas en cuanto a la resolución de un problema matemático, pueden tomar una foto y en segundos recibirán la solución.
“Después de la cena, ayude a su hijo con un problema de matemáticas tomándole una fotografía, rodeando el conjunto de problemas y pidiéndole que comparta pistas con ambos”, detalla.
Asimismo, los usuarios que tengan la oportunidad de viajar y conocer nuevos lugares, podrán pedirle al programa que hable sobre la historia o temas sobre ese sitio.
Otra de las funciones que permite es la transcripción de textos con las palabras que recibe; y el programa Be My Eyes que ofrece soluciones para personas con problemas de visión. En ese sentido, la cámara servirá a ChatGPT para interpretar lo que se tiene delante, con el objetivo de que puedan hacerse una idea del paisaje.
Los usuarios tendrán también la posibilidad de acceder a una función de GPT-4 que les permitirá enviar imágenes y una pregunta asociada a la foto. De esta manera, se le podrá compartir unos lentes de sol, por ejemplo, y pedirle que sugiera ideas de vestuarios que combinen con estos.
Otras aplicaciones
La inteligencia artificial cuenta con otras herramientas que brindan experiencias de audios realistas y personalizadas, entre estas, Murf.ai.
Murf.ai ofrece la opción de convertir textos en voz.
“Haz locuciones con calidad de estudio en minutos. Utilice las voces realistas de IA de Murf para podcasts, vídeos y todas sus presentaciones profesionales”, apunta la plataforma en su página web.
Cuenta con más de 115 voces únicas en 15 idiomas diferentes.
Speechify es otra de las opciones que los usuarios pueden utilizar. Esta plataforma permite convertir PDF, correos electrónicos y documentos en audios. Puede identificar 15 idiomas y tiene disponible más de 30 voces para seleccionar.