OpenAI busca contratar un ingeniero especializado en GPT para liderar proyectos y ofrecer una remuneración de hasta 465.000 dólares.

Estimated read time 3 min read

OpenAI busca ingeniero de comunicaciones para su modelo de IA con voz

OpenAI está en la búsqueda de un ingeniero de comunicaciones para unirse al equipo detrás de GPT-4o, el ChatGPT capaz de hablar. La compañía ha publicado la vacante en su plataforma de empleos, ofreciendo un rango salarial de entre 310.000 y 465.000 dólares al año.

Esta es la primera vez que OpenAI busca contratar a un ingeniero especializado en comunicaciones en tiempo real (RTC). El objetivo es mejorar y perfeccionar GPT-4o, el nuevo modelo de inteligencia artificial que puede interactuar con los usuarios a través de voz en tiempo real. Una de las capacidades destacadas de este modelo es la traducción de conversaciones entre personas que hablan diferentes idiomas.

La descripción del puesto menciona que el trabajo se llevará a cabo en San Francisco, California, aunque no especifica si será presencial o remoto. También se menciona que OpenAI ofrece beneficios como seguro médico, dental y de visión para el empleado y su familia, apoyo a la salud mental, licencia parental remunerada y apoyo a la planificación familiar.

El ingeniero seleccionado será responsable de innovar en técnicas para integrar inteligencia artificial y comunicación en tiempo real, asegurando una latencia mínima. Además, deberá establecer nuevos estándares para la transmisión de audio y video entre los usuarios y los modelos de IA, y liderar esfuerzos de alineación entre equipos de infraestructura, productos e investigación.

Para postularse a este puesto, OpenAI sugiere que los candidatos tengan conocimientos en WebRTC, códecs de audio y video, sistemas de transmisión de baja latencia y experiencia en la construcción de sistemas de software a gran escala. Aunque no es obligatorio, tener experiencia con modelos de IA y lenguaje grande es una ventaja.

El modelo GPT-4o de OpenAI permite la producción de contenido y la comprensión de órdenes en formato de voz, texto e imágenes, lo que amplía las posibilidades de interacción entre humanos y la inteligencia artificial. La empresa ha compartido un video en el que se muestra cómo GPT-4o puede traducir en tiempo real conversaciones entre personas que hablan diferentes idiomas.

Es importante destacar que OpenAI ha suspendido temporalmente la voz de Sky, una de las opciones disponibles en ChatGPT, debido a las preocupaciones sobre su similitud con la voz de la actriz Scarlett Johansson. La empresa trabajó con expertos de la industria para establecer criterios específicos para las voces de su IA y está tomando medidas para proteger la integridad de los autores de voz contratados.

En conclusión, OpenAI está buscando un ingeniero de comunicaciones para su modelo de IA con voz, GPT-4o. El puesto ofrece un rango salarial atractivo y beneficios adicionales. Los candidatos deben tener experiencia en comunicaciones en tiempo real y conocimientos en WebRTC, códecs de audio y video, y sistemas de transmisión de baja latencia. El modelo GPT-4o tiene la capacidad de producir contenido y entender órdenes en formato de voz, texto e imágenes, lo que amplía las opciones para la interacción con la inteligencia artificial. OpenAI ha suspendido temporalmente la voz de Sky en ChatGPT debido a preocupaciones sobre su similitud con la voz de Scarlett Johansson.

También le puede gustar

Más del autor

+ There are no comments

Add yours