Pasos para activar el último modelo de inteligencia artificial GPT-4o en ChatGPT.

Estimated read time 3 min read

OpenAI presenta GPT-4o, su nuevo modelo de inteligencia artificial

La empresa OpenAI ha anunciado el lanzamiento de su nuevo modelo insignia de inteligencia artificial, GPT-4o. Este modelo tiene la capacidad de razonar a través de audio, visión y texto en tiempo real. Lo mejor de todo es que estará disponible de forma gratuita para los usuarios de ChatGPT, primero con texto e imagen, y más adelante con voz y video para los usuarios Premium.

GPT-4o representa un avance significativo en la interacción persona-computadora, ya que permite combinar texto, audio e imagen en las instrucciones (o prompts) y generar respuestas en los mismos formatos. Una de las mejoras más destacadas de GPT-4o es su velocidad de respuesta a entradas de audio, que puede ser tan rápida como 232 milisegundos, similar al tiempo de respuesta humano en una conversación.

Anteriormente, los usuarios de ChatGPT tenían que lidiar con latencias de 2,8 segundos (GPT-3.5) y 5,4 segundos (GPT-4) al utilizar el modo de voz. Con GPT-4o, se integran tres modelos separados para el modo de voz: uno que transcribe audio a texto, otro que genera texto a partir del texto transcribido, y un tercero que convierte ese texto en audio. Aunque este proceso implica ciertas limitaciones, como la incapacidad de GPT-4o para observar directamente el tono o los ruidos de fondo, representa un gran avance en comparación con los modelos anteriores.

Una de las características más sorprendentes de GPT-4o es que utiliza un único modelo para procesar texto, visión y audio, lo que significa que todas las entradas y salidas son procesadas por la misma red neuronal. Esto permite que el modelo tenga un mayor nivel de comprensión y capacidad de respuesta. En un video de demostración, se puede escuchar a GPT-4o riendo durante una interacción con una persona.

OpenAI ha evaluado GPT-4o en términos de ciberseguridad y privacidad, y ha contado con la colaboración de un equipo externo de expertos en psicología social y equidad. Además, se han implementado medidas de seguridad en las salidas de audio, limitando la selección de voces preestablecidas.

Para utilizar GPT-4o en ChatGPT, los usuarios deben ingresar como invitados o con su usuario y seleccionar el modelo en el menú de la plataforma. Los usuarios gratuitos tendrán acceso limitado a GPT-4o, con un límite en la cantidad de mensajes que pueden enviar. En caso de que GPT-4o no esté disponible, los usuarios volverán a utilizar GPT-3.5.

En conclusión, GPT-4o representa un avance significativo en la capacidad de interacción entre personas y computadoras. Con su capacidad para procesar texto, visión y audio en tiempo real, este modelo de inteligencia artificial ofrece nuevas posibilidades en diversos campos. A medida que se siga explorando su potencial, es probable que se descubran nuevas aplicaciones y mejoras en su rendimiento.

Cita del autor del sitio web: “El lanzamiento de GPT-4o marca un hito importante en el desarrollo de la inteligencia artificial. Este modelo representa un avance significativo en la capacidad de razonamiento y respuesta en tiempo real. Estamos emocionados por ver las aplicaciones que surgirán a partir de esta tecnología”.

También le puede gustar

Más del autor

+ There are no comments

Add yours