OpenAI anuncia GPT-4o, su modelo de lenguaje más avanzado, disponible gratis en ChatGPT
A través de una serie de publicaciones en Twitter, el CEO de OpenAI, Sam Altman, anunció una importante novedad sobre el producto estrella de la compañía, GPT, la inteligencia artificial generativa que alimenta ChatGPT. Contrario a los rumores de la semana pasada que sugerían un buscador para competir con Google, se trata de una nueva versión de este motor de inteligencia artificial llamada GPT-4o. Esta versión se asemeja a un asistente personal, similar a Gemini, Alexa o Siri, pero con un tono de voz mucho más sofisticado que se asemeja al de una persona.
Según la compañía, “GPT-4o (“o” de “omni”) es un paso hacia una interacción persona-computadora mucho más natural: acepta como entrada cualquier combinación de texto, audio e imagen, y genera cualquier combinación de salidas de texto, audio e imagen. Puede responder a entradas de audio en tan solo 232 milisegundos, con un promedio de 320 milisegundos, que es similar al tiempo de respuesta humano en una conversación. Iguala el rendimiento de GPT-4 Turbo en texto en inglés y código, con una mejora significativa en texto en idiomas distintos del inglés, a la vez que es mucho más rápido y un 50% más económico en la API. GPT-4o es especialmente mejor en cuanto a visión y comprensión de audio en comparación con los modelos existentes.”
“Nuestro nuevo modelo GPT-4o, es el mejor que hemos hecho. Es inteligente, es rápido, es multimodal nativo y está disponible para todos los usuarios de ChatGPT, ¡incluyendo los del plan gratis! Hasta ahora, los modelos de clase GPT-4 han estado disponibles para gente que paga una suscripción mensual. Esto es importante para nuestra misión; queremos poner herramientas de IA geniales en las manos de todo el mundo”, afirmó Altman, quien aclaró que a nivel de API (es decir, para acceder a GPT-4o desde otra aplicación, como un servicio) el precio bajó a la mitad y es el doble de rápido que GPT-4 turno, con cinco veces más consultas por sesión. Por multimodal, Altman se refiere a un motor que es capaz de generar (y analizar) texto, audio y video al mismo tiempo.