OpenAI presenta o1 su nueva inteligencia artificial que razona

Los usuarios deben disponer de ChatGPT Plus y Team para disfrutar del servicio

OpenAI ha lanzado o1, su primer modelo de inteligencia artificial con capacidades de razonamiento, diseñado para «tomarse más tiempo en pensar antes de responder», y resolver tareas complejas en áreas como ciencia, programación y matemáticas, superando a sus modelos anteriores.

La tecnológica dirigida por Sam Altman continúa avanzando en materia de IA, en este caso, con el desarrollo de una nueva serie de modelos diseñados para que dediquen más tiempo a pensar en los problemas antes de responder, de manera que actúen de forma más similar a como razonaría una persona.

En este sentido, OpenAI ha lanzado el primer modelo de esta nueva serie con capacidades avanzadas de razonamiento, al que se refiere como o1, y que ya está disponible a través de ChatGPT y la API de la compañía, en formato de vista previa.

Un modelo para resolver tareas complejas en ciencia

Se trata de un modelo que puede razonar sobre tareas complejas y, por tanto, puede resolver problemas de mayor dificultad que los modelos lanzados anteriormente en distintas áreas, ya sea ciencia, programación o matemáticas, tal y como ha subrayado la tecnológica en un comunicado en su blog.

Para lograr estas capacidades, la compañía ha señalado que ha entrenado los modelos para actuar más lento, es decir, para que empleen más tiempo a pensar antes de ofrecer una respuesta. Así, a través de este entrenamiento, los modelos aprenden a refinar su proceso de pensamiento, así como a probar distintas estrategias para resolver un problema, de cara a escoger la mejor respuesta, y a reconocer sus errores.

Tal y como ha compartido el director de investigación de OpenAI, Jerry Tworek, en declaraciones a The Verge, el entrenamiento para el modelo o1 ha sido distinto a los modelos anteriores. Según ha explicado, ha sido entrenado utilizando «un algoritmo de optimización completamente nuevo y un conjunto de datos de entrenamiento específicamente diseñado para él».

Un modelo que aprende a pensar por sí solo

Esto se traduce en un método de entrenamientos que, a través de un sistema de recompensas y penalizaciones, enseña al modelo a pensar por sí solo, en lugar de imitar patrones de datos. De esta forma, Tworek ha indicado que han conseguido que el modelo «alucine menos» en sus respuestas, aunque ha reconocido que no se ha resuelto el problema del todo.

No obstante, como resultado a este entrenamiento, según ha apuntado OpenAI, este nuevo modelo se desempeña de manera similar a como trabajan los estudiantes de doctorado en tareas de referencia desafiantes en física, química y biología. Lo mismo ocurre en áreas como las matemáticas y la codificación.

Concretamente la serie o1, destaca por generar y depurar código complejo de forma precisa. Así, tal y como pudieron comprobar, al probar a resolver un examen de clasificación para la Olimpiada Internacional de Matemáticas (IMO), el nuevo modelo o1 obtuvo una puntuación de 84, mientras que el modelo anterior, GPT-4o, presentado en mayo de este año, obtuvo una puntuación de 22.

Con todo ello, OpenAI ha indicado que el modelo o1 puede ser útil para resolver problemas complejos en ciencia, codificación, matemáticas y campos similares. Igualmente, también puede utilizarse para llevar a cabo investigaciones sobre el sector sanitario o la física, por ejemplo, para generar fórmulas matemáticas complicadas necesarias para la óptica cuántica.

Siguiendo esta línea, ante las nuevas capacidades de razonamiento que ofrece este modelo, OpenAI ha señalado que también han reforzado la seguridad. Para lo que han llevado a cabo «evaluaciones rigurosas» utilizando su Marco de preparación, esto es, equipos de trabajo que llevan a cabo procesos de revisión a nivel de directorio, incluido su Comité de Seguridad y Protección.

OpenAI O1-mini

Además del modelo o1, OpenAI también ha lanzado la versión o1-mini, que es un modelo de razonamiento más rápido y económico, «particularmente eficaz en la codificación», tal y como lo describe la compañía.

Al tratarse de un modelo con un tamaño más pequeño, es un 80% más económico que la vista previa de OpenAI o1. Sin embargo, continúa siendo un modelo «potente y rentable», para realizar tareas que requieran razonamiento pero no necesariamente «un amplio conocimiento del mundo».

Para utilizar OpenAI o1 y OpenAI o1-mini, los usuarios deben disponer de ChatGPT Plus y Team. Así, bastará con escoger una de estas nuevas opciones desde el selector de modelos para comenzar a probar las capacidades de razonamiento. No obstante, la compañía ha señalado que tienen límites de frecuencia semanales para su uso. Concretamente, de 30 mensajes para la vista previa de o1 y 50 mensajes para o1-mini.

Por su parte, los usuarios de ChatGPT Enterprise y Edu tendrán acceso a ambos modelos a partir de la próxima semana. En cuanto a los desarrolladores, aquellos que dispongan del nivel 5 de uso de API ya pueden comenzar a crear prototipos con un límite de velocidad de 20 RPM. Finalmente, OpenAI ha adelantado ofrecerá acceso a o1-mini para todos los usuarios de ChatGPT Free en el futuro.