El último modelo de IA de OpenAI tiene capacidades de razonamiento

OpenAI ha presentado este jueves su último modelo de inteligencia artificial, la versión preliminar de o1, o1-preview, que tiene capacidades de razonamiento. Sus creadores aseguran que puede "razonar a través de tareas complejas y resolver problemas más difíciles de ciencia, programación y matemáticas".

Mediante el entrenamiento, el modelo aprende a refinar su proceso de pensamiento, prueba diferentes estrategias y reconoce sus errores, mostrando un desempeño similar al de los estudiantes de doctorado en tareas de referencia en física, química y biología, además de destacar en matemáticas y programación.

En un examen de clasificación para la Olimpíada Internacional de Matemáticas, GPT-4o resolvió correctamente solo el 13 % de los problemas, mientras que el nuevo modelo obtuvo un puntaje del 83 %. En competencias de programación de Codeforces, alcanzó el percentil 89.

"Nuestro algoritmo de aprendizaje de refuerzo a gran escala enseña al modelo a pensar de manera productiva utilizando su cadena de pensamiento en un proceso de entrenamiento altamente eficiente en el uso de datos", señaló OpenAI, que descubrió que el rendimiento de o1 "mejora de manera constante" con el aprendizaje de refuerzo y el tiempo que dedica a pensar.

El cofundador de OpenAI Sam Altman señaló que "o1 sigue siendo defectuoso, sigue siendo limitado y sigue pareciendo más impresionante durante el primer uso que después de que uno pasa más tiempo con él". "Estoy extremadamente orgulloso del equipo, este fue un esfuerzo monumental en toda la compañía", destacó en una publicación en X.

Los beneficios que traería o1 con sus capacidades de razonamiento serían especialmente útiles para quienes trabajan en la resolución de tareas complejas, ya sean investigadores en materia de salud, que podrían usar el nuevo modelo para anotar datos de secuenciación celular, físicos, para generar complicadas fórmulas matemáticas necesarias para la óptica cuántica o desarrolladores de todos los campos.