OpenAI GPT-O3: El nuevo modelo de IA con razonamiento avanzado que piensa con imágenes

OpenAI GPT-O3 es la última incorporación a la familia de modelos de inteligencia artificial de OpenAI ChatGPT, y destaca por su capacidad de razonamiento avanzado.

Presentado a finales de 2024 como sucesor del modelo “O1” de OpenAI, este modelo (conocido simplemente como OpenAI o3) está entrenado para “pensar antes de responder” y abordar problemas complejos paso a paso.

GPT-O3 representa un salto significativo frente a sus predecesores: es el modelo con mayor poder de razonamiento de OpenAI hasta la fecha, capaz de ampliar las fronteras en programación, matemáticas, ciencia y más, estableciendo un nuevo estándar en inteligencia y utilidad en el campo de las IA.

A continuación, exploramos qué hace especial a GPT-O3, sus principales características, rendimiento y cómo acceder a esta tecnología de punta.

¿Qué es GPT-O3 y por qué OpenAI saltó “O2”?

GPT-O3 pertenece a la nueva serie “o” de modelos de razonamiento de OpenAI. A diferencia de los modelos GPT tradicionales (enfocados en respuestas rápidas), los modelos “o” priorizan la deliberación: pasan más tiempo “pensando” cada respuesta para resolver tareas complejas que requieren múltiples pasos de lógica.

OpenAI O3 fue anunciado originalmente en diciembre de 2024 y su nombre generó curiosidad, ya que la compañía omitió el nombre O2.

Lejos de tratarse de un salto misterioso en capacidades, la decisión de evitar “O2” tuvo motivos prácticos: según reportes, OpenAI se saltó el número 2 para esquivar conflictos de marca registrada (O2 es una empresa de telecomunicaciones británica).

Por tanto, “O3” simplemente continúa la nomenclatura tras OpenAI O1 (modelo lanzado en 2023) como el siguiente gran modelo de razonamiento de la compañía.

Desde su anuncio, GPT-O3 ha sido considerado un paso importante hacia sistemas de IA más inteligentes y generales. Algunos analistas incluso señalaron que su desempeño sugiere que OpenAI se acerca cada vez más a la IA general (AGI).

Inicialmente, OpenAI abrió O3 de forma limitada para investigadores de seguridad a comienzos de 2025, retrasando su lanzamiento al público general por motivos de pruebas y seguridad.

Finalmente, en abril de 2025, la compañía presentó oficialmente OpenAI O3 al mundo junto con un modelo complementario más ligero llamado OpenAI O4-mini. Veamos qué hace tan poderoso a GPT-O3 y cómo se diferencia de modelos anteriores.

Características clave de GPT-O3 (OpenAI o3)

1. Razonamiento mejorado y “cadena de pensamiento”: La cualidad definitoria de GPT-O3 es su capacidad de razonamiento profundo.

A nivel técnico, ha sido entrenado mediante aprendizaje por refuerzo para reflexionar internamente antes de dar una respuesta. OpenAI describe que O3 sigue una “cadena de pensamiento privada”, descomponiendo las peticiones en pasos y analizándolas secuencialmente.

Este enfoque le permite planificar con antelación y razonar de forma más rigurosa, reduciendo errores lógicos. La contrapartida es un mayor tiempo de respuesta: al “pensar” más, O3 puede responder un poco más lento que modelos anteriores, pero con respuestas mucho más detalladas y fiables.

De hecho, OpenAI permite ajustar el tiempo de cálculo de O3 – los usuarios pueden elegir entre modos de razonamiento rápido, medio o lento – de manera que a mayor deliberación, más confiables tienden a ser las respuestas.

En resumen, GPT-O3 inaugura una era de IA que prefiere calidad sobre velocidad al resolver problemas difíciles.

2. Uso autónomo de herramientas y multimedialidad: Por primera vez, un modelo de OpenAI combina de forma autónoma todas las herramientas disponibles en ChatGPT.

GPT-O3 puede acceder a Internet, ejecutar código Python, analizar archivos cargados e incluso generar e interpretar imágenes sin intervención humana directa.

Esto significa que, ante una consulta compleja, el propio modelo decidirá buscar información actualizada en la web, realizar cálculos o gráficos, o inspeccionar datos visuales para elaborar su respuesta.

Lo más novedoso es su habilidad de “pensar con imágenes”: GPT-O3 integra las imágenes directamente en su proceso de razonamiento, analizándolas en profundidad como parte de la solución del problema.

A diferencia de versiones anteriores que sólo describían una imagen tras recibirla, O3 interactúa con la imagen mentalmente – puede rotarla, hacer zoom, leer texto aunque esté borroso, o buscar patrones – incorporando la información visual a su “cadena de pensamiento”.

Por ejemplo, el modelo puede resolver un laberinto dibujado, encontrar el horario de un autobús en una foto distante de una parada, o identificar qué elemento falta en la fotografía de un diagrama técnico.

Esta capacidad de combinar visión, texto y otras herramientas le permite abordar preguntas multifacéticas de manera mucho más efectiva que los GPT tradicionales.

3. Mayor precisión y respuestas más verificables: Gracias a su razonamiento avanzado y al acceso a fuentes externas, GPT-O3 comete muchos menos errores que sus predecesores y ofrece respuestas más rigurosas.

En evaluaciones internas y de terceros, se observó que O3 reduce en aproximadamente 20% los errores importantes en tareas complejas frente al modelo O1.

Los evaluadores destacaron su rigor analítico y capacidad de generar hipótesis novedosas y críticas en áreas como biología, matemáticas e ingeniería. Además, al poder buscar información en la web cuando lo considera necesario, O3 tiende a entregar respuestas mejor fundamentadas con datos o fuentes.

OpenAI señala que sus nuevos modelos ofrecen respuestas más útiles y comprobables, integrando referencias de internet cuando corresponde.

En comparación con iteraciones anteriores, GPT-O3 también muestra mejoras en el seguimiento de instrucciones del usuario, manteniendo conversaciones más naturales y contextuales gracias a un mejor uso de la memoria de chats pasados.

En esencia, O3 entiende mejor lo que se le pide y responde de forma más confiable, apoyándose en todas sus habilidades para minimizar la desinformación y maximizar la utilidad.

4. Modelo hermano O4-mini (velocidad vs. potencia): Junto a GPT-O3, OpenAI lanzó O4-mini, un modelo complementario optimizado para velocidad y costo. O4-mini es más pequeño en tamaño pero sorprendentemente capaz en razonamiento, especialmente en matemáticas, programación y visión por computadora.

Su objetivo es ofrecer respuestas rápidas con buen desempeño, sirviendo como alternativa ligera cuando O3 resulta excesivo. De hecho, O4-mini ha superado a su antecesor O3-mini en múltiples tareas y, gracias a su eficiencia, permite límites de uso más altos (es ideal para alto volumen de consultas).

Mientras GPT-O3 es el “cerebro” más potente para problemas realmente difíciles, O4-mini brilla en velocidad y está disponible incluso para usuarios gratuitos (como veremos más adelante).

Ambos modelos comparten la filosofía de razonamiento avanzado de OpenAI, y juntos elevan el nivel de lo que ChatGPT puede hacer tanto para entusiastas como para profesionales.

Rendimiento: ¿qué tan potente es GPT-O3?

OpenAI GPT-O3 no solo introduce nuevas funciones, sino que también rompe récords de rendimiento en múltiples benchmarks de inteligencia artificial. La empresa afirma que sus nuevos modelos superan en todas las referencias al modelo O1, y las cifras respaldan esa afirmación.

A continuación resumimos algunos resultados destacables que muestran el salto de calidad de GPT-O3 frente a modelos anteriores y competidores:

Menos errores y mejor lógica: Como mencionamos, O3 comete alrededor de un 20% menos de errores graves que OpenAI O1 al enfrentar tareas complejas del mundo real. Evaluadores externos han constatado que el modelo exhibe un rigor analítico muy superior, especialmente en campos como programación, negocios e incluso creatividad. Esto se traduce en soluciones más correctas y confiables donde antes los modelos podían fallar.
Desempeño casi humano en razonamiento abstracto: En pruebas de razonamiento difíciles diseñadas para medir habilidades de pensamiento abstracto, GPT-O3 roza niveles humanos. Por ejemplo, alcanzó un 75,7% de acierto en el exigente Abstraction and Reasoning Corpus (ARC), un conjunto de problemas lógicos creado por expertos de Google. Este resultado es un nuevo récord para una IA en dicho test, acercándose al ~84% que logran, en promedio, participantes humanos. Sin las restricciones de costo computacional de la prueba, O3 incluso llegó a 87,5% de acierto en ARC, superando ligeramente la media humana aunque aún por debajo del 85% requerido para considerarlo “AGI” según los criterios del desafío. Además, O3 triplicó el desempeño de O1 en esta misma prueba, evidenciando un avance enorme en capacidad de abstracción.
Superior en matemáticas y ciencia: GPT-O3 muestra especial fortaleza en áreas STEM. En el American Invitational Mathematics Exam (AIME) – una competición de matemáticas de alto nivel – el modelo estándar O3 logró resolver alrededor del 89% de los problemas correctamente. Esto no solo supera claramente a O1 (aprox. 79% en la misma prueba) sino que incluso rebasa a modelos rivales de última generación. Por ejemplo, en esa prueba O3 superó al modelo Gemini 2.5 Pro de Google (86,7%) y quedó muy por encima de sistemas como Claude 3.7 de Anthropic (~49%) o DeepMind Gopher en ese ámbito. En otra evaluación de matemáticas (AIME 2024), O3 llegó incluso a un 96,7% de aciertos, fallando solo una pregunta, frente al 83,3% de O1. Estos resultados sugieren que, cuando se trata de razonamiento matemático complejo, GPT-O3 está entre los mejores modelos de IA disponibles.
Liderando en programación y código: La ventaja de O3 también se nota en desafíos de programación. En el benchmark SWE-Bench (Software Engineering Benchmarks), diseñado para problemas reales de ingeniería de software, OpenAI O3 demostró ser 22,8 puntos porcentuales más preciso que O1, su predecesor. En términos absolutos, O3 alcanzó ~71.7% de aciertos, versus ~48.9% de O1 en esa prueba. Igualmente impresionante, en competencias de programación tipo Codeforces, O3 obtuvo una puntuación de 2727 (muy por encima de los 1891 puntos logrados por O1). Esto coloca a GPT-O3 aproximadamente al nivel de un experto humano competitivo en programación: de hecho, con ese puntaje O3 supera al 99.8% de los participantes humanos típicos en Codeforces. En otra referencia de codificación, O3 obtuvo ~69% de precisión, comparable con el rendimiento de modelos como Claude 3.7 (70.3%) de Anthropic, y por encima del modelo Gemini 2.5 de Google (~63.8%). Todo esto indica que O3 no solo razona bien en lenguaje natural, sino que es capaz de escribir y depurar código con una habilidad sobresaliente para una IA.

En conjunto, los benchmarks pintan un panorama claro: GPT-O3 supera con creces a la generación anterior (O1, GPT-4.1, etc.) en casi todos los ámbitos evaluados, y compite palmo a palmo con (o aventaja a) los modelos más avanzados de otras compañías en tareas de razonamiento.

OpenAI ha conseguido que ChatGPT con O3 resuelva problemas que antes se consideraban fuera del alcance de la IA convencional, acercándose un paso más a sistemas más generales e inteligentes. No es de extrañar que muchos vean a GPT-O3 como un puente importante camino a GPT-5 y la tan buscada inteligencia general artificial.

Disponibilidad: ¿cómo probar OpenAI O3?

Dado el impresionante desempeño de GPT-O3, es natural preguntarse cómo acceder a este modelo. OpenAI ha optado por un despliegue escalonado, dando prioridad a la seguridad y a suscriptores de pago:

ChatGPT Plus y Enterprise: A partir de abril de 2025, OpenAI O3 está disponible para los usuarios de pago en las plataformas de ChatGPT. Si tienes una suscripción ChatGPT Plus, Pro o Team, puedes encontrar a O3 en el selector de modelos, en reemplazo del anterior modelo O1 (y de O3-mini). En otras palabras, los suscriptores de ChatGPT Plus ahora disfrutan del modelo insignia de razonamiento sin costo adicional dentro de su plan. Asimismo, OpenAI lanzó una variante premium llamada “OpenAI O3-pro”, pensada para usuarios ChatGPT Pro y para desarrolladores vía API. O3-pro es una versión de O3 con aún mayor capacidad de razonamiento (dedica más tiempo a cada pregunta para máxima fiabilidad), ideal para quienes requieran lo último en rendimiento. Con estos lanzamientos, OpenAI ha sustituido efectivamente a su modelo O1 en los planes de pago, consolidando a O3 como el nuevo estándar.
Usuarios gratuitos (ChatGPT estándar): Aunque el modelo O3 completo no está disponible de forma gratuita a fecha de hoy, OpenAI sí ha puesto a disposición de todos los usuarios una alternativa. Junto con O3, la compañía liberó OpenAI O4-mini – el modelo de razonamiento rápido – para uso gratuito en ChatGPT. Los usuarios del plan gratis pueden probar O4-mini simplemente activando el botón de “Razonar” antes de enviar su consulta en ChatGPT. De esta forma, incluso sin suscripción de pago, cualquiera puede tener un primer acercamiento a la tecnología de razonamiento de la serie O, aunque en su versión más ligera. Previamente, OpenAI ya había experimentado con ofrecer O3-mini a los usuarios gratuitos mediante esa misma opción de “razonar”. Ahora, O4-mini toma la posta como el modelo gratuito de razonamiento, mientras que O3 queda reservado para quienes necesitan el máximo desempeño vía suscripción.
API para desarrolladores: OpenAI también ha incorporado GPT-O3 a su API en la nube, permitiendo que desarrolladores integren este modelo en sus propias aplicaciones. Según OpenAI, tanto O3 estándar como O3-pro están disponibles en la API (para quienes tengan acceso). Esto abre la puerta a que herramientas de terceros aprovechen el poder de O3 para casos de uso especializados, desde asistentes virtuales con razonamiento avanzado, hasta analítica de datos compleja asistida por IA. Es esperable que la API de O3 tenga un costo más alto por token en comparación con modelos más simples, dado el mayor tiempo de cómputo que requiere su inferencia.

En términos de disponibilidad general, OpenAI ha indicado que planea eventualmente lanzar O3 al público en meses posteriores, una vez garantizada la seguridad y alineamiento del modelo.

La precaución se debe a que modelos tan potentes conllevan nuevos desafíos de seguridad: la empresa ha sometido a O3 a extensivas pruebas y alineación deliberada para evitar usos indebidos, dada su mayor autonomía y capacidades.

Por ahora, la forma más directa de experimentar GPT-O3 es suscribirse a ChatGPT Plus o superior, donde está disponible inmediatamente.

Los usuarios curiosos que no deseen pagar pueden jugar con O4-mini para tener una idea de cómo razonan estos nuevos modelos, aunque deberán esperar para probar el “cerebro” completo de O3 en la versión gratuita de ChatGPT.

Conclusiones: GPT-O3 y el futuro de la inteligencia artificial

OpenAI GPT-O3 marca un hito importante en la evolución de las IA generativas. Con su llegada, vemos cómo las prioridades en el diseño de modelos están cambiando: de buscar solo respuestas rápidas a perseguir respuestas inteligentes, fundamentadas y multimodales.

O3 muestra que una IA puede razonar como nunca antes, utilizando una cadena de pensamiento interna, consultando herramientas externas e incorporando imágenes en su análisis para abordar problemas complejos en menos de un minuto.

Este enfoque ha elevado el techo de lo que un asistente de IA puede lograr por sí solo, acercándonos un poco más a la visión de un ChatGPT autónomo que pueda realizar tareas completas de principio a fin por cuenta propia.

En términos de impacto, GPT-O3 fortalece el liderazgo de OpenAI en la carrera de la IA frente a gigantes como Google.

No por nada su lanzamiento vino poco después de que Google presentara mejoras en su modelo Gemini – movimientos que parecían alcanzar a OpenAI O1 – solo para que OpenAI contraatacara con O3, poniendo de nuevo la vara más alta.

Además, la introducción de capacidades como “pensar con imágenes” por parte de O3 ha establecido un nuevo estándar que otros modelos ahora intentarán igualar.

A la vez, O3 sirve de terreno de prueba para técnicas de alineación y seguridad más estrictas, preparando a OpenAI para futuros desarrollos aún más potentes (como el eventual GPT-5).

En conclusión, GPT-O3 es un modelo transformativo: más lento pero mucho más inteligente, con una versatilidad inédita al combinar texto, herramientas, código e imágenes. Si GPT-4 nos sorprendió con su capacidad multitarea, GPT-O3 nos demuestra cómo una IA puede ir más lejos cuando realmente razona sus respuestas.

Queda claro que la apuesta de OpenAI por el razonamiento profundo está dando frutos, y nos encaminamos a una nueva generación de inteligencias artificiales capaces de entender y resolver problemas con un nivel de sofisticación muy cercano al humano.

Habrá que estar atentos a cómo evoluciona esta tecnología – y cómo responden sus competidores – pero por ahora GPT-O3 se posiciona como una de las IA más avanzadas del mundo, lista para impulsar aplicaciones innovadoras y quizás inspirar el próximo gran salto hacia la inteligencia general artificial.