Lanzado el 5 de marzo de 2026

GPT-5.4

El modelo frontera más capaz y eficiente de OpenAI para trabajo profesional

OSWorld 75.0% (supera humanos) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Búsqueda de herramientas reduce 47% tokens

Características y Capacidades de GPT-5.4

El primer lanzamiento de OpenAI que combina razonamiento, codificación y uso nativo de computadora en un solo modelo

Uso Nativo de Computadora

GPT-5.4 logra 75.0% en OSWorld, superando el rendimiento humano (72.4%). Opera escritorios mediante código Playwright y comandos de ratón/teclado basados en capturas de pantalla.

Razonamiento Avanzado

GPT-5.4 obtiene 73.3% en ARC-AGI-2 (GPT-5.2: 52.9%) y 92.8% GPQA Diamond — un avance genuino en razonamiento.

Codificación Frontera

GPT-5.4 combina las fortalezas de codificación de GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Velocidad de tokens 1.5x más rápida en modo /fast.

Búsqueda de Herramientas (47% menos tokens)

La nueva función de búsqueda de herramientas carga definiciones bajo demanda. Reduce el uso de tokens en 47% en el benchmark MCP Atlas manteniendo la misma precisión.

Contexto de 1M Tokens

GPT-5.4 soporta hasta 1 millón de tokens de contexto en Codex. Ventana estándar de 272K tokens.

Líder en Trabajo de Conocimiento

GDPval 83.0% (GPT-5.2: 70.9%), Tareas de Modelado IB 87.3%, 33% menos afirmaciones falsas que GPT-5.2.

Resultados de Benchmarks GPT-5.4

Rendimiento de vanguardia en razonamiento, codificación, uso de computadora y trabajo de conocimiento

Razonamiento y Ciencia

ARC-AGI-2 (Verificado)

Razonamiento abstracto — GPT-5.2: 52.9%

73.3%

GPQA Diamond

Conocimiento científico a nivel doctoral

92.8%

Último Examen de la Humanidad (con herramientas)

Razonamiento académico — GPT-5.2: 45.5%

53.8%

FrontierMath Tier 1-3

Razonamiento matemático avanzado

62.4%

Codificación e Ingeniería

SWE-Bench Pro (Público)

Tareas reales de ingeniería de software

57.7%

Terminal-Bench 2.0

Completar tareas CLI y terminal

75.1%

BrowseComp

Navegación web y tareas de investigación

71.2%

Toolathlon

Uso de herramientas en múltiples pasos con APIs reales

68.9%

Uso de Computadora y Visión

OSWorld-Verified (escritorio)

Supera la línea base humana del 72.4%

75.0%

WebArena-Verified (navegador)

Navegación de navegador y completar tareas

82.3%

Online-Mind2Web (capturas)

Interacción web basada en capturas de pantalla

69.1%

MMMU Pro (sin herramientas)

Comprensión multimodal

78.4%

Trabajo de Conocimiento

GDPval (gana o empata)

44 ocupaciones, 9 industrias — GPT-5.2: 70.9%

83.0%

Tareas de Modelado IB

Tareas de hojas de cálculo de banca de inversión

87.3%

Preferencia de Presentación

Evaluadores humanos prefieren presentaciones de GPT-5.4

71%

Reducción de Afirmaciones Falsas

Menos errores factuales vs GPT-5.2

-33%

Benchmark	GPT-5.4	GPT-5.2
OSWorld (Computer Use)	75.0%	47.3%
ARC-AGI-2	73.3%	52.9%
GPQA Diamond	92.8%	88.1%
GDPval	83.0%	70.9%
HLE (with tools)	53.8%	45.5%
SWE-Bench Pro	57.7%	43.2%
Terminal-Bench 2.0	75.1%	61.4%
IB Modeling Tasks	87.3%	74.1%

Precios de GPT-5.4

Precios API para GPT-5.4 y GPT-5.4 Pro

Model
GPT-5.4	$2.50/M	$0.25/M	$15/M
GPT-5.4 Pro	$30/M	—	$180/M

Procesamiento por lotes y Flex disponible a la mitad de la tarifa estándar. Procesamiento prioritario al doble. GPT-5.2 se retira el 5 de junio de 2026.

Preguntas Frecuentes sobre GPT-5.4

Preguntas frecuentes sobre GPT-5.4

¿Qué es GPT-5.4?

GPT-5.4 es el modelo frontera más capaz de OpenAI, lanzado el 5 de marzo de 2026. Combina razonamiento, codificación y uso nativo de computadora en un solo modelo.

¿Cómo se compara GPT-5.4 con GPT-5.2?

GPT-5.4 supera significativamente a GPT-5.2: ARC-AGI-2 sube de 52.9% a 73.3%, GDPval de 70.9% a 83.0%, OSWorld de 47.3% a 75.0% (superando el rendimiento humano), y las afirmaciones falsas se reducen en 33%.

¿Qué es el uso de computadora de GPT-5.4?

GPT-5.4 puede operar computadoras de forma nativa mediante código Playwright y comandos de ratón/teclado basados en capturas de pantalla. Logra 75.0% en OSWorld, superando la línea base humana del 72.4%.

¿Cuál es el precio de GPT-5.4?

Precios API de GPT-5.4: $2.50/M tokens de entrada, $0.25/M entrada en caché, $15/M salida. GPT-5.4 Pro: $30/M entrada, $180/M salida.

¿Qué es la búsqueda de herramientas en GPT-5.4?

La búsqueda de herramientas carga definiciones de herramientas bajo demanda. En 250 tareas con 36 servidores MCP habilitados, redujo el uso total de tokens en 47% manteniendo la misma precisión.

¿Qué ventana de contexto soporta GPT-5.4?

GPT-5.4 soporta una ventana de contexto estándar de 272K tokens, con 1M de tokens disponible en Codex (facturado al doble más allá de 272K).

¿Cómo se compara GPT-5.4 con Gemini 3.1 Pro?

GPT-5.4 lidera en uso de computadora (OSWorld 75.0%) y trabajo de conocimiento (GDPval 83.0%). Gemini 3.1 Pro lidera en codificación (SWE-Bench 80.6% vs 57.7%) y GPQA Diamond (94.3% vs 92.8%).

¿Está disponible GPT-5.4 en ChatGPT?

Sí. GPT-5.4 Thinking está disponible para suscriptores Plus, Team y Pro en ChatGPT, reemplazando GPT-5.2 Thinking. GPT-5.4 Pro está disponible para planes Pro y Enterprise.

Acerca de GPT-5.4

GPT-5.4 es el modelo de razonamiento insignia de OpenAI lanzado el 5 de marzo de 2026. Es el primer modelo principal que combina razonamiento, codificación (GPT-5.3-Codex) y uso nativo de computadora en un solo lanzamiento.

Aviso importante: Gemini3.us es una plataforma independiente de comunidad y desarrolladores. No estamos afiliados ni conectados oficialmente con OpenAI.

Prueba GPT-5.4 Ahora

Experimenta el modelo más capaz de OpenAI — uso nativo de computadora, 1M de contexto y razonamiento frontera