gemini3.us
Lanzado el 5 de marzo de 2026

GPT-5.4

El modelo frontera más capaz y eficiente de OpenAI para trabajo profesional

OSWorld 75.0% (supera humanos) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Búsqueda de herramientas reduce 47% tokens

Ver Benchmarks

Características y Capacidades de GPT-5.4

El primer lanzamiento de OpenAI que combina razonamiento, codificación y uso nativo de computadora en un solo modelo

Uso Nativo de Computadora

GPT-5.4 logra 75.0% en OSWorld, superando el rendimiento humano (72.4%). Opera escritorios mediante código Playwright y comandos de ratón/teclado basados en capturas de pantalla.

Razonamiento Avanzado

GPT-5.4 obtiene 73.3% en ARC-AGI-2 (GPT-5.2: 52.9%) y 92.8% GPQA Diamond — un avance genuino en razonamiento.

Codificación Frontera

GPT-5.4 combina las fortalezas de codificación de GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Velocidad de tokens 1.5x más rápida en modo /fast.

Búsqueda de Herramientas (47% menos tokens)

La nueva función de búsqueda de herramientas carga definiciones bajo demanda. Reduce el uso de tokens en 47% en el benchmark MCP Atlas manteniendo la misma precisión.

Contexto de 1M Tokens

GPT-5.4 soporta hasta 1 millón de tokens de contexto en Codex. Ventana estándar de 272K tokens.

Líder en Trabajo de Conocimiento

GDPval 83.0% (GPT-5.2: 70.9%), Tareas de Modelado IB 87.3%, 33% menos afirmaciones falsas que GPT-5.2.

Resultados de Benchmarks GPT-5.4

Rendimiento de vanguardia en razonamiento, codificación, uso de computadora y trabajo de conocimiento

Razonamiento y Ciencia

ARC-AGI-2 (Verificado)
Razonamiento abstracto — GPT-5.2: 52.9%
73.3%
GPQA Diamond
Conocimiento científico a nivel doctoral
92.8%
Último Examen de la Humanidad (con herramientas)
Razonamiento académico — GPT-5.2: 45.5%
53.8%
FrontierMath Tier 1-3
Razonamiento matemático avanzado
62.4%

Codificación e Ingeniería

SWE-Bench Pro (Público)
Tareas reales de ingeniería de software
57.7%
Terminal-Bench 2.0
Completar tareas CLI y terminal
75.1%
BrowseComp
Navegación web y tareas de investigación
71.2%
Toolathlon
Uso de herramientas en múltiples pasos con APIs reales
68.9%

Uso de Computadora y Visión

OSWorld-Verified (escritorio)
Supera la línea base humana del 72.4%
75.0%
WebArena-Verified (navegador)
Navegación de navegador y completar tareas
82.3%
Online-Mind2Web (capturas)
Interacción web basada en capturas de pantalla
69.1%
MMMU Pro (sin herramientas)
Comprensión multimodal
78.4%

Trabajo de Conocimiento

GDPval (gana o empata)
44 ocupaciones, 9 industrias — GPT-5.2: 70.9%
83.0%
Tareas de Modelado IB
Tareas de hojas de cálculo de banca de inversión
87.3%
Preferencia de Presentación
Evaluadores humanos prefieren presentaciones de GPT-5.4
71%
Reducción de Afirmaciones Falsas
Menos errores factuales vs GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Precios de GPT-5.4

Precios API para GPT-5.4 y GPT-5.4 Pro

Model
GPT-5.4$2.50/M$0.25/M$15/M
GPT-5.4 Pro$30/M$180/M

Procesamiento por lotes y Flex disponible a la mitad de la tarifa estándar. Procesamiento prioritario al doble. GPT-5.2 se retira el 5 de junio de 2026.

Preguntas Frecuentes sobre GPT-5.4

Preguntas frecuentes sobre GPT-5.4

¿Qué es GPT-5.4?

GPT-5.4 es el modelo frontera más capaz de OpenAI, lanzado el 5 de marzo de 2026. Combina razonamiento, codificación y uso nativo de computadora en un solo modelo.

¿Cómo se compara GPT-5.4 con GPT-5.2?

GPT-5.4 supera significativamente a GPT-5.2: ARC-AGI-2 sube de 52.9% a 73.3%, GDPval de 70.9% a 83.0%, OSWorld de 47.3% a 75.0% (superando el rendimiento humano), y las afirmaciones falsas se reducen en 33%.

¿Qué es el uso de computadora de GPT-5.4?

GPT-5.4 puede operar computadoras de forma nativa mediante código Playwright y comandos de ratón/teclado basados en capturas de pantalla. Logra 75.0% en OSWorld, superando la línea base humana del 72.4%.

¿Cuál es el precio de GPT-5.4?

Precios API de GPT-5.4: $2.50/M tokens de entrada, $0.25/M entrada en caché, $15/M salida. GPT-5.4 Pro: $30/M entrada, $180/M salida.

¿Qué es la búsqueda de herramientas en GPT-5.4?

La búsqueda de herramientas carga definiciones de herramientas bajo demanda. En 250 tareas con 36 servidores MCP habilitados, redujo el uso total de tokens en 47% manteniendo la misma precisión.

¿Qué ventana de contexto soporta GPT-5.4?

GPT-5.4 soporta una ventana de contexto estándar de 272K tokens, con 1M de tokens disponible en Codex (facturado al doble más allá de 272K).

¿Cómo se compara GPT-5.4 con Gemini 3.1 Pro?

GPT-5.4 lidera en uso de computadora (OSWorld 75.0%) y trabajo de conocimiento (GDPval 83.0%). Gemini 3.1 Pro lidera en codificación (SWE-Bench 80.6% vs 57.7%) y GPQA Diamond (94.3% vs 92.8%).

¿Está disponible GPT-5.4 en ChatGPT?

Sí. GPT-5.4 Thinking está disponible para suscriptores Plus, Team y Pro en ChatGPT, reemplazando GPT-5.2 Thinking. GPT-5.4 Pro está disponible para planes Pro y Enterprise.

Acerca de GPT-5.4

GPT-5.4 es el modelo de razonamiento insignia de OpenAI lanzado el 5 de marzo de 2026. Es el primer modelo principal que combina razonamiento, codificación (GPT-5.3-Codex) y uso nativo de computadora en un solo lanzamiento.

Aviso importante: Gemini3.us es una plataforma independiente de comunidad y desarrolladores. No estamos afiliados ni conectados oficialmente con OpenAI.

Prueba GPT-5.4 Ahora

Experimenta el modelo más capaz de OpenAI — uso nativo de computadora, 1M de contexto y razonamiento frontera