gemini3.us
Lançado em 5 de março de 2026

GPT-5.4

O modelo de fronteira mais capaz e eficiente da OpenAI para trabalho profissional

OSWorld 75.0% (supera humanos) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Busca de ferramentas reduz 47% tokens

Ver Benchmarks

Recursos e Capacidades do GPT-5.4

O primeiro lançamento da OpenAI combinando raciocínio, codificação e uso nativo de computador em um único modelo

Uso Nativo de Computador

GPT-5.4 atinge 75.0% no OSWorld, superando o desempenho humano (72.4%). Opera desktops via código Playwright e comandos de mouse/teclado baseados em capturas de tela.

Raciocínio Avançado

GPT-5.4 pontua 73.3% no ARC-AGI-2 (GPT-5.2: 52.9%) e 92.8% GPQA Diamond — um avanço genuíno no raciocínio.

Codificação de Fronteira

GPT-5.4 combina os pontos fortes de codificação do GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Velocidade de tokens 1.5x mais rápida no modo /fast.

Busca de Ferramentas (47% menos tokens)

O novo recurso de busca de ferramentas carrega definições sob demanda. Reduz o uso de tokens em 47% no benchmark MCP Atlas mantendo a mesma precisão.

Contexto de 1M Tokens

GPT-5.4 suporta até 1 milhão de tokens de contexto no Codex. Janela padrão de 272K tokens.

Líder em Trabalho de Conhecimento

GDPval 83.0% (GPT-5.2: 70.9%), Tarefas de Modelagem IB 87.3%, 33% menos afirmações falsas que GPT-5.2.

Resultados de Benchmarks do GPT-5.4

Desempenho de ponta em raciocínio, codificação, uso de computador e trabalho de conhecimento

Raciocínio e Ciência

ARC-AGI-2 (Verificado)
Raciocínio abstrato — GPT-5.2: 52.9%
73.3%
GPQA Diamond
Conhecimento científico em nível de doutorado
92.8%
Último Exame da Humanidade (com ferramentas)
Raciocínio acadêmico — GPT-5.2: 45.5%
53.8%
FrontierMath Tier 1-3
Raciocínio matemático avançado
62.4%

Codificação e Engenharia

SWE-Bench Pro (Público)
Tarefas reais de engenharia de software
57.7%
Terminal-Bench 2.0
Conclusão de tarefas CLI e terminal
75.1%
BrowseComp
Navegação web e tarefas de pesquisa
71.2%
Toolathlon
Uso de ferramentas em múltiplas etapas com APIs reais
68.9%

Uso de Computador e Visão

OSWorld-Verified (desktop)
Supera a linha de base humana de 72.4%
75.0%
WebArena-Verified (navegador)
Navegação de navegador e conclusão de tarefas
82.3%
Online-Mind2Web (capturas)
Interação web baseada em capturas de tela
69.1%
MMMU Pro (sem ferramentas)
Compreensão multimodal
78.4%

Trabalho de Conhecimento

GDPval (vence ou empata)
44 ocupações, 9 indústrias — GPT-5.2: 70.9%
83.0%
Tarefas de Modelagem IB
Tarefas de planilhas de banco de investimento
87.3%
Preferência de Apresentação
Avaliadores humanos preferem apresentações do GPT-5.4
71%
Redução de Afirmações Falsas
Menos erros factuais vs GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Preços do GPT-5.4

Preços de API para GPT-5.4 e GPT-5.4 Pro

Model
GPT-5.4$2.50/M$0.25/M$15/M
GPT-5.4 Pro$30/M$180/M

Processamento em lote e Flex disponível pela metade da taxa padrão. Processamento prioritário ao dobro. GPT-5.2 se aposenta em 5 de junho de 2026.

Perguntas Frequentes sobre GPT-5.4

Perguntas frequentes sobre GPT-5.4

O que é GPT-5.4?

GPT-5.4 é o modelo de fronteira mais capaz da OpenAI, lançado em 5 de março de 2026. Combina raciocínio, codificação e uso nativo de computador em um único modelo.

Como o GPT-5.4 se compara ao GPT-5.2?

GPT-5.4 supera significativamente o GPT-5.2: ARC-AGI-2 sobe de 52.9% para 73.3%, GDPval de 70.9% para 83.0%, OSWorld de 47.3% para 75.0% (superando o desempenho humano), e afirmações falsas reduzidas em 33%.

O que é o uso de computador do GPT-5.4?

GPT-5.4 pode operar computadores nativamente via código Playwright e comandos de mouse/teclado baseados em capturas de tela. Atinge 75.0% no OSWorld, superando a linha de base humana de 72.4%.

Qual é o preço do GPT-5.4?

Preços API do GPT-5.4: $2.50/M tokens de entrada, $0.25/M entrada em cache, $15/M saída. GPT-5.4 Pro: $30/M entrada, $180/M saída.

O que é a busca de ferramentas no GPT-5.4?

A busca de ferramentas carrega definições de ferramentas sob demanda. Em 250 tarefas com 36 servidores MCP habilitados, reduziu o uso total de tokens em 47% mantendo a mesma precisão.

Qual janela de contexto o GPT-5.4 suporta?

GPT-5.4 suporta uma janela de contexto padrão de 272K tokens, com 1M de tokens disponível no Codex (cobrado ao dobro além de 272K).

Como o GPT-5.4 se compara ao Gemini 3.1 Pro?

GPT-5.4 lidera em uso de computador (OSWorld 75.0%) e trabalho de conhecimento (GDPval 83.0%). Gemini 3.1 Pro lidera em codificação (SWE-Bench 80.6% vs 57.7%) e GPQA Diamond (94.3% vs 92.8%).

O GPT-5.4 está disponível no ChatGPT?

Sim. GPT-5.4 Thinking está disponível para assinantes Plus, Team e Pro no ChatGPT, substituindo GPT-5.2 Thinking. GPT-5.4 Pro está disponível para planos Pro e Enterprise.

Sobre o GPT-5.4

GPT-5.4 é o modelo de raciocínio principal da OpenAI lançado em 5 de março de 2026. É o primeiro modelo principal que combina raciocínio, codificação (GPT-5.3-Codex) e uso nativo de computador em um único lançamento.

Aviso importante: Gemini3.us é uma plataforma independente de comunidade e desenvolvedores. Não somos afiliados nem conectados oficialmente à OpenAI.

Experimente o GPT-5.4 Agora

Experiencie o modelo mais capaz da OpenAI — uso nativo de computador, 1M de contexto e raciocínio de fronteira