Rilasciato il 5 marzo 2026

GPT-5.4

Il modello frontier più capace ed efficiente di OpenAI per il lavoro professionale

OSWorld 75.0% (supera umani) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Ricerca strumenti riduce 47% token

Funzionalità e Capacità di GPT-5.4

Il primo rilascio OpenAI che combina ragionamento, codifica e uso nativo del computer in un unico modello

Uso Nativo del Computer

GPT-5.4 raggiunge 75.0% su OSWorld, superando le prestazioni umane (72.4%). Opera desktop tramite codice Playwright e comandi mouse/tastiera basati su screenshot.

Ragionamento Avanzato

GPT-5.4 ottiene 73.3% su ARC-AGI-2 (GPT-5.2: 52.9%) e 92.8% GPQA Diamond — un vero progresso nel ragionamento.

Codifica Frontier

GPT-5.4 combina i punti di forza di codifica di GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Velocità token 1.5x più rapida in modalità /fast.

Ricerca Strumenti (47% meno token)

La nuova funzione di ricerca strumenti carica le definizioni su richiesta. Riduce l'uso di token del 47% nel benchmark MCP Atlas mantenendo la stessa precisione.

Contesto di 1M Token

GPT-5.4 supporta fino a 1 milione di token di contesto in Codex. Finestra standard di 272K token.

Leader nel Lavoro di Conoscenza

GDPval 83.0% (GPT-5.2: 70.9%), Attività di Modellazione IB 87.3%, 33% meno affermazioni false rispetto a GPT-5.2.

Risultati Benchmark GPT-5.4

Prestazioni all'avanguardia in ragionamento, codifica, uso computer e lavoro di conoscenza

Ragionamento e Scienza

ARC-AGI-2 (Verificato)

Ragionamento astratto — GPT-5.2: 52.9%

73.3%

GPQA Diamond

Conoscenza scientifica a livello dottorale

92.8%

Ultimo Esame dell'Umanità (con strumenti)

Ragionamento accademico — GPT-5.2: 45.5%

53.8%

FrontierMath Tier 1-3

Ragionamento matematico avanzato

62.4%

Codifica e Ingegneria

SWE-Bench Pro (Pubblico)

Attività reali di ingegneria del software

57.7%

Terminal-Bench 2.0

Completamento attività CLI e terminale

75.1%

BrowseComp

Navigazione web e attività di ricerca

71.2%

Toolathlon

Uso strumenti multi-step con API reali

68.9%

Uso Computer e Visione

OSWorld-Verified (desktop)

Supera la baseline umana del 72.4%

75.0%

WebArena-Verified (browser)

Navigazione browser e completamento attività

82.3%

Online-Mind2Web (screenshot)

Interazione web basata su screenshot

69.1%

MMMU Pro (senza strumenti)

Comprensione multimodale

78.4%

Lavoro di Conoscenza

GDPval (vince o pareggia)

44 professioni, 9 settori — GPT-5.2: 70.9%

83.0%

Attività di Modellazione IB

Attività fogli di calcolo investment banking

87.3%

Preferenza Presentazione

I valutatori umani preferiscono le presentazioni di GPT-5.4

71%

Riduzione Affermazioni False

Meno errori fattuali vs GPT-5.2

-33%

Benchmark	GPT-5.4	GPT-5.2
OSWorld (Computer Use)	75.0%	47.3%
ARC-AGI-2	73.3%	52.9%
GPQA Diamond	92.8%	88.1%
GDPval	83.0%	70.9%
HLE (with tools)	53.8%	45.5%
SWE-Bench Pro	57.7%	43.2%
Terminal-Bench 2.0	75.1%	61.4%
IB Modeling Tasks	87.3%	74.1%

Prezzi GPT-5.4

Prezzi API per GPT-5.4 e GPT-5.4 Pro

Model
GPT-5.4	$2.50/M	$0.25/M	$15/M
GPT-5.4 Pro	$30/M	—	$180/M

Elaborazione batch e Flex disponibile a metà tariffa standard. Elaborazione prioritaria al doppio. GPT-5.2 va in pensione il 5 giugno 2026.

FAQ GPT-5.4

Domande frequenti su GPT-5.4

Cos'è GPT-5.4?

GPT-5.4 è il modello frontier più capace di OpenAI, rilasciato il 5 marzo 2026. Combina ragionamento, codifica e uso nativo del computer in un unico modello.

Come si confronta GPT-5.4 con GPT-5.2?

GPT-5.4 supera significativamente GPT-5.2: ARC-AGI-2 sale da 52.9% a 73.3%, GDPval da 70.9% a 83.0%, OSWorld da 47.3% a 75.0% (superando le prestazioni umane), affermazioni false ridotte del 33%.

Cos'è la funzione di uso computer di GPT-5.4?

GPT-5.4 può operare computer nativamente tramite codice Playwright e comandi mouse/tastiera basati su screenshot. Raggiunge 75.0% su OSWorld, superando la baseline umana del 72.4%.

Qual è il prezzo di GPT-5.4?

Prezzi API GPT-5.4: $2.50/M token input, $0.25/M input cache, $15/M output. GPT-5.4 Pro: $30/M input, $180/M output.

Cos'è la ricerca strumenti in GPT-5.4?

La ricerca strumenti carica le definizioni su richiesta. Su 250 attività con 36 server MCP abilitati, ha ridotto l'uso totale di token del 47% mantenendo la stessa precisione.

Quale finestra di contesto supporta GPT-5.4?

GPT-5.4 supporta una finestra di contesto standard di 272K token, con 1M di token disponibile in Codex (fatturato al doppio oltre 272K).

Come si confronta GPT-5.4 con Gemini 3.1 Pro?

GPT-5.4 guida nell'uso computer (OSWorld 75.0%) e lavoro di conoscenza (GDPval 83.0%). Gemini 3.1 Pro guida nella codifica (SWE-Bench 80.6% vs 57.7%) e GPQA Diamond (94.3% vs 92.8%).

GPT-5.4 è disponibile in ChatGPT?

Sì. GPT-5.4 Thinking è disponibile per gli abbonati Plus, Team e Pro in ChatGPT, sostituendo GPT-5.2 Thinking. GPT-5.4 Pro è disponibile per i piani Pro ed Enterprise.

Informazioni su GPT-5.4

GPT-5.4 è il modello di ragionamento di punta di OpenAI lanciato il 5 marzo 2026. È il primo modello principale che combina ragionamento, codifica (GPT-5.3-Codex) e uso nativo del computer in un unico rilascio.

Avviso importante: Gemini3.us è una piattaforma indipendente di comunità e sviluppatori. Non siamo affiliati né ufficialmente connessi a OpenAI.

Prova GPT-5.4 Ora

Sperimenta il modello più capace di OpenAI — uso nativo del computer, 1M di contesto e ragionamento frontier