gemini3.us
Rilasciato il 5 marzo 2026

GPT-5.4

Il modello frontier più capace ed efficiente di OpenAI per il lavoro professionale

OSWorld 75.0% (supera umani) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Ricerca strumenti riduce 47% token

Vedi Benchmark

Funzionalità e Capacità di GPT-5.4

Il primo rilascio OpenAI che combina ragionamento, codifica e uso nativo del computer in un unico modello

Uso Nativo del Computer

GPT-5.4 raggiunge 75.0% su OSWorld, superando le prestazioni umane (72.4%). Opera desktop tramite codice Playwright e comandi mouse/tastiera basati su screenshot.

Ragionamento Avanzato

GPT-5.4 ottiene 73.3% su ARC-AGI-2 (GPT-5.2: 52.9%) e 92.8% GPQA Diamond — un vero progresso nel ragionamento.

Codifica Frontier

GPT-5.4 combina i punti di forza di codifica di GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Velocità token 1.5x più rapida in modalità /fast.

Ricerca Strumenti (47% meno token)

La nuova funzione di ricerca strumenti carica le definizioni su richiesta. Riduce l'uso di token del 47% nel benchmark MCP Atlas mantenendo la stessa precisione.

Contesto di 1M Token

GPT-5.4 supporta fino a 1 milione di token di contesto in Codex. Finestra standard di 272K token.

Leader nel Lavoro di Conoscenza

GDPval 83.0% (GPT-5.2: 70.9%), Attività di Modellazione IB 87.3%, 33% meno affermazioni false rispetto a GPT-5.2.

Risultati Benchmark GPT-5.4

Prestazioni all'avanguardia in ragionamento, codifica, uso computer e lavoro di conoscenza

Ragionamento e Scienza

ARC-AGI-2 (Verificato)
Ragionamento astratto — GPT-5.2: 52.9%
73.3%
GPQA Diamond
Conoscenza scientifica a livello dottorale
92.8%
Ultimo Esame dell'Umanità (con strumenti)
Ragionamento accademico — GPT-5.2: 45.5%
53.8%
FrontierMath Tier 1-3
Ragionamento matematico avanzato
62.4%

Codifica e Ingegneria

SWE-Bench Pro (Pubblico)
Attività reali di ingegneria del software
57.7%
Terminal-Bench 2.0
Completamento attività CLI e terminale
75.1%
BrowseComp
Navigazione web e attività di ricerca
71.2%
Toolathlon
Uso strumenti multi-step con API reali
68.9%

Uso Computer e Visione

OSWorld-Verified (desktop)
Supera la baseline umana del 72.4%
75.0%
WebArena-Verified (browser)
Navigazione browser e completamento attività
82.3%
Online-Mind2Web (screenshot)
Interazione web basata su screenshot
69.1%
MMMU Pro (senza strumenti)
Comprensione multimodale
78.4%

Lavoro di Conoscenza

GDPval (vince o pareggia)
44 professioni, 9 settori — GPT-5.2: 70.9%
83.0%
Attività di Modellazione IB
Attività fogli di calcolo investment banking
87.3%
Preferenza Presentazione
I valutatori umani preferiscono le presentazioni di GPT-5.4
71%
Riduzione Affermazioni False
Meno errori fattuali vs GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Prezzi GPT-5.4

Prezzi API per GPT-5.4 e GPT-5.4 Pro

Model
GPT-5.4$2.50/M$0.25/M$15/M
GPT-5.4 Pro$30/M$180/M

Elaborazione batch e Flex disponibile a metà tariffa standard. Elaborazione prioritaria al doppio. GPT-5.2 va in pensione il 5 giugno 2026.

FAQ GPT-5.4

Domande frequenti su GPT-5.4

Cos'è GPT-5.4?

GPT-5.4 è il modello frontier più capace di OpenAI, rilasciato il 5 marzo 2026. Combina ragionamento, codifica e uso nativo del computer in un unico modello.

Come si confronta GPT-5.4 con GPT-5.2?

GPT-5.4 supera significativamente GPT-5.2: ARC-AGI-2 sale da 52.9% a 73.3%, GDPval da 70.9% a 83.0%, OSWorld da 47.3% a 75.0% (superando le prestazioni umane), affermazioni false ridotte del 33%.

Cos'è la funzione di uso computer di GPT-5.4?

GPT-5.4 può operare computer nativamente tramite codice Playwright e comandi mouse/tastiera basati su screenshot. Raggiunge 75.0% su OSWorld, superando la baseline umana del 72.4%.

Qual è il prezzo di GPT-5.4?

Prezzi API GPT-5.4: $2.50/M token input, $0.25/M input cache, $15/M output. GPT-5.4 Pro: $30/M input, $180/M output.

Cos'è la ricerca strumenti in GPT-5.4?

La ricerca strumenti carica le definizioni su richiesta. Su 250 attività con 36 server MCP abilitati, ha ridotto l'uso totale di token del 47% mantenendo la stessa precisione.

Quale finestra di contesto supporta GPT-5.4?

GPT-5.4 supporta una finestra di contesto standard di 272K token, con 1M di token disponibile in Codex (fatturato al doppio oltre 272K).

Come si confronta GPT-5.4 con Gemini 3.1 Pro?

GPT-5.4 guida nell'uso computer (OSWorld 75.0%) e lavoro di conoscenza (GDPval 83.0%). Gemini 3.1 Pro guida nella codifica (SWE-Bench 80.6% vs 57.7%) e GPQA Diamond (94.3% vs 92.8%).

GPT-5.4 è disponibile in ChatGPT?

Sì. GPT-5.4 Thinking è disponibile per gli abbonati Plus, Team e Pro in ChatGPT, sostituendo GPT-5.2 Thinking. GPT-5.4 Pro è disponibile per i piani Pro ed Enterprise.

Informazioni su GPT-5.4

GPT-5.4 è il modello di ragionamento di punta di OpenAI lanciato il 5 marzo 2026. È il primo modello principale che combina ragionamento, codifica (GPT-5.3-Codex) e uso nativo del computer in un unico rilascio.

Avviso importante: Gemini3.us è una piattaforma indipendente di comunità e sviluppatori. Non siamo affiliati né ufficialmente connessi a OpenAI.

Prova GPT-5.4 Ora

Sperimenta il modello più capace di OpenAI — uso nativo del computer, 1M di contesto e ragionamento frontier