gemini3.us
Lancé le 5 mars 2026

GPT-5.4

Le modèle frontier le plus capable et efficace d'OpenAI pour le travail professionnel

OSWorld 75.0% (dépasse l'humain) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Recherche d'outils réduit 47% tokens

Voir les Benchmarks

Fonctionnalités et Capacités de GPT-5.4

La première version d'OpenAI combinant raisonnement, codage et utilisation native d'ordinateur en un seul modèle

Utilisation Native d'Ordinateur

GPT-5.4 atteint 75.0% sur OSWorld, dépassant les performances humaines (72.4%). Opère les bureaux via du code Playwright et des commandes souris/clavier basées sur des captures d'écran.

Raisonnement Avancé

GPT-5.4 obtient 73.3% sur ARC-AGI-2 (GPT-5.2 : 52.9%) et 92.8% GPQA Diamond — une véritable avancée en raisonnement.

Codage Frontier

GPT-5.4 combine les forces de codage de GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Vitesse de tokens 1.5x plus rapide en mode /fast.

Recherche d'Outils (47% moins de tokens)

La nouvelle fonctionnalité de recherche d'outils charge les définitions à la demande. Réduit l'utilisation de tokens de 47% sur le benchmark MCP Atlas tout en maintenant la même précision.

Contexte de 1M Tokens

GPT-5.4 supporte jusqu'à 1 million de tokens de contexte dans Codex. Fenêtre standard de 272K tokens.

Leader du Travail de Connaissance

GDPval 83.0% (GPT-5.2 : 70.9%), Tâches de Modélisation IB 87.3%, 33% moins d'affirmations fausses que GPT-5.2.

Résultats des Benchmarks GPT-5.4

Performances de pointe en raisonnement, codage, utilisation d'ordinateur et travail de connaissance

Raisonnement et Science

ARC-AGI-2 (Vérifié)
Raisonnement abstrait — GPT-5.2 : 52.9%
73.3%
GPQA Diamond
Connaissances scientifiques au niveau doctoral
92.8%
Dernier Examen de l'Humanité (avec outils)
Raisonnement académique — GPT-5.2 : 45.5%
53.8%
FrontierMath Tier 1-3
Raisonnement mathématique avancé
62.4%

Codage et Ingénierie

SWE-Bench Pro (Public)
Tâches réelles d'ingénierie logicielle
57.7%
Terminal-Bench 2.0
Complétion de tâches CLI et terminal
75.1%
BrowseComp
Navigation web et tâches de recherche
71.2%
Toolathlon
Utilisation d'outils en plusieurs étapes avec de vraies APIs
68.9%

Utilisation d'Ordinateur et Vision

OSWorld-Verified (bureau)
Dépasse la ligne de base humaine de 72.4%
75.0%
WebArena-Verified (navigateur)
Navigation de navigateur et complétion de tâches
82.3%
Online-Mind2Web (captures)
Interaction web basée sur des captures d'écran
69.1%
MMMU Pro (sans outils)
Compréhension multimodale
78.4%

Travail de Connaissance

GDPval (gagne ou égalité)
44 professions, 9 industries — GPT-5.2 : 70.9%
83.0%
Tâches de Modélisation IB
Tâches de tableurs de banque d'investissement
87.3%
Préférence de Présentation
Les évaluateurs humains préfèrent les présentations de GPT-5.4
71%
Réduction des Affirmations Fausses
Moins d'erreurs factuelles vs GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Prix de GPT-5.4

Prix API pour GPT-5.4 et GPT-5.4 Pro

Model
GPT-5.4$2.50/M$0.25/M$15/M
GPT-5.4 Pro$30/M$180/M

Traitement par lots et Flex disponible à la moitié du tarif standard. Traitement prioritaire au double. GPT-5.2 se retire le 5 juin 2026.

FAQ GPT-5.4

Questions fréquemment posées sur GPT-5.4

Qu'est-ce que GPT-5.4 ?

GPT-5.4 est le modèle frontier le plus capable d'OpenAI, lancé le 5 mars 2026. Il combine raisonnement, codage et utilisation native d'ordinateur en un seul modèle.

Comment GPT-5.4 se compare-t-il à GPT-5.2 ?

GPT-5.4 surpasse significativement GPT-5.2 : ARC-AGI-2 passe de 52.9% à 73.3%, GDPval de 70.9% à 83.0%, OSWorld de 47.3% à 75.0% (dépassant les performances humaines), et les affirmations fausses réduites de 33%.

Qu'est-ce que l'utilisation d'ordinateur de GPT-5.4 ?

GPT-5.4 peut opérer des ordinateurs nativement via du code Playwright et des commandes souris/clavier basées sur des captures d'écran. Atteint 75.0% sur OSWorld, dépassant la ligne de base humaine de 72.4%.

Quel est le prix de GPT-5.4 ?

Prix API GPT-5.4 : $2.50/M tokens d'entrée, $0.25/M entrée en cache, $15/M sortie. GPT-5.4 Pro : $30/M entrée, $180/M sortie.

Qu'est-ce que la recherche d'outils dans GPT-5.4 ?

La recherche d'outils charge les définitions d'outils à la demande. Sur 250 tâches avec 36 serveurs MCP activés, a réduit l'utilisation totale de tokens de 47% tout en maintenant la même précision.

Quelle fenêtre de contexte GPT-5.4 supporte-t-il ?

GPT-5.4 supporte une fenêtre de contexte standard de 272K tokens, avec 1M de tokens disponible dans Codex (facturé au double au-delà de 272K).

Comment GPT-5.4 se compare-t-il à Gemini 3.1 Pro ?

GPT-5.4 mène sur l'utilisation d'ordinateur (OSWorld 75.0%) et le travail de connaissance (GDPval 83.0%). Gemini 3.1 Pro mène sur le codage (SWE-Bench 80.6% vs 57.7%) et GPQA Diamond (94.3% vs 92.8%).

GPT-5.4 est-il disponible dans ChatGPT ?

Oui. GPT-5.4 Thinking est disponible pour les abonnés Plus, Team et Pro dans ChatGPT, remplaçant GPT-5.2 Thinking. GPT-5.4 Pro est disponible pour les plans Pro et Enterprise.

À propos de GPT-5.4

GPT-5.4 est le modèle de raisonnement phare d'OpenAI lancé le 5 mars 2026. C'est le premier modèle principal combinant raisonnement, codage (GPT-5.3-Codex) et utilisation native d'ordinateur en un seul lancement.

Avis important : Gemini3.us est une plateforme indépendante de communauté et de développeurs. Nous ne sommes pas affiliés ni officiellement connectés à OpenAI.

Essayez GPT-5.4 Maintenant

Découvrez le modèle le plus capable d'OpenAI — utilisation native d'ordinateur, 1M de contexte et raisonnement frontier