GPT-5.4
OpenAIの最も強力で効率的なフロンティアモデル
OSWorld 75.0%(人間超え)• GPQA Diamond 92.8% • ARC-AGI-2 73.3% • ツール検索で47%トークン削減
GPT-5.4の機能と能力
推論、コーディング、ネイティブコンピュータ操作を1つのモデルに統合した初のOpenAIリリース
ネイティブコンピュータ操作
GPT-5.4はOSWorldで75.0%を達成し、人間のパフォーマンス(72.4%)を超えます。Playwrightコードとスクリーンショットベースのマウスとキーボードコマンドでデスクトップを操作します。
高度な推論
GPT-5.4はARC-AGI-2で73.3%(GPT-5.2は52.9%)、GPQA Diamondで92.8%を達成——真の推論の進歩。
フロンティアコーディング
GPT-5.4はGPT-5.3-Codexのコーディング強みを組み合わせています。SWE-Bench Pro 57.7%、Terminal-Bench 2.0 75.1%。/fastモードでトークン速度1.5倍。
ツール検索(47%トークン削減)
新しいツール検索機能はツール定義をオンデマンドで読み込みます。MCP Atlasベンチマークで同じ精度を維持しながら47%のトークン使用量を削減。
100万トークンコンテキスト
GPT-5.4はCodexで最大100万トークンのコンテキストをサポートし、エージェントが長期間にわたってタスクを計画、実行、検証できます。標準ウィンドウは272Kトークン。
知識作業リーダー
GDPval 83.0%(GPT-5.2は70.9%)、IBモデリングタスク87.3%、GPT-5.2比で虚偽の主張が33%減少。
GPT-5.4ベンチマーク結果
推論、コーディング、コンピュータ操作、知識作業における最先端のパフォーマンス
推論と科学
コーディングとエンジニアリング
コンピュータ操作とビジョン
知識作業
| Benchmark | GPT-5.4 | GPT-5.2 |
|---|---|---|
| OSWorld (Computer Use) | 75.0% | 47.3% |
| ARC-AGI-2 | 73.3% | 52.9% |
| GPQA Diamond | 92.8% | 88.1% |
| GDPval | 83.0% | 70.9% |
| HLE (with tools) | 53.8% | 45.5% |
| SWE-Bench Pro | 57.7% | 43.2% |
| Terminal-Bench 2.0 | 75.1% | 61.4% |
| IB Modeling Tasks | 87.3% | 74.1% |
GPT-5.4 価格
GPT-5.4とGPT-5.4 ProのAPI価格
| Model | |||
|---|---|---|---|
| GPT-5.4 | $2.50/百万 | $0.25/百万 | $15/百万 |
| GPT-5.4 Pro | $30/百万 | — | $180/百万 |
バッチとFlexは標準レートの半額。優先処理は2倍。GPT-5.2は2026年6月5日に廃止。
GPT-5.4 よくある質問
GPT-5.4に関するよくある質問
GPT-5.4とは何ですか?
GPT-5.4はOpenAIが2026年3月5日にリリースした最も強力なフロンティアモデルです。推論、コーディング、ネイティブコンピュータ操作を1つのモデルに統合しています。
GPT-5.4はGPT-5.2と比べてどうですか?
GPT-5.4はGPT-5.2を大幅に上回ります:ARC-AGI-2は52.9%から73.3%に、GDPvalは70.9%から83.0%に、OSWorldは47.3%から75.0%(人間のパフォーマンスを超える)に向上し、虚偽の主張が33%減少しました。
GPT-5.4のコンピュータ操作機能とは何ですか?
GPT-5.4はPlaywrightコードとスクリーンショットベースのマウス/キーボードコマンドでコンピュータをネイティブに操作できます。OSWorldで75.0%を達成し、人間のベースライン72.4%を超えます。
GPT-5.4の価格はいくらですか?
GPT-5.4 API価格:入力$2.50/百万トークン、キャッシュ入力$0.25/百万、出力$15/百万。GPT-5.4 Pro:入力$30/百万、出力$180/百万。
GPT-5.4のツール検索とは何ですか?
ツール検索はツール定義をオンデマンドで読み込む新機能です。36のMCPサーバーを有効にした250のタスクで、同じ精度を維持しながらトークン使用量を47%削減しました。
GPT-5.4はどのくらいのコンテキストウィンドウをサポートしていますか?
GPT-5.4は標準272Kトークンコンテキストウィンドウをサポートし、Codexでは100万トークンコンテキストが利用可能です(272Kを超えると2倍のレートで請求)。
GPT-5.4はGemini 3.1 Proと比べてどうですか?
GPT-5.4はコンピュータ操作(OSWorld 75.0%)と知識作業(GDPval 83.0%)でリードしています。Gemini 3.1 Proはコーディング(SWE-Bench 80.6% vs 57.7%)とGPQA Diamond(94.3% vs 92.8%)でリードしています。
GPT-5.4はChatGPTで利用できますか?
はい。GPT-5.4 ThinkingはChatGPTのPlus、Team、Proサブスクライバーが利用でき、GPT-5.2 Thinkingを置き換えます。GPT-5.4 ProはProとEnterpriseプランで利用できます。
GPT-5.4について
GPT-5.4はOpenAIが2026年3月5日にリリースしたフラッグシップ推論モデルです。推論、コーディング(GPT-5.3-Codex)、ネイティブコンピュータ操作を1つのリリースに統合した初のメインラインモデルです。
重要なお知らせ:Gemini3.usは独立した愛好者コミュニティおよび開発者プラットフォームです。OpenAIとは一切関係がありません。
今すぐGPT-5.4を試す
OpenAIの最も強力なモデルを体験——ネイティブコンピュータ操作、100万コンテキスト、フロンティア推論