gemini3.us
2026年3月5日リリース

GPT-5.4

OpenAIの最も強力で効率的なフロンティアモデル

OSWorld 75.0%(人間超え)• GPQA Diamond 92.8% • ARC-AGI-2 73.3% • ツール検索で47%トークン削減

GPT-5.4の機能と能力

推論、コーディング、ネイティブコンピュータ操作を1つのモデルに統合した初のOpenAIリリース

ネイティブコンピュータ操作

GPT-5.4はOSWorldで75.0%を達成し、人間のパフォーマンス(72.4%)を超えます。Playwrightコードとスクリーンショットベースのマウスとキーボードコマンドでデスクトップを操作します。

高度な推論

GPT-5.4はARC-AGI-2で73.3%(GPT-5.2は52.9%)、GPQA Diamondで92.8%を達成——真の推論の進歩。

フロンティアコーディング

GPT-5.4はGPT-5.3-Codexのコーディング強みを組み合わせています。SWE-Bench Pro 57.7%、Terminal-Bench 2.0 75.1%。/fastモードでトークン速度1.5倍。

ツール検索(47%トークン削減)

新しいツール検索機能はツール定義をオンデマンドで読み込みます。MCP Atlasベンチマークで同じ精度を維持しながら47%のトークン使用量を削減。

100万トークンコンテキスト

GPT-5.4はCodexで最大100万トークンのコンテキストをサポートし、エージェントが長期間にわたってタスクを計画、実行、検証できます。標準ウィンドウは272Kトークン。

知識作業リーダー

GDPval 83.0%(GPT-5.2は70.9%)、IBモデリングタスク87.3%、GPT-5.2比で虚偽の主張が33%減少。

GPT-5.4ベンチマーク結果

推論、コーディング、コンピュータ操作、知識作業における最先端のパフォーマンス

推論と科学

ARC-AGI-2(検証済み)
抽象推論——GPT-5.2は52.9%
73.3%
GPQA Diamond
博士レベルの科学知識
92.8%
人類最後の試験(ツールあり)
学術的推論——GPT-5.2は45.5%
53.8%
FrontierMath Tier 1-3
高度な数学的推論
62.4%

コーディングとエンジニアリング

SWE-Bench Pro(公開)
実際のソフトウェアエンジニアリングタスク
57.7%
Terminal-Bench 2.0
CLIとターミナルタスクの完了
75.1%
BrowseComp
ウェブブラウジングと調査タスク
71.2%
Toolathlon
実際のAPIを使用したマルチステップツール使用
68.9%

コンピュータ操作とビジョン

OSWorld-Verified(デスクトップ)
人間のベースライン72.4%を超える
75.0%
WebArena-Verified(ブラウザ)
ブラウザナビゲーションとタスク完了
82.3%
Online-Mind2Web(スクリーンショット)
スクリーンショットベースのウェブインタラクション
69.1%
MMMU Pro(ツールなし)
マルチモーダル理解
78.4%

知識作業

GDPval(勝利または引き分け)
44職業、9産業——GPT-5.2は70.9%
83.0%
IBモデリングタスク
投資銀行スプレッドシートタスク
87.3%
プレゼンテーション選好
人間の評価者がGPT-5.4のプレゼンテーションを好む
71%
虚偽の主張の削減
GPT-5.2と比較して事実誤りが減少
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

GPT-5.4 価格

GPT-5.4とGPT-5.4 ProのAPI価格

Model
GPT-5.4$2.50/百万$0.25/百万$15/百万
GPT-5.4 Pro$30/百万$180/百万

バッチとFlexは標準レートの半額。優先処理は2倍。GPT-5.2は2026年6月5日に廃止。

GPT-5.4 よくある質問

GPT-5.4に関するよくある質問

GPT-5.4とは何ですか?

GPT-5.4はOpenAIが2026年3月5日にリリースした最も強力なフロンティアモデルです。推論、コーディング、ネイティブコンピュータ操作を1つのモデルに統合しています。

GPT-5.4はGPT-5.2と比べてどうですか?

GPT-5.4はGPT-5.2を大幅に上回ります:ARC-AGI-2は52.9%から73.3%に、GDPvalは70.9%から83.0%に、OSWorldは47.3%から75.0%(人間のパフォーマンスを超える)に向上し、虚偽の主張が33%減少しました。

GPT-5.4のコンピュータ操作機能とは何ですか?

GPT-5.4はPlaywrightコードとスクリーンショットベースのマウス/キーボードコマンドでコンピュータをネイティブに操作できます。OSWorldで75.0%を達成し、人間のベースライン72.4%を超えます。

GPT-5.4の価格はいくらですか?

GPT-5.4 API価格:入力$2.50/百万トークン、キャッシュ入力$0.25/百万、出力$15/百万。GPT-5.4 Pro:入力$30/百万、出力$180/百万。

GPT-5.4のツール検索とは何ですか?

ツール検索はツール定義をオンデマンドで読み込む新機能です。36のMCPサーバーを有効にした250のタスクで、同じ精度を維持しながらトークン使用量を47%削減しました。

GPT-5.4はどのくらいのコンテキストウィンドウをサポートしていますか?

GPT-5.4は標準272Kトークンコンテキストウィンドウをサポートし、Codexでは100万トークンコンテキストが利用可能です(272Kを超えると2倍のレートで請求)。

GPT-5.4はGemini 3.1 Proと比べてどうですか?

GPT-5.4はコンピュータ操作(OSWorld 75.0%)と知識作業(GDPval 83.0%)でリードしています。Gemini 3.1 Proはコーディング(SWE-Bench 80.6% vs 57.7%)とGPQA Diamond(94.3% vs 92.8%)でリードしています。

GPT-5.4はChatGPTで利用できますか?

はい。GPT-5.4 ThinkingはChatGPTのPlus、Team、Proサブスクライバーが利用でき、GPT-5.2 Thinkingを置き換えます。GPT-5.4 ProはProとEnterpriseプランで利用できます。

GPT-5.4について

GPT-5.4はOpenAIが2026年3月5日にリリースしたフラッグシップ推論モデルです。推論、コーディング(GPT-5.3-Codex)、ネイティブコンピュータ操作を1つのリリースに統合した初のメインラインモデルです。

重要なお知らせ:Gemini3.usは独立した愛好者コミュニティおよび開発者プラットフォームです。OpenAIとは一切関係がありません。

今すぐGPT-5.4を試す

OpenAIの最も強力なモデルを体験——ネイティブコンピュータ操作、100万コンテキスト、フロンティア推論