2026年3月5日リリース

GPT-5.4

OpenAIの最も強力で効率的なフロンティアモデル

OSWorld 75.0%（人間超え）• GPQA Diamond 92.8% • ARC-AGI-2 73.3% • ツール検索で47%トークン削減

ベンチマークを見る

GPT-5.4の機能と能力

推論、コーディング、ネイティブコンピュータ操作を1つのモデルに統合した初のOpenAIリリース

ネイティブコンピュータ操作

GPT-5.4はOSWorldで75.0%を達成し、人間のパフォーマンス（72.4%）を超えます。Playwrightコードとスクリーンショットベースのマウスとキーボードコマンドでデスクトップを操作します。

高度な推論

GPT-5.4はARC-AGI-2で73.3%（GPT-5.2は52.9%）、GPQA Diamondで92.8%を達成——真の推論の進歩。

フロンティアコーディング

GPT-5.4はGPT-5.3-Codexのコーディング強みを組み合わせています。SWE-Bench Pro 57.7%、Terminal-Bench 2.0 75.1%。/fastモードでトークン速度1.5倍。

ツール検索（47%トークン削減）

新しいツール検索機能はツール定義をオンデマンドで読み込みます。MCP Atlasベンチマークで同じ精度を維持しながら47%のトークン使用量を削減。

100万トークンコンテキスト

GPT-5.4はCodexで最大100万トークンのコンテキストをサポートし、エージェントが長期間にわたってタスクを計画、実行、検証できます。標準ウィンドウは272Kトークン。

知識作業リーダー

GDPval 83.0%（GPT-5.2は70.9%）、IBモデリングタスク87.3%、GPT-5.2比で虚偽の主張が33%減少。

GPT-5.4ベンチマーク結果

推論、コーディング、コンピュータ操作、知識作業における最先端のパフォーマンス

推論と科学

ARC-AGI-2（検証済み）

抽象推論——GPT-5.2は52.9%

73.3%

GPQA Diamond

博士レベルの科学知識

92.8%

人類最後の試験（ツールあり）

学術的推論——GPT-5.2は45.5%

53.8%

FrontierMath Tier 1-3

高度な数学的推論

62.4%

コーディングとエンジニアリング

SWE-Bench Pro（公開）

実際のソフトウェアエンジニアリングタスク

57.7%

Terminal-Bench 2.0

CLIとターミナルタスクの完了

75.1%

BrowseComp

ウェブブラウジングと調査タスク

71.2%

Toolathlon

実際のAPIを使用したマルチステップツール使用

68.9%

コンピュータ操作とビジョン

OSWorld-Verified（デスクトップ）

人間のベースライン72.4%を超える

75.0%

WebArena-Verified（ブラウザ）

ブラウザナビゲーションとタスク完了

82.3%

Online-Mind2Web（スクリーンショット）

スクリーンショットベースのウェブインタラクション

69.1%

MMMU Pro（ツールなし）

マルチモーダル理解

78.4%

知識作業

GDPval（勝利または引き分け）

44職業、9産業——GPT-5.2は70.9%

83.0%

IBモデリングタスク

投資銀行スプレッドシートタスク

87.3%

プレゼンテーション選好

人間の評価者がGPT-5.4のプレゼンテーションを好む

71%

虚偽の主張の削減

GPT-5.2と比較して事実誤りが減少

-33%

Benchmark	GPT-5.4	GPT-5.2
OSWorld (Computer Use)	75.0%	47.3%
ARC-AGI-2	73.3%	52.9%
GPQA Diamond	92.8%	88.1%
GDPval	83.0%	70.9%
HLE (with tools)	53.8%	45.5%
SWE-Bench Pro	57.7%	43.2%
Terminal-Bench 2.0	75.1%	61.4%
IB Modeling Tasks	87.3%	74.1%

GPT-5.4 価格

GPT-5.4とGPT-5.4 ProのAPI価格

Model
GPT-5.4	$2.50/百万	$0.25/百万	$15/百万
GPT-5.4 Pro	$30/百万	—	$180/百万

バッチとFlexは標準レートの半額。優先処理は2倍。GPT-5.2は2026年6月5日に廃止。

GPT-5.4 よくある質問

GPT-5.4に関するよくある質問

GPT-5.4とは何ですか？

GPT-5.4はOpenAIが2026年3月5日にリリースした最も強力なフロンティアモデルです。推論、コーディング、ネイティブコンピュータ操作を1つのモデルに統合しています。

GPT-5.4はGPT-5.2と比べてどうですか？

GPT-5.4はGPT-5.2を大幅に上回ります：ARC-AGI-2は52.9%から73.3%に、GDPvalは70.9%から83.0%に、OSWorldは47.3%から75.0%（人間のパフォーマンスを超える）に向上し、虚偽の主張が33%減少しました。

GPT-5.4のコンピュータ操作機能とは何ですか？

GPT-5.4はPlaywrightコードとスクリーンショットベースのマウス/キーボードコマンドでコンピュータをネイティブに操作できます。OSWorldで75.0%を達成し、人間のベースライン72.4%を超えます。

GPT-5.4の価格はいくらですか？

GPT-5.4 API価格：入力$2.50/百万トークン、キャッシュ入力$0.25/百万、出力$15/百万。GPT-5.4 Pro：入力$30/百万、出力$180/百万。

GPT-5.4のツール検索とは何ですか？

ツール検索はツール定義をオンデマンドで読み込む新機能です。36のMCPサーバーを有効にした250のタスクで、同じ精度を維持しながらトークン使用量を47%削減しました。

GPT-5.4はどのくらいのコンテキストウィンドウをサポートしていますか？

GPT-5.4は標準272Kトークンコンテキストウィンドウをサポートし、Codexでは100万トークンコンテキストが利用可能です（272Kを超えると2倍のレートで請求）。

GPT-5.4はGemini 3.1 Proと比べてどうですか？

GPT-5.4はコンピュータ操作（OSWorld 75.0%）と知識作業（GDPval 83.0%）でリードしています。Gemini 3.1 Proはコーディング（SWE-Bench 80.6% vs 57.7%）とGPQA Diamond（94.3% vs 92.8%）でリードしています。

GPT-5.4はChatGPTで利用できますか？

はい。GPT-5.4 ThinkingはChatGPTのPlus、Team、Proサブスクライバーが利用でき、GPT-5.2 Thinkingを置き換えます。GPT-5.4 ProはProとEnterpriseプランで利用できます。

GPT-5.4について

GPT-5.4はOpenAIが2026年3月5日にリリースしたフラッグシップ推論モデルです。推論、コーディング（GPT-5.3-Codex）、ネイティブコンピュータ操作を1つのリリースに統合した初のメインラインモデルです。

重要なお知らせ：Gemini3.usは独立した愛好者コミュニティおよび開発者プラットフォームです。OpenAIとは一切関係がありません。

今すぐGPT-5.4を試す

OpenAIの最も強力なモデルを体験——ネイティブコンピュータ操作、100万コンテキスト、フロンティア推論