gemini3.us
Dirilis 5 Maret 2026

GPT-5.4

Model frontier OpenAI paling canggih dan efisien untuk pekerjaan profesional

75,0% OSWorld (melampaui manusia) • 92,8% GPQA Diamond • 73,3% ARC-AGI-2 • Pengurangan token 47% dengan tool search

Jelajahi Benchmark
75,0%
OSWorld (Computer Use)
92,8%
GPQA Diamond
73,3%
ARC-AGI-2
83,0%
GDPval Pekerjaan Pengetahuan

Fitur & Kemampuan GPT-5.4

Model OpenAI pertama yang menggabungkan penalaran, coding, dan computer use native dalam satu rilis

Computer Use Native

GPT-5.4 mencapai 75,0% di OSWorld, melampaui performa manusia (72,4%). Mengoperasikan desktop via kode Playwright dan perintah mouse/keyboard berbasis screenshot.

Penalaran Canggih

GPT-5.4 meraih 73,3% di ARC-AGI-2 (naik dari 52,9% di GPT-5.2) dan 92,8% GPQA Diamond — kemajuan penalaran nyata, bukan sekadar pembungkus tool-use.

Coding Frontier

GPT-5.4 menggabungkan kekuatan coding GPT-5.3-Codex dengan kemampuan lebih luas. Meraih 57,7% SWE-Bench Pro dan 75,1% Terminal-Bench 2.0. Hingga 1,5x lebih cepat di mode /fast.

Tool Search (Hemat Token 47%)

Fitur tool search baru memuat definisi tool sesuai kebutuhan, bukan sekaligus di awal. Mengurangi penggunaan token total 47% pada benchmark MCP Atlas dengan akurasi yang sama.

Konteks 1M Token

GPT-5.4 mendukung hingga 1 juta token konteks di Codex, memungkinkan agen merencanakan, mengeksekusi, dan memverifikasi tugas jangka panjang. Jendela standar 272K token.

Pemimpin Pekerjaan Pengetahuan

GPT-5.4 meraih 83,0% di GDPval (naik dari 70,9%), 87,3% di IB Modeling Tasks, dan menghasilkan 33% lebih sedikit klaim palsu dibanding GPT-5.2.

Hasil Benchmark GPT-5.4

Performa terdepan di penalaran, coding, computer use, dan pekerjaan pengetahuan

Penalaran & Sains

ARC-AGI-2 (Terverifikasi)
Penalaran abstrak — naik dari 52,9% di GPT-5.2
73.3%
GPQA Diamond
Pengetahuan ilmiah tingkat PhD
92.8%
Humanity's Last Exam (dengan tools)
Penalaran akademik — naik dari 45,5% di GPT-5.2
53.8%
FrontierMath Tier 1-3
Penalaran matematika tingkat lanjut
62.4%

Coding & Rekayasa

SWE-Bench Pro (Publik)
Tugas rekayasa perangkat lunak nyata
57.7%
Terminal-Bench 2.0
Penyelesaian tugas CLI dan terminal
75.1%
BrowseComp
Penelusuran web dan tugas riset
71.2%
Toolathlon
Penggunaan tool multi-langkah dengan API nyata
68.9%

Computer Use & Vision

OSWorld-Verified (desktop)
Melampaui baseline manusia 72,4%
75.0%
WebArena-Verified (browser)
Navigasi browser dan penyelesaian tugas
82.3%
Online-Mind2Web (screenshot)
Interaksi web berbasis screenshot
69.1%
MMMU Pro (tanpa tools)
Pemahaman multimodal
78.4%

Pekerjaan Pengetahuan

GDPval (menang atau seri)
44 pekerjaan, 9 industri — naik dari 70,9%
83.0%
IB Modeling Tasks
Tugas spreadsheet investment banking
87.3%
Preferensi Presentasi
Penilai manusia lebih memilih presentasi GPT-5.4
71%
Pengurangan Klaim Palsu
Lebih sedikit kesalahan faktual vs GPT-5.2
-33%

Perbandingan Benchmark Lengkap GPT-5.4

GPT-5.4 vs GPT-5.2 — data performa lengkap

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Sumber: Rilis resmi OpenAI, 5 Maret 2026

Harga GPT-5.4

Harga API untuk GPT-5.4 dan GPT-5.4 Pro

ModelInputInput CachedOutput
GPT-5.4$2,50/1M$0,25/1M$15/1M
GPT-5.4 Pro$30/1M$180/1M

Pemrosesan Batch dan Flex tersedia dengan setengah tarif standar. Pemrosesan prioritas 2x. GPT-5.2 pensiun 5 Juni 2026.

FAQ GPT-5.4

Pertanyaan yang sering diajukan tentang GPT-5.4

Apa itu GPT-5.4?

GPT-5.4 adalah model frontier OpenAI paling canggih, dirilis 5 Maret 2026. Menggabungkan penalaran, coding, dan computer use native dalam satu model — pertama kalinya OpenAI menyatukan kemampuan ini dalam satu rilis.

Bagaimana GPT-5.4 dibandingkan dengan GPT-5.2?

GPT-5.4 jauh melampaui GPT-5.2: ARC-AGI-2 naik dari 52,9% ke 73,3%, GDPval dari 70,9% ke 83,0%, OSWorld dari 47,3% ke 75,0% (melampaui performa manusia), dan klaim palsu berkurang 33%.

Apa itu computer use GPT-5.4?

GPT-5.4 dapat mengoperasikan komputer secara native via kode Playwright dan perintah mouse/keyboard berbasis screenshot. Mencapai 75,0% di OSWorld, melampaui baseline manusia 72,4% — menjadikannya model terkuat untuk otomasi desktop.

Berapa harga GPT-5.4?

Harga API GPT-5.4: $2,50/1M token input, $0,25/1M input cached, $15/1M output. GPT-5.4 Pro: $30/1M input, $180/1M output. Pemrosesan Batch dan Flex tersedia dengan setengah tarif. GPT-5.2 pensiun 5 Juni 2026.

Apa itu tool search di GPT-5.4?

Tool search adalah fitur baru yang memuat definisi tool sesuai kebutuhan, bukan menyertakan semua definisi di awal. Pada 250 tugas dengan 36 server MCP aktif, mengurangi penggunaan token total 47% dengan akurasi yang sama — penghematan biaya besar untuk alur kerja agentic enterprise.

Berapa jendela konteks yang didukung GPT-5.4?

GPT-5.4 mendukung jendela konteks standar 272K token, dengan konteks 1M token tersedia di Codex (ditagih 2x tarif normal di atas 272K). Ini adalah model OpenAI pertama yang mendukung panjang konteks di atas 256K token.

Bagaimana GPT-5.4 dibandingkan dengan Gemini 3.1 Pro?

GPT-5.4 unggul di computer use (75,0% OSWorld vs tidak ada yang setara), pekerjaan pengetahuan (83,0% GDPval), dan ARC-AGI-2 (73,3% vs 77,1% untuk Gemini 3.1 Pro). Gemini 3.1 Pro unggul di coding (80,6% SWE-Bench vs 57,7%) dan GPQA Diamond (94,3% vs 92,8%). Keduanya adalah model frontier dengan kekuatan berbeda.

Apakah GPT-5.4 tersedia di ChatGPT?

Ya. GPT-5.4 Thinking tersedia untuk pelanggan Plus, Team, dan Pro di ChatGPT, menggantikan GPT-5.2 Thinking. GPT-5.4 Pro tersedia untuk paket Pro dan Enterprise. Admin Enterprise dan Edu dapat mengaktifkan akses awal melalui pengaturan admin.

Tentang GPT-5.4

GPT-5.4 adalah model penalaran unggulan OpenAI yang dirilis pada 5 Maret 2026. Ini adalah model mainline pertama yang menggabungkan penalaran, coding (GPT-5.3-Codex), dan computer use native dalam satu rilis. GPT-5.4 melampaui performa manusia di navigasi desktop OSWorld, mengurangi klaim palsu 33% vs GPT-5.2, dan memperkenalkan tool search yang memangkas biaya token 47% untuk alur kerja agentic kompleks.

Pemberitahuan Penting: Gemini3.us adalah platform komunitas penggemar dan pengembang independen. Kami tidak berafiliasi, didukung, atau terhubung secara resmi dengan OpenAI. Kami menyediakan akses berbayar ke layanan API resmi OpenAI untuk mendukung infrastruktur dan operasional kami.

Coba GPT-5.4 Sekarang

Rasakan model OpenAI paling canggih — computer use native, konteks 1M, dan penalaran frontier