GPT-5.4
Mô hình frontier mạnh nhất và hiệu quả nhất của OpenAI cho công việc chuyên nghiệp
OSWorld 75.0% (vượt người) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Tìm kiếm công cụ giảm 47% token
Tính năng và Khả năng của GPT-5.4
Lần phát hành đầu tiên của OpenAI kết hợp lý luận, lập trình và sử dụng máy tính gốc trong một mô hình
Sử dụng Máy tính Gốc
GPT-5.4 đạt 75.0% trên OSWorld, vượt hiệu suất con người (72.4%). Điều khiển máy tính qua mã Playwright và lệnh chuột/bàn phím dựa trên ảnh chụp màn hình.
Lý luận Nâng cao
GPT-5.4 đạt 73.3% trên ARC-AGI-2 (GPT-5.2: 52.9%) và 92.8% GPQA Diamond — tiến bộ lý luận thực sự.
Lập trình Frontier
GPT-5.4 kết hợp điểm mạnh lập trình của GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Tốc độ token nhanh hơn 1.5x ở chế độ /fast.
Tìm kiếm Công cụ (giảm 47% token)
Tính năng tìm kiếm công cụ mới tải định nghĩa theo yêu cầu. Giảm sử dụng token 47% trong benchmark MCP Atlas trong khi duy trì độ chính xác tương tự.
Ngữ cảnh 1 triệu Token
GPT-5.4 hỗ trợ tối đa 1 triệu token ngữ cảnh trong Codex. Cửa sổ tiêu chuẩn: 272K token.
Dẫn đầu Công việc Kiến thức
GDPval 83.0% (GPT-5.2: 70.9%), Nhiệm vụ Mô hình hóa IB 87.3%, ít tuyên bố sai hơn GPT-5.2 33%.
Kết quả Benchmark GPT-5.4
Hiệu suất tiên tiến trong lý luận, lập trình, sử dụng máy tính và công việc kiến thức
Lý luận và Khoa học
Lập trình và Kỹ thuật
Sử dụng Máy tính và Thị giác
Công việc Kiến thức
| Benchmark | GPT-5.4 | GPT-5.2 |
|---|---|---|
| OSWorld (Computer Use) | 75.0% | 47.3% |
| ARC-AGI-2 | 73.3% | 52.9% |
| GPQA Diamond | 92.8% | 88.1% |
| GDPval | 83.0% | 70.9% |
| HLE (with tools) | 53.8% | 45.5% |
| SWE-Bench Pro | 57.7% | 43.2% |
| Terminal-Bench 2.0 | 75.1% | 61.4% |
| IB Modeling Tasks | 87.3% | 74.1% |
Giá GPT-5.4
Giá API cho GPT-5.4 và GPT-5.4 Pro
| Model | |||
|---|---|---|---|
| GPT-5.4 | $2.50/triệu | $0.25/triệu | $15/triệu |
| GPT-5.4 Pro | $30/triệu | — | $180/triệu |
Xử lý hàng loạt và Flex có sẵn với nửa giá tiêu chuẩn. Xử lý ưu tiên gấp đôi. GPT-5.2 ngừng hoạt động ngày 5 tháng 6 năm 2026.
Câu hỏi Thường gặp về GPT-5.4
Câu hỏi thường gặp về GPT-5.4
GPT-5.4 là gì?
GPT-5.4 là mô hình frontier mạnh nhất của OpenAI, ra mắt ngày 5 tháng 3 năm 2026. Kết hợp lý luận, lập trình và sử dụng máy tính gốc trong một mô hình.
GPT-5.4 so sánh với GPT-5.2 như thế nào?
GPT-5.4 vượt trội đáng kể so với GPT-5.2: ARC-AGI-2 tăng từ 52.9% lên 73.3%, GDPval từ 70.9% lên 83.0%, OSWorld từ 47.3% lên 75.0% (vượt hiệu suất con người), tuyên bố sai giảm 33%.
Tính năng sử dụng máy tính của GPT-5.4 là gì?
GPT-5.4 có thể điều khiển máy tính gốc qua mã Playwright và lệnh chuột/bàn phím dựa trên ảnh chụp màn hình. Đạt 75.0% trên OSWorld, vượt mức cơ sở con người 72.4%.
Giá GPT-5.4 là bao nhiêu?
Giá API GPT-5.4: $2.50/triệu token đầu vào, $0.25/triệu đầu vào cache, $15/triệu đầu ra. GPT-5.4 Pro: $30/triệu đầu vào, $180/triệu đầu ra.
Tìm kiếm công cụ trong GPT-5.4 là gì?
Tìm kiếm công cụ tải định nghĩa công cụ theo yêu cầu. Trong 250 nhiệm vụ với 36 máy chủ MCP được bật, giảm tổng sử dụng token 47% trong khi duy trì độ chính xác tương tự.
GPT-5.4 hỗ trợ cửa sổ ngữ cảnh bao lớn?
GPT-5.4 hỗ trợ cửa sổ ngữ cảnh tiêu chuẩn 272K token, với 1M token có sẵn trong Codex (tính phí gấp đôi trên 272K).
GPT-5.4 so sánh với Gemini 3.1 Pro như thế nào?
GPT-5.4 dẫn đầu về sử dụng máy tính (OSWorld 75.0%) và công việc kiến thức (GDPval 83.0%). Gemini 3.1 Pro dẫn đầu về lập trình (SWE-Bench 80.6% vs 57.7%) và GPQA Diamond (94.3% vs 92.8%).
GPT-5.4 có sẵn trong ChatGPT không?
Có. GPT-5.4 Thinking có sẵn cho người đăng ký Plus, Team và Pro trong ChatGPT, thay thế GPT-5.2 Thinking. GPT-5.4 Pro có sẵn cho các gói Pro và Enterprise.
Về GPT-5.4
GPT-5.4 là mô hình lý luận hàng đầu của OpenAI ra mắt ngày 5 tháng 3 năm 2026. Đây là mô hình chính đầu tiên kết hợp lý luận, lập trình (GPT-5.3-Codex) và sử dụng máy tính gốc trong một lần phát hành.
Thông báo quan trọng: Gemini3.us là nền tảng cộng đồng và nhà phát triển độc lập. Chúng tôi không liên kết hay kết nối chính thức với OpenAI.
Thử GPT-5.4 Ngay
Trải nghiệm mô hình mạnh nhất của OpenAI — sử dụng máy tính gốc, ngữ cảnh 1M và lý luận frontier