gemini3.us
Ra mắt ngày 5 tháng 3 năm 2026

GPT-5.4

Mô hình frontier mạnh nhất và hiệu quả nhất của OpenAI cho công việc chuyên nghiệp

OSWorld 75.0% (vượt người) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Tìm kiếm công cụ giảm 47% token

Xem Benchmark

Tính năng và Khả năng của GPT-5.4

Lần phát hành đầu tiên của OpenAI kết hợp lý luận, lập trình và sử dụng máy tính gốc trong một mô hình

Sử dụng Máy tính Gốc

GPT-5.4 đạt 75.0% trên OSWorld, vượt hiệu suất con người (72.4%). Điều khiển máy tính qua mã Playwright và lệnh chuột/bàn phím dựa trên ảnh chụp màn hình.

Lý luận Nâng cao

GPT-5.4 đạt 73.3% trên ARC-AGI-2 (GPT-5.2: 52.9%) và 92.8% GPQA Diamond — tiến bộ lý luận thực sự.

Lập trình Frontier

GPT-5.4 kết hợp điểm mạnh lập trình của GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Tốc độ token nhanh hơn 1.5x ở chế độ /fast.

Tìm kiếm Công cụ (giảm 47% token)

Tính năng tìm kiếm công cụ mới tải định nghĩa theo yêu cầu. Giảm sử dụng token 47% trong benchmark MCP Atlas trong khi duy trì độ chính xác tương tự.

Ngữ cảnh 1 triệu Token

GPT-5.4 hỗ trợ tối đa 1 triệu token ngữ cảnh trong Codex. Cửa sổ tiêu chuẩn: 272K token.

Dẫn đầu Công việc Kiến thức

GDPval 83.0% (GPT-5.2: 70.9%), Nhiệm vụ Mô hình hóa IB 87.3%, ít tuyên bố sai hơn GPT-5.2 33%.

Kết quả Benchmark GPT-5.4

Hiệu suất tiên tiến trong lý luận, lập trình, sử dụng máy tính và công việc kiến thức

Lý luận và Khoa học

ARC-AGI-2 (Đã xác minh)
Lý luận trừu tượng — GPT-5.2: 52.9%
73.3%
GPQA Diamond
Kiến thức khoa học cấp tiến sĩ
92.8%
Kỳ thi Cuối cùng của Nhân loại (có công cụ)
Lý luận học thuật — GPT-5.2: 45.5%
53.8%
FrontierMath Tier 1-3
Lý luận toán học nâng cao
62.4%

Lập trình và Kỹ thuật

SWE-Bench Pro (Công khai)
Nhiệm vụ kỹ thuật phần mềm thực tế
57.7%
Terminal-Bench 2.0
Hoàn thành nhiệm vụ CLI và terminal
75.1%
BrowseComp
Duyệt web và nhiệm vụ nghiên cứu
71.2%
Toolathlon
Sử dụng công cụ nhiều bước với API thực
68.9%

Sử dụng Máy tính và Thị giác

OSWorld-Verified (máy tính để bàn)
Vượt mức cơ sở con người 72.4%
75.0%
WebArena-Verified (trình duyệt)
Điều hướng trình duyệt và hoàn thành nhiệm vụ
82.3%
Online-Mind2Web (ảnh chụp màn hình)
Tương tác web dựa trên ảnh chụp màn hình
69.1%
MMMU Pro (không có công cụ)
Hiểu đa phương thức
78.4%

Công việc Kiến thức

GDPval (thắng hoặc hòa)
44 nghề, 9 ngành — GPT-5.2: 70.9%
83.0%
Nhiệm vụ Mô hình hóa IB
Nhiệm vụ bảng tính ngân hàng đầu tư
87.3%
Ưu tiên Bài thuyết trình
Người đánh giá con người thích bài thuyết trình của GPT-5.4
71%
Giảm Tuyên bố Sai
Ít lỗi thực tế hơn so với GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Giá GPT-5.4

Giá API cho GPT-5.4 và GPT-5.4 Pro

Model
GPT-5.4$2.50/triệu$0.25/triệu$15/triệu
GPT-5.4 Pro$30/triệu$180/triệu

Xử lý hàng loạt và Flex có sẵn với nửa giá tiêu chuẩn. Xử lý ưu tiên gấp đôi. GPT-5.2 ngừng hoạt động ngày 5 tháng 6 năm 2026.

Câu hỏi Thường gặp về GPT-5.4

Câu hỏi thường gặp về GPT-5.4

GPT-5.4 là gì?

GPT-5.4 là mô hình frontier mạnh nhất của OpenAI, ra mắt ngày 5 tháng 3 năm 2026. Kết hợp lý luận, lập trình và sử dụng máy tính gốc trong một mô hình.

GPT-5.4 so sánh với GPT-5.2 như thế nào?

GPT-5.4 vượt trội đáng kể so với GPT-5.2: ARC-AGI-2 tăng từ 52.9% lên 73.3%, GDPval từ 70.9% lên 83.0%, OSWorld từ 47.3% lên 75.0% (vượt hiệu suất con người), tuyên bố sai giảm 33%.

Tính năng sử dụng máy tính của GPT-5.4 là gì?

GPT-5.4 có thể điều khiển máy tính gốc qua mã Playwright và lệnh chuột/bàn phím dựa trên ảnh chụp màn hình. Đạt 75.0% trên OSWorld, vượt mức cơ sở con người 72.4%.

Giá GPT-5.4 là bao nhiêu?

Giá API GPT-5.4: $2.50/triệu token đầu vào, $0.25/triệu đầu vào cache, $15/triệu đầu ra. GPT-5.4 Pro: $30/triệu đầu vào, $180/triệu đầu ra.

Tìm kiếm công cụ trong GPT-5.4 là gì?

Tìm kiếm công cụ tải định nghĩa công cụ theo yêu cầu. Trong 250 nhiệm vụ với 36 máy chủ MCP được bật, giảm tổng sử dụng token 47% trong khi duy trì độ chính xác tương tự.

GPT-5.4 hỗ trợ cửa sổ ngữ cảnh bao lớn?

GPT-5.4 hỗ trợ cửa sổ ngữ cảnh tiêu chuẩn 272K token, với 1M token có sẵn trong Codex (tính phí gấp đôi trên 272K).

GPT-5.4 so sánh với Gemini 3.1 Pro như thế nào?

GPT-5.4 dẫn đầu về sử dụng máy tính (OSWorld 75.0%) và công việc kiến thức (GDPval 83.0%). Gemini 3.1 Pro dẫn đầu về lập trình (SWE-Bench 80.6% vs 57.7%) và GPQA Diamond (94.3% vs 92.8%).

GPT-5.4 có sẵn trong ChatGPT không?

Có. GPT-5.4 Thinking có sẵn cho người đăng ký Plus, Team và Pro trong ChatGPT, thay thế GPT-5.2 Thinking. GPT-5.4 Pro có sẵn cho các gói Pro và Enterprise.

Về GPT-5.4

GPT-5.4 là mô hình lý luận hàng đầu của OpenAI ra mắt ngày 5 tháng 3 năm 2026. Đây là mô hình chính đầu tiên kết hợp lý luận, lập trình (GPT-5.3-Codex) và sử dụng máy tính gốc trong một lần phát hành.

Thông báo quan trọng: Gemini3.us là nền tảng cộng đồng và nhà phát triển độc lập. Chúng tôi không liên kết hay kết nối chính thức với OpenAI.

Thử GPT-5.4 Ngay

Trải nghiệm mô hình mạnh nhất của OpenAI — sử dụng máy tính gốc, ngữ cảnh 1M và lý luận frontier