Ra mắt ngày 5 tháng 3 năm 2026

GPT-5.4

Mô hình frontier mạnh nhất và hiệu quả nhất của OpenAI cho công việc chuyên nghiệp

OSWorld 75.0% (vượt người) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Tìm kiếm công cụ giảm 47% token

Tính năng và Khả năng của GPT-5.4

Lần phát hành đầu tiên của OpenAI kết hợp lý luận, lập trình và sử dụng máy tính gốc trong một mô hình

Sử dụng Máy tính Gốc

GPT-5.4 đạt 75.0% trên OSWorld, vượt hiệu suất con người (72.4%). Điều khiển máy tính qua mã Playwright và lệnh chuột/bàn phím dựa trên ảnh chụp màn hình.

Lý luận Nâng cao

GPT-5.4 đạt 73.3% trên ARC-AGI-2 (GPT-5.2: 52.9%) và 92.8% GPQA Diamond — tiến bộ lý luận thực sự.

Lập trình Frontier

GPT-5.4 kết hợp điểm mạnh lập trình của GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Tốc độ token nhanh hơn 1.5x ở chế độ /fast.

Tìm kiếm Công cụ (giảm 47% token)

Tính năng tìm kiếm công cụ mới tải định nghĩa theo yêu cầu. Giảm sử dụng token 47% trong benchmark MCP Atlas trong khi duy trì độ chính xác tương tự.

Ngữ cảnh 1 triệu Token

GPT-5.4 hỗ trợ tối đa 1 triệu token ngữ cảnh trong Codex. Cửa sổ tiêu chuẩn: 272K token.

Dẫn đầu Công việc Kiến thức

GDPval 83.0% (GPT-5.2: 70.9%), Nhiệm vụ Mô hình hóa IB 87.3%, ít tuyên bố sai hơn GPT-5.2 33%.

Kết quả Benchmark GPT-5.4

Hiệu suất tiên tiến trong lý luận, lập trình, sử dụng máy tính và công việc kiến thức

Lý luận và Khoa học

ARC-AGI-2 (Đã xác minh)

Lý luận trừu tượng — GPT-5.2: 52.9%

73.3%

GPQA Diamond

Kiến thức khoa học cấp tiến sĩ

92.8%

Kỳ thi Cuối cùng của Nhân loại (có công cụ)

Lý luận học thuật — GPT-5.2: 45.5%

53.8%

FrontierMath Tier 1-3

Lý luận toán học nâng cao

62.4%

Lập trình và Kỹ thuật

SWE-Bench Pro (Công khai)

Nhiệm vụ kỹ thuật phần mềm thực tế

57.7%

Terminal-Bench 2.0

Hoàn thành nhiệm vụ CLI và terminal

75.1%

BrowseComp

Duyệt web và nhiệm vụ nghiên cứu

71.2%

Toolathlon

Sử dụng công cụ nhiều bước với API thực

68.9%

Sử dụng Máy tính và Thị giác

OSWorld-Verified (máy tính để bàn)

Vượt mức cơ sở con người 72.4%

75.0%

WebArena-Verified (trình duyệt)

Điều hướng trình duyệt và hoàn thành nhiệm vụ

82.3%

Online-Mind2Web (ảnh chụp màn hình)

Tương tác web dựa trên ảnh chụp màn hình

69.1%

MMMU Pro (không có công cụ)

Hiểu đa phương thức

78.4%

Công việc Kiến thức

GDPval (thắng hoặc hòa)

44 nghề, 9 ngành — GPT-5.2: 70.9%

83.0%

Nhiệm vụ Mô hình hóa IB

Nhiệm vụ bảng tính ngân hàng đầu tư

87.3%

Ưu tiên Bài thuyết trình

Người đánh giá con người thích bài thuyết trình của GPT-5.4

71%

Giảm Tuyên bố Sai

Ít lỗi thực tế hơn so với GPT-5.2

-33%

Benchmark	GPT-5.4	GPT-5.2
OSWorld (Computer Use)	75.0%	47.3%
ARC-AGI-2	73.3%	52.9%
GPQA Diamond	92.8%	88.1%
GDPval	83.0%	70.9%
HLE (with tools)	53.8%	45.5%
SWE-Bench Pro	57.7%	43.2%
Terminal-Bench 2.0	75.1%	61.4%
IB Modeling Tasks	87.3%	74.1%

Giá GPT-5.4

Giá API cho GPT-5.4 và GPT-5.4 Pro

Model
GPT-5.4	$2.50/triệu	$0.25/triệu	$15/triệu
GPT-5.4 Pro	$30/triệu	—	$180/triệu

Xử lý hàng loạt và Flex có sẵn với nửa giá tiêu chuẩn. Xử lý ưu tiên gấp đôi. GPT-5.2 ngừng hoạt động ngày 5 tháng 6 năm 2026.

Câu hỏi Thường gặp về GPT-5.4

Câu hỏi thường gặp về GPT-5.4

GPT-5.4 là gì?

GPT-5.4 là mô hình frontier mạnh nhất của OpenAI, ra mắt ngày 5 tháng 3 năm 2026. Kết hợp lý luận, lập trình và sử dụng máy tính gốc trong một mô hình.

GPT-5.4 so sánh với GPT-5.2 như thế nào?

GPT-5.4 vượt trội đáng kể so với GPT-5.2: ARC-AGI-2 tăng từ 52.9% lên 73.3%, GDPval từ 70.9% lên 83.0%, OSWorld từ 47.3% lên 75.0% (vượt hiệu suất con người), tuyên bố sai giảm 33%.

Tính năng sử dụng máy tính của GPT-5.4 là gì?

GPT-5.4 có thể điều khiển máy tính gốc qua mã Playwright và lệnh chuột/bàn phím dựa trên ảnh chụp màn hình. Đạt 75.0% trên OSWorld, vượt mức cơ sở con người 72.4%.

Giá GPT-5.4 là bao nhiêu?

Giá API GPT-5.4: $2.50/triệu token đầu vào, $0.25/triệu đầu vào cache, $15/triệu đầu ra. GPT-5.4 Pro: $30/triệu đầu vào, $180/triệu đầu ra.

Tìm kiếm công cụ trong GPT-5.4 là gì?

Tìm kiếm công cụ tải định nghĩa công cụ theo yêu cầu. Trong 250 nhiệm vụ với 36 máy chủ MCP được bật, giảm tổng sử dụng token 47% trong khi duy trì độ chính xác tương tự.

GPT-5.4 hỗ trợ cửa sổ ngữ cảnh bao lớn?

GPT-5.4 hỗ trợ cửa sổ ngữ cảnh tiêu chuẩn 272K token, với 1M token có sẵn trong Codex (tính phí gấp đôi trên 272K).

GPT-5.4 so sánh với Gemini 3.1 Pro như thế nào?

GPT-5.4 dẫn đầu về sử dụng máy tính (OSWorld 75.0%) và công việc kiến thức (GDPval 83.0%). Gemini 3.1 Pro dẫn đầu về lập trình (SWE-Bench 80.6% vs 57.7%) và GPQA Diamond (94.3% vs 92.8%).

GPT-5.4 có sẵn trong ChatGPT không?

Có. GPT-5.4 Thinking có sẵn cho người đăng ký Plus, Team và Pro trong ChatGPT, thay thế GPT-5.2 Thinking. GPT-5.4 Pro có sẵn cho các gói Pro và Enterprise.

Về GPT-5.4

GPT-5.4 là mô hình lý luận hàng đầu của OpenAI ra mắt ngày 5 tháng 3 năm 2026. Đây là mô hình chính đầu tiên kết hợp lý luận, lập trình (GPT-5.3-Codex) và sử dụng máy tính gốc trong một lần phát hành.

Thông báo quan trọng: Gemini3.us là nền tảng cộng đồng và nhà phát triển độc lập. Chúng tôi không liên kết hay kết nối chính thức với OpenAI.

Thử GPT-5.4 Ngay

Trải nghiệm mô hình mạnh nhất của OpenAI — sử dụng máy tính gốc, ngữ cảnh 1M và lý luận frontier