gemini3.us
เปิดตัว 5 มีนาคม 2026

GPT-5.4

โมเดลฟรอนเทียร์ที่ทรงพลังและมีประสิทธิภาพสูงสุดของ OpenAI สำหรับงานมืออาชีพ

OSWorld 75.0% (เกินมนุษย์) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • การค้นหาเครื่องมือลด 47% โทเค็น

คุณสมบัติและความสามารถของ GPT-5.4

การเปิดตัวครั้งแรกของ OpenAI ที่รวมการใช้เหตุผล การเขียนโค้ด และการใช้คอมพิวเตอร์แบบเนทีฟในโมเดลเดียว

การใช้คอมพิวเตอร์แบบเนทีฟ

GPT-5.4 ทำได้ 75.0% บน OSWorld เกินประสิทธิภาพมนุษย์ (72.4%) ควบคุมเดสก์ท็อปผ่านโค้ด Playwright และคำสั่งเมาส์/คีย์บอร์ดที่ใช้สกรีนช็อต

การใช้เหตุผลขั้นสูง

GPT-5.4 ทำได้ 73.3% บน ARC-AGI-2 (GPT-5.2: 52.9%) และ 92.8% GPQA Diamond — ความก้าวหน้าด้านการใช้เหตุผลที่แท้จริง

การเขียนโค้ดระดับฟรอนเทียร์

GPT-5.4 รวมจุดแข็งด้านการเขียนโค้ดของ GPT-5.3-Codex SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1% ความเร็วโทเค็นเร็วขึ้น 1.5 เท่าในโหมด /fast

การค้นหาเครื่องมือ (ลด 47% โทเค็น)

ฟีเจอร์การค้นหาเครื่องมือใหม่โหลดคำจำกัดความตามต้องการ ลดการใช้โทเค็น 47% ในเกณฑ์มาตรฐาน MCP Atlas ขณะรักษาความแม่นยำเดิม

บริบท 1 ล้านโทเค็น

GPT-5.4 รองรับบริบทสูงสุด 1 ล้านโทเค็นใน Codex หน้าต่างมาตรฐาน: 272K โทเค็น

ผู้นำด้านงานความรู้

GDPval 83.0% (GPT-5.2: 70.9%), งานสร้างแบบจำลอง IB 87.3%, การอ้างสิทธิ์เท็จน้อยกว่า GPT-5.2 ถึง 33%

ผลเกณฑ์มาตรฐาน GPT-5.4

ประสิทธิภาพล้ำสมัยในการใช้เหตุผล การเขียนโค้ด การใช้คอมพิวเตอร์ และงานความรู้

การใช้เหตุผลและวิทยาศาสตร์

ARC-AGI-2 (ตรวจสอบแล้ว)
การใช้เหตุผลเชิงนามธรรม — GPT-5.2: 52.9%
73.3%
GPQA Diamond
ความรู้ทางวิทยาศาสตร์ระดับปริญญาเอก
92.8%
การสอบครั้งสุดท้ายของมนุษยชาติ (พร้อมเครื่องมือ)
การใช้เหตุผลทางวิชาการ — GPT-5.2: 45.5%
53.8%
FrontierMath Tier 1-3
การใช้เหตุผลทางคณิตศาสตร์ขั้นสูง
62.4%

การเขียนโค้ดและวิศวกรรม

SWE-Bench Pro (สาธารณะ)
งานวิศวกรรมซอฟต์แวร์จริง
57.7%
Terminal-Bench 2.0
การทำงาน CLI และเทอร์มินัล
75.1%
BrowseComp
การท่องเว็บและงานวิจัย
71.2%
Toolathlon
การใช้เครื่องมือหลายขั้นตอนกับ API จริง
68.9%

การใช้คอมพิวเตอร์และวิสัยทัศน์

OSWorld-Verified (เดสก์ท็อป)
เกินเส้นฐานมนุษย์ 72.4%
75.0%
WebArena-Verified (เบราว์เซอร์)
การนำทางเบราว์เซอร์และการทำงาน
82.3%
Online-Mind2Web (สกรีนช็อต)
การโต้ตอบเว็บโดยใช้สกรีนช็อต
69.1%
MMMU Pro (ไม่มีเครื่องมือ)
ความเข้าใจหลายรูปแบบ
78.4%

งานความรู้

GDPval (ชนะหรือเสมอ)
44 อาชีพ, 9 อุตสาหกรรม — GPT-5.2: 70.9%
83.0%
งานสร้างแบบจำลอง IB
งานสเปรดชีตธนาคารเพื่อการลงทุน
87.3%
ความชอบการนำเสนอ
ผู้ประเมินมนุษย์ชอบการนำเสนอของ GPT-5.4
71%
การลดการอ้างสิทธิ์เท็จ
ข้อผิดพลาดเชิงข้อเท็จจริงน้อยกว่า GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

ราคา GPT-5.4

ราคา API สำหรับ GPT-5.4 และ GPT-5.4 Pro

Model
GPT-5.4$2.50/ล้าน$0.25/ล้าน$15/ล้าน
GPT-5.4 Pro$30/ล้าน$180/ล้าน

การประมวลผลแบบแบตช์และ Flex มีให้ในราคาครึ่งหนึ่งของอัตรามาตรฐาน การประมวลผลลำดับความสำคัญที่ 2 เท่า GPT-5.2 เลิกใช้งาน 5 มิถุนายน 2026

คำถามที่พบบ่อยเกี่ยวกับ GPT-5.4

คำถามที่พบบ่อยเกี่ยวกับ GPT-5.4

GPT-5.4 คืออะไร?

GPT-5.4 คือโมเดลฟรอนเทียร์ที่ทรงพลังที่สุดของ OpenAI เปิดตัวเมื่อ 5 มีนาคม 2026 รวมการใช้เหตุผล การเขียนโค้ด และการใช้คอมพิวเตอร์แบบเนทีฟในโมเดลเดียว

GPT-5.4 เปรียบเทียบกับ GPT-5.2 อย่างไร?

GPT-5.4 เหนือกว่า GPT-5.2 อย่างมาก: ARC-AGI-2 เพิ่มจาก 52.9% เป็น 73.3%, GDPval จาก 70.9% เป็น 83.0%, OSWorld จาก 47.3% เป็น 75.0% (เกินประสิทธิภาพมนุษย์), การอ้างสิทธิ์เท็จลดลง 33%

ฟีเจอร์การใช้คอมพิวเตอร์ของ GPT-5.4 คืออะไร?

GPT-5.4 สามารถควบคุมคอมพิวเตอร์แบบเนทีฟผ่านโค้ด Playwright และคำสั่งเมาส์/คีย์บอร์ดที่ใช้สกรีนช็อต ทำได้ 75.0% บน OSWorld เกินเส้นฐานมนุษย์ 72.4%

ราคา GPT-5.4 เท่าไหร่?

ราคา API GPT-5.4: $2.50/ล้านโทเค็นอินพุต, $0.25/ล้านอินพุตแคช, $15/ล้านเอาต์พุต GPT-5.4 Pro: $30/ล้านอินพุต, $180/ล้านเอาต์พุต

การค้นหาเครื่องมือใน GPT-5.4 คืออะไร?

การค้นหาเครื่องมือโหลดคำจำกัดความตามต้องการ ใน 250 งานที่เปิดใช้งาน 36 เซิร์ฟเวอร์ MCP ลดการใช้โทเค็นทั้งหมด 47% ขณะรักษาความแม่นยำเดิม

GPT-5.4 รองรับหน้าต่างบริบทขนาดเท่าไหร่?

GPT-5.4 รองรับหน้าต่างบริบทมาตรฐาน 272K โทเค็น โดยมี 1M โทเค็นใน Codex (คิดราคา 2 เท่าเกิน 272K)

GPT-5.4 เปรียบเทียบกับ Gemini 3.1 Pro อย่างไร?

GPT-5.4 นำในการใช้คอมพิวเตอร์ (OSWorld 75.0%) และงานความรู้ (GDPval 83.0%) Gemini 3.1 Pro นำในการเขียนโค้ด (SWE-Bench 80.6% vs 57.7%) และ GPQA Diamond (94.3% vs 92.8%)

GPT-5.4 มีใน ChatGPT ไหม?

ใช่ GPT-5.4 Thinking มีให้สำหรับสมาชิก Plus, Team และ Pro ใน ChatGPT แทนที่ GPT-5.2 Thinking GPT-5.4 Pro มีให้สำหรับแผน Pro และ Enterprise

เกี่ยวกับ GPT-5.4

GPT-5.4 คือโมเดลการใช้เหตุผลหลักของ OpenAI ที่เปิดตัวเมื่อ 5 มีนาคม 2026 เป็นโมเดลหลักตัวแรกที่รวมการใช้เหตุผล การเขียนโค้ด (GPT-5.3-Codex) และการใช้คอมพิวเตอร์แบบเนทีฟในการเปิดตัวครั้งเดียว

หมายเหตุสำคัญ: Gemini3.us เป็นแพลตฟอร์มชุมชนและนักพัฒนาอิสระ เราไม่ได้เป็นพันธมิตรหรือเชื่อมต่ออย่างเป็นทางการกับ OpenAI

ลอง GPT-5.4 ตอนนี้

สัมผัสโมเดลที่ทรงพลังที่สุดของ OpenAI — การใช้คอมพิวเตอร์แบบเนทีฟ บริบท 1M และการใช้เหตุผลระดับฟรอนเทียร์