gemini3.us
เปิดตัว 3 มีนาคม 2026

Gemini 3.1 Flash Lite

โมเดล Gemini 3 ที่เร็วและประหยัดที่สุดของ Google

เร็วกว่า Gemini 2.5 Flash 2.5× • 363 โทเค็น/วินาที • บริบท 1M โทเค็น • ออกแบบมาเพื่อการขยายขนาด

ดู Benchmarks
2.5×
โทเค็นแรกเร็วขึ้น
363
โทเค็น/วินาที
1M
บริบทโทเค็น
1/8×
ต้นทุนเทียบกับ Pro

คุณสมบัติของ Gemini 3.1 Flash Lite

ปรับให้เหมาะสมสำหรับความเร็ว ต้นทุน และงานการผลิตปริมาณสูง

โทเค็นแรกเร็วขึ้น 2.5×

Gemini 3.1 Flash Lite ทำเวลาถึงโทเค็นแรกได้เร็วกว่า Gemini 2.5 Flash 2.5 เท่า เหมาะสำหรับแอปพลิเคชันแบบเรียลไทม์และโต้ตอบ

ประสิทธิภาพต้นทุนสูงสุด

ราคาเพียงหนึ่งในแปดของ Gemini 3.1 Pro เป็นตัวเลือกที่ประหยัดที่สุดสำหรับการใช้งานในการผลิตปริมาณสูง

363 โทเค็นต่อวินาที

ทำความเร็วเอาต์พุต 363 โทเค็น/วินาที เร็วกว่า 249 โทเค็น/วินาทีของ Gemini 2.5 Flash ถึง 45% ขณะรักษาคุณภาพที่ใกล้เคียงหรือดีกว่า

รองรับอินพุตหลายรูปแบบครบถ้วน

รองรับอินพุตข้อความ รูปภาพ วิดีโอ เสียง และ PDF พร้อมหน้าต่างบริบท 1M โทเค็น เอาต์พุตเฉพาะข้อความ

ระดับการคิดแบบไดนามิก

การคิดแบบปรับตัวที่ปรับการคำนวณตามความซับซ้อนของงาน ตั้งแต่การตอบสนองทันทีไปจนถึงการใช้เหตุผลเชิงลึก

งาน Agentic ปริมาณสูง

ออกแบบมาสำหรับ agentic pipelines การดึงข้อมูลอย่างง่าย การจำแนกประเภท และการแปลในระดับขนาดใหญ่

ประสิทธิภาพของ Gemini 3.1 Flash Lite

เร็วและประหยัดที่สุดในซีรีส์ Gemini 3

ความเร็วและปริมาณงาน

เวลาถึงโทเค็นแรก
เร็วกว่า Gemini 2.5 Flash 2.5×
2.5×
ความเร็วเอาต์พุต
363 โทเค็น/วินาที เทียบกับ 249 โทเค็น/วินาที
363/s
การปรับปรุงความเร็ว
เร็วกว่า Gemini 2.5 Flash 45%
+45%
โปรไฟล์ Latency
ปรับให้เหมาะสมสำหรับแอปพลิเคชัน latency ต่ำ
Low

ประสิทธิภาพต้นทุน

ต้นทุนเทียบกับ Gemini 3.1 Pro
หนึ่งในแปดของราคา
1/8×
ราคาอินพุต
ต้นทุนต่ำมากต่อ 1M โทเค็น
Low
ความเหมาะสมสำหรับการขยายขนาด
ออกแบบมาสำหรับคำขอหลายล้านรายการ/วัน
M+/day
การเพิ่มประสิทธิภาพงบประมาณ
อัตราส่วนคุณภาพต่อราคาดีที่สุดในซีรีส์ Gemini 3
Best

บริบทและหลายรูปแบบ

หน้าต่างบริบท
1,048,576 โทเค็นอินพุต
1M
ขีดจำกัดโทเค็นเอาต์พุต
65,536 โทเค็นต่อการตอบสนอง
65K
ประเภทอินพุต
ข้อความ รูปภาพ วิดีโอ เสียง PDF
5
Batch API
รองรับการประมวลผลจำนวนมาก

ความสามารถที่รองรับ

การเรียกใช้ฟังก์ชัน
รองรับ
Search Grounding
รองรับ
การรันโค้ด
รองรับ
เอาต์พุตที่มีโครงสร้าง
รองรับ

ผลการทดสอบ Gemini 3.1 Flash Lite

เหนือกว่า Gemini 2.5 Flash ในทุกการทดสอบหลัก — ด้วยต้นทุนที่ต่ำกว่า

การทดสอบคะแนนคำอธิบาย
Arena Elo1432การจัดอันดับความชอบของมนุษย์ (Arena.ai) — เหนือกว่าโมเดลในระดับเดียวกัน
ดัชนีความฉลาด34ดัชนีความฉลาด Artificial Analysis — +12 คะแนนจาก Gemini 2.5 Flash-Lite
GPQA Diamond86.9%ความรู้วิทยาศาสตร์ระดับปริญญาเอก — เหนือกว่า Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro76.8%ความเข้าใจและการใช้เหตุผลแบบหลายโหมด — เหนือกว่า Claude Opus 4.6, Kimi K2.5 และ GPT-5 mini (74.1%)
Video-MMMU84.8%การเรียนรู้จากวิดีโอ — เหนือกว่า GPT-5 mini (82.5%) และ Grok 4.1 Fast (74.6%)
Humanity's Last Exam16.0%การใช้เหตุผลทางวิชาการผ่านข้อความและหลายโหมด — ใกล้เคียงกับ GPT-5 mini (16.7%)
LiveCodeBench72.0%การสร้างโค้ด (ม.ค.–พ.ค. 2025) — ดีกว่า Gemini 2.5 Flash-Lite (34.3%) ถึง 2×
SimpleQA ตรวจสอบแล้ว43.3%ความแม่นยำของความรู้เชิงพารามิเตอร์ — ดีกว่า GPT-5 mini (9.5%) และ Claude 4.5 Haiku (5.5%) ถึง 4×
MMMLU (หลายภาษา)88.9%ถาม-ตอบหลายภาษา — เหนือกว่า GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning73.2%การสังเคราะห์ข้อมูลจากกราฟซับซ้อน — เหนือกว่า Gemini 2.5 Flash (63.7%) และ Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)60.1%ประสิทธิภาพบริบทยาว (8 เข็ม, เฉลี่ย 128k) — เหนือกว่า GPT-5 mini (52.5%) และ Claude 4.5 Haiku (35.3%)
ความเร็วในการสร้างผลลัพธ์363 tok/sเร็วกว่า Gemini 2.5 Flash (249 tok/s) 45% — เร็วที่สุดในระดับราคาเดียวกัน
ราคาอินพุต$0.25/1Mต่อล้านโทเค็นอินพุต — แข่งขันได้กับ GPT-5 mini ($0.25/1M)
ราคาเอาต์พุต$1.50/1Mต่อล้านโทเค็นเอาต์พุต — ถูกกว่า Claude 4.5 Haiku ($5.00/1M) อย่างมาก

ที่มา: Artificial Analysis & Arena.ai Leaderboard

เกี่ยวกับ Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite คือโมเดลที่เร็วและประหยัดที่สุดในซีรีส์ Gemini 3 ของ Google DeepMind เปิดตัวเมื่อ 3 มีนาคม 2026 ปรับให้เหมาะสมสำหรับงานที่ต้องการปริมาณงานสูงและไวต่อ latency เช่น การแปล การจำแนกประเภท และการดึงข้อมูลอย่างง่าย ด้วยปริมาณงาน 363 โทเค็น/วินาที และหน้าต่างบริบท 1M โทเค็น มอบประสิทธิภาพที่ยอดเยี่ยมในราคาเพียงเศษเสี้ยว

ประกาศสำคัญ: Gemini3.us เป็นแพลตฟอร์มชุมชนผู้ที่ชื่นชอบและนักพัฒนาอิสระ เราไม่ได้เป็นพันธมิตร ได้รับการรับรอง หรือเชื่อมต่ออย่างเป็นทางการกับ Google LLC เราให้การเข้าถึงแบบชำระเงินสำหรับบริการ Gemini API อย่างเป็นทางการของ Google เพื่อสนับสนุนโครงสร้างพื้นฐานและการดำเนินงานของเรา

เริ่มต้นกับ Gemini 3.1 Flash Lite

สัมผัสโมเดลที่เร็วและประหยัดที่สุดในซีรีส์ Gemini 3