gemini3.us
Выпущено 3 марта 2026 г.

Gemini 3.1 Flash Lite

Самая быстрая и экономичная модель серии Gemini 3 от Google

В 2,5× быстрее Gemini 2.5 Flash • 363 токена/сек • Контекст 1М токенов • Создано для масштабирования

Посмотреть бенчмарки
2,5×
Быстрее первый токен
363
Токенов/сек
Контекст токенов
1/8×
Стоимость vs Pro

Возможности Gemini 3.1 Flash Lite

Оптимизировано для скорости, стоимости и высокообъёмных производственных нагрузок

В 2,5× быстрее первый токен

Gemini 3.1 Flash Lite достигает времени до первого токена в 2,5 раза быстрее, чем Gemini 2.5 Flash, идеально для приложений реального времени.

Экстремальная экономичность

По цене в восемь раз ниже Gemini 3.1 Pro — самый доступный вариант для высокообъёмных производственных развёртываний.

363 токена в секунду

Достигает скорости вывода 363 токена/сек, на 45% быстрее 249 токенов/сек Gemini 2.5 Flash, при аналогичном или лучшем качестве.

Полная мультимодальная поддержка

Поддерживает ввод текста, изображений, видео, аудио и PDF с контекстным окном 1М токенов. Только текстовый вывод.

Динамические уровни мышления

Адаптивное мышление, подстраивающее вычисления под сложность задачи — от мгновенных ответов до глубокого рассуждения.

Высокообъёмные агентные задачи

Создано для агентных конвейеров, простого извлечения данных, классификации и перевода в больших масштабах.

Производительность Gemini 3.1 Flash Lite

Самая быстрая и экономичная модель серии Gemini 3

Скорость и пропускная способность

Время до первого токена
В 2,5× быстрее Gemini 2.5 Flash
2.5×
Скорость вывода
363 токена/сек vs 249 токенов/сек
363/s
Улучшение скорости
На 45% быстрее Gemini 2.5 Flash
+45%
Профиль задержки
Оптимизировано для приложений с низкой задержкой
Low

Экономичность

Стоимость vs Gemini 3.1 Pro
Одна восьмая цены
1/8×
Цена ввода
Крайне низкая стоимость за 1М токенов
Low
Пригодность для масштабирования
Создано для миллионов запросов в день
M+/day
Оптимизация бюджета
Лучшее соотношение цена/качество в серии Gemini 3
Best

Контекст и мультимодальность

Контекстное окно
1 048 576 входных токенов
1M
Лимит выходных токенов
65 536 токенов на ответ
65K
Типы ввода
Текст, изображение, видео, аудио, PDF
5
Пакетный API
Поддерживает массовую обработку

Поддерживаемые возможности

Вызов функций
Поддерживается
Поисковое заземление
Поддерживается
Выполнение кода
Поддерживается
Структурированный вывод
Поддерживается

Результаты тестов Gemini 3.1 Flash Lite

Превосходит Gemini 2.5 Flash по каждому ключевому тесту — при меньших затратах

ТестРезультатОписание
Arena Elo1432Рейтинг предпочтений людей (Arena.ai) — превосходит модели своего весового класса
Индекс интеллекта34Индекс интеллекта Artificial Analysis — +12 пунктов по сравнению с Gemini 2.5 Flash-Lite
GPQA Diamond86.9%Научные знания уровня PhD — превосходит Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro76.8%Мультимодальное понимание и рассуждение — превосходит Claude Opus 4.6, Kimi K2.5 и GPT-5 mini (74.1%)
Video-MMMU84.8%Получение знаний из видео — превосходит GPT-5 mini (82.5%) и Grok 4.1 Fast (74.6%)
Humanity's Last Exam16.0%Академическое рассуждение по тексту и мультимодальным данным — сопоставимо с GPT-5 mini (16.7%)
LiveCodeBench72.0%Генерация кода (янв–май 2025) — в 2× лучше Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Проверено43.3%Точность параметрических знаний — в 4× лучше GPT-5 mini (9.5%) и Claude 4.5 Haiku (5.5%)
MMMLU (Многоязычный)88.9%Многоязычные вопросы и ответы — превосходит GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning73.2%Синтез информации из сложных графиков — превосходит Gemini 2.5 Flash (63.7%) и Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)60.1%Производительность на длинном контексте (8 игл, среднее 128k) — превосходит GPT-5 mini (52.5%) и Claude 4.5 Haiku (35.3%)
Скорость вывода363 tok/sНа 45% быстрее Gemini 2.5 Flash (249 tok/s) — самый быстрый в своей ценовой категории
Цена входных данных$0.25/1MЗа миллион входных токенов — конкурентоспособно с GPT-5 mini ($0.25/1M)
Цена выходных данных$1.50/1MЗа миллион выходных токенов — значительно дешевле Claude 4.5 Haiku ($5.00/1M)

Источник: Artificial Analysis & Arena.ai Leaderboard

О Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — самая быстрая и экономичная модель серии Gemini 3 от Google DeepMind, выпущенная 3 марта 2026 года. Оптимизирована для высокопроизводительных задач, чувствительных к задержке: перевод, классификация, простое извлечение данных. С пропускной способностью 363 токена/сек и контекстным окном 1М токенов обеспечивает исключительную производительность за долю стоимости.

Важное уведомление: Gemini3.us — независимая платформа сообщества энтузиастов и разработчиков. Мы не аффилированы, не одобрены и не официально связаны с Google LLC. Мы предоставляем платный доступ к официальным сервисам Gemini API Google для поддержки нашей инфраструктуры и операций.

Начать работу с Gemini 3.1 Flash Lite

Оцените самую быструю и экономичную модель серии Gemini 3