Выпущено 3 марта 2026 г.

Gemini 3.1 Flash Lite

Самая быстрая и экономичная модель серии Gemini 3 от Google

В 2,5× быстрее Gemini 2.5 Flash • 363 токена/сек • Контекст 1М токенов • Создано для масштабирования

Посмотреть бенчмарки

2,5×

Быстрее первый токен

363

Токенов/сек

1М

Контекст токенов

1/8×

Стоимость vs Pro

Возможности Gemini 3.1 Flash Lite

Оптимизировано для скорости, стоимости и высокообъёмных производственных нагрузок

В 2,5× быстрее первый токен

Gemini 3.1 Flash Lite достигает времени до первого токена в 2,5 раза быстрее, чем Gemini 2.5 Flash, идеально для приложений реального времени.

Экстремальная экономичность

По цене в восемь раз ниже Gemini 3.1 Pro — самый доступный вариант для высокообъёмных производственных развёртываний.

363 токена в секунду

Достигает скорости вывода 363 токена/сек, на 45% быстрее 249 токенов/сек Gemini 2.5 Flash, при аналогичном или лучшем качестве.

Полная мультимодальная поддержка

Поддерживает ввод текста, изображений, видео, аудио и PDF с контекстным окном 1М токенов. Только текстовый вывод.

Динамические уровни мышления

Адаптивное мышление, подстраивающее вычисления под сложность задачи — от мгновенных ответов до глубокого рассуждения.

Высокообъёмные агентные задачи

Создано для агентных конвейеров, простого извлечения данных, классификации и перевода в больших масштабах.

Производительность Gemini 3.1 Flash Lite

Самая быстрая и экономичная модель серии Gemini 3

Скорость и пропускная способность

Время до первого токена

В 2,5× быстрее Gemini 2.5 Flash

2.5×

Скорость вывода

363 токена/сек vs 249 токенов/сек

363/s

Улучшение скорости

На 45% быстрее Gemini 2.5 Flash

+45%

Профиль задержки

Оптимизировано для приложений с низкой задержкой

Low

Экономичность

Стоимость vs Gemini 3.1 Pro

Одна восьмая цены

1/8×

Цена ввода

Крайне низкая стоимость за 1М токенов

Low

Пригодность для масштабирования

Создано для миллионов запросов в день

M+/day

Оптимизация бюджета

Лучшее соотношение цена/качество в серии Gemini 3

Best

Контекст и мультимодальность

Контекстное окно

1 048 576 входных токенов

Лимит выходных токенов

65 536 токенов на ответ

65K

Типы ввода

Текст, изображение, видео, аудио, PDF

Пакетный API

Поддерживает массовую обработку

✓

Поддерживаемые возможности

Вызов функций

Поддерживается

✓

Поисковое заземление

Поддерживается

✓

Выполнение кода

Поддерживается

✓

Структурированный вывод

Поддерживается

✓

Результаты тестов Gemini 3.1 Flash Lite

Превосходит Gemini 2.5 Flash по каждому ключевому тесту — при меньших затратах

Тест	Результат	Описание
Arena Elo	1432	Рейтинг предпочтений людей (Arena.ai) — превосходит модели своего весового класса
Индекс интеллекта	34	Индекс интеллекта Artificial Analysis — +12 пунктов по сравнению с Gemini 2.5 Flash-Lite
GPQA Diamond	86.9%	Научные знания уровня PhD — превосходит Gemini 2.5 Flash (82.8%), Claude 4.5 Haiku (73.0%), GPT-5 mini (82.3%)
MMMU-Pro	76.8%	Мультимодальное понимание и рассуждение — превосходит Claude Opus 4.6, Kimi K2.5 и GPT-5 mini (74.1%)
Video-MMMU	84.8%	Получение знаний из видео — превосходит GPT-5 mini (82.5%) и Grok 4.1 Fast (74.6%)
Humanity's Last Exam	16.0%	Академическое рассуждение по тексту и мультимодальным данным — сопоставимо с GPT-5 mini (16.7%)
LiveCodeBench	72.0%	Генерация кода (янв–май 2025) — в 2× лучше Gemini 2.5 Flash-Lite (34.3%)
SimpleQA Проверено	43.3%	Точность параметрических знаний — в 4× лучше GPT-5 mini (9.5%) и Claude 4.5 Haiku (5.5%)
MMMLU (Многоязычный)	88.9%	Многоязычные вопросы и ответы — превосходит GPT-5 mini (84.9%), Claude 4.5 Haiku (83.0%), Grok 4.1 Fast (86.8%)
CharXiv Reasoning	73.2%	Синтез информации из сложных графиков — превосходит Gemini 2.5 Flash (63.7%) и Claude 4.5 Haiku (61.7%)
MRCR v2 (128k)	60.1%	Производительность на длинном контексте (8 игл, среднее 128k) — превосходит GPT-5 mini (52.5%) и Claude 4.5 Haiku (35.3%)
Скорость вывода	363 tok/s	На 45% быстрее Gemini 2.5 Flash (249 tok/s) — самый быстрый в своей ценовой категории
Цена входных данных	$0.25/1M	За миллион входных токенов — конкурентоспособно с GPT-5 mini ($0.25/1M)
Цена выходных данных	$1.50/1M	За миллион выходных токенов — значительно дешевле Claude 4.5 Haiku ($5.00/1M)

Источник: Artificial Analysis & Arena.ai Leaderboard

О Gemini 3.1 Flash Lite

Gemini 3.1 Flash Lite — самая быстрая и экономичная модель серии Gemini 3 от Google DeepMind, выпущенная 3 марта 2026 года. Оптимизирована для высокопроизводительных задач, чувствительных к задержке: перевод, классификация, простое извлечение данных. С пропускной способностью 363 токена/сек и контекстным окном 1М токенов обеспечивает исключительную производительность за долю стоимости.

Важное уведомление: Gemini3.us — независимая платформа сообщества энтузиастов и разработчиков. Мы не аффилированы, не одобрены и не официально связаны с Google LLC. Мы предоставляем платный доступ к официальным сервисам Gemini API Google для поддержки нашей инфраструктуры и операций.

Начать работу с Gemini 3.1 Flash Lite

Оцените самую быструю и экономичную модель серии Gemini 3