gemini3.us
Выпущено 5 марта 2026

GPT-5.4

Самая мощная и эффективная фронтирная модель OpenAI для профессиональной работы

OSWorld 75.0% (превосходит человека) • GPQA Diamond 92.8% • ARC-AGI-2 73.3% • Поиск инструментов сокращает 47% токенов

Смотреть бенчмарки

Функции и возможности GPT-5.4

Первый выпуск OpenAI, объединяющий рассуждение, программирование и нативное управление компьютером в одной модели

Нативное управление компьютером

GPT-5.4 достигает 75.0% на OSWorld, превосходя производительность человека (72.4%). Управляет рабочими столами через код Playwright и команды мыши/клавиатуры на основе скриншотов.

Продвинутое рассуждение

GPT-5.4 набирает 73.3% на ARC-AGI-2 (GPT-5.2: 52.9%) и 92.8% GPQA Diamond — подлинный прогресс в рассуждении.

Фронтирное программирование

GPT-5.4 сочетает сильные стороны программирования GPT-5.3-Codex. SWE-Bench Pro 57.7%, Terminal-Bench 2.0 75.1%. Скорость токенов в 1.5 раза быстрее в режиме /fast.

Поиск инструментов (47% меньше токенов)

Новая функция поиска инструментов загружает определения по требованию. Сокращает использование токенов на 47% в бенчмарке MCP Atlas при той же точности.

Контекст 1М токенов

GPT-5.4 поддерживает до 1 миллиона токенов контекста в Codex. Стандартное окно: 272K токенов.

Лидер в работе со знаниями

GDPval 83.0% (GPT-5.2: 70.9%), задачи моделирования IB 87.3%, на 33% меньше ложных утверждений, чем у GPT-5.2.

Результаты бенчмарков GPT-5.4

Передовая производительность в рассуждении, программировании, управлении компьютером и работе со знаниями

Рассуждение и наука

ARC-AGI-2 (Проверено)
Абстрактное рассуждение — GPT-5.2: 52.9%
73.3%
GPQA Diamond
Научные знания уровня PhD
92.8%
Последний экзамен человечества (с инструментами)
Академическое рассуждение — GPT-5.2: 45.5%
53.8%
FrontierMath Tier 1-3
Продвинутое математическое рассуждение
62.4%

Программирование и инженерия

SWE-Bench Pro (Публичный)
Реальные задачи программной инженерии
57.7%
Terminal-Bench 2.0
Выполнение задач CLI и терминала
75.1%
BrowseComp
Веб-браузинг и исследовательские задачи
71.2%
Toolathlon
Многошаговое использование инструментов с реальными API
68.9%

Управление компьютером и зрение

OSWorld-Verified (рабочий стол)
Превосходит базовый уровень человека 72.4%
75.0%
WebArena-Verified (браузер)
Навигация в браузере и выполнение задач
82.3%
Online-Mind2Web (скриншоты)
Веб-взаимодействие на основе скриншотов
69.1%
MMMU Pro (без инструментов)
Мультимодальное понимание
78.4%

Работа со знаниями

GDPval (побеждает или ничья)
44 профессии, 9 отраслей — GPT-5.2: 70.9%
83.0%
Задачи моделирования IB
Задачи с таблицами инвестиционного банкинга
87.3%
Предпочтение презентаций
Оценщики-люди предпочитают презентации GPT-5.4
71%
Сокращение ложных утверждений
Меньше фактических ошибок по сравнению с GPT-5.2
-33%

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Цены GPT-5.4

Цены API для GPT-5.4 и GPT-5.4 Pro

Model
GPT-5.4$2.50/М$0.25/М$15/М
GPT-5.4 Pro$30/М$180/М

Пакетная и Flex-обработка доступна по половине стандартной ставки. Приоритетная обработка по двойной ставке. GPT-5.2 выводится из эксплуатации 5 июня 2026.

Часто задаваемые вопросы о GPT-5.4

Часто задаваемые вопросы о GPT-5.4

Что такое GPT-5.4?

GPT-5.4 — самая мощная фронтирная модель OpenAI, выпущенная 5 марта 2026 года. Объединяет рассуждение, программирование и нативное управление компьютером в одной модели.

Как GPT-5.4 сравнивается с GPT-5.2?

GPT-5.4 значительно превосходит GPT-5.2: ARC-AGI-2 вырос с 52.9% до 73.3%, GDPval с 70.9% до 83.0%, OSWorld с 47.3% до 75.0% (превосходя производительность человека), ложные утверждения сокращены на 33%.

Что такое функция управления компьютером GPT-5.4?

GPT-5.4 может нативно управлять компьютерами через код Playwright и команды мыши/клавиатуры на основе скриншотов. Достигает 75.0% на OSWorld, превосходя базовый уровень человека 72.4%.

Какова цена GPT-5.4?

Цены API GPT-5.4: $2.50/М входных токенов, $0.25/М кэшированных входных, $15/М выходных. GPT-5.4 Pro: $30/М входных, $180/М выходных.

Что такое поиск инструментов в GPT-5.4?

Поиск инструментов загружает определения инструментов по требованию. На 250 задачах с 36 включёнными MCP-серверами сократил общее использование токенов на 47% при той же точности.

Какое контекстное окно поддерживает GPT-5.4?

GPT-5.4 поддерживает стандартное контекстное окно 272K токенов, с 1М токенов доступным в Codex (двойная ставка сверх 272K).

Как GPT-5.4 сравнивается с Gemini 3.1 Pro?

GPT-5.4 лидирует в управлении компьютером (OSWorld 75.0%) и работе со знаниями (GDPval 83.0%). Gemini 3.1 Pro лидирует в программировании (SWE-Bench 80.6% vs 57.7%) и GPQA Diamond (94.3% vs 92.8%).

Доступен ли GPT-5.4 в ChatGPT?

Да. GPT-5.4 Thinking доступен для подписчиков Plus, Team и Pro в ChatGPT, заменяя GPT-5.2 Thinking. GPT-5.4 Pro доступен для планов Pro и Enterprise.

О GPT-5.4

GPT-5.4 — флагманская модель рассуждения OpenAI, выпущенная 5 марта 2026 года. Это первая основная модель, объединяющая рассуждение, программирование (GPT-5.3-Codex) и нативное управление компьютером в одном выпуске.

Важное уведомление: Gemini3.us — независимая платформа сообщества и разработчиков. Мы не связаны с OpenAI и не являемся официально аффилированными.

Попробуйте GPT-5.4 сейчас

Испытайте самую мощную модель OpenAI — нативное управление компьютером, 1М контекст и фронтирное рассуждение