gemini3.us
Julkaistu 5. maaliskuuta 2026

GPT-5.4

OpenAI:n tehokkain ja tehokkain frontier-malli ammattikäyttöön

75,0% OSWorld (ylittää ihmisen) • 92,8% GPQA Diamond • 73,3% ARC-AGI-2 • 47% tokenien vähennys työkalu-haulla

75,0%
OSWorld (Tietokoneen käyttö)
92,8%
GPQA Diamond
73,3%
ARC-AGI-2
83,0%
GDPval Tietotyö

GPT-5.4 Ominaisuudet & Kyvykkyydet

Ensimmäinen OpenAI-malli, joka yhdistää päättelyn, koodauksen ja natiivin tietokoneen käytön yhdessä julkaisussa

Natiivi tietokoneen käyttö

GPT-5.4 saavuttaa 75,0% OSWorldissa, ylittäen ihmisen suorituksen (72,4%). Käyttää työpöytiä Playwright-koodin ja kuvakaappauspohjaisien hiiri/näppäimistö-komentojen avulla.

Edistynyt päättely

GPT-5.4 saa 73,3% ARC-AGI-2:ssa (nousi 52,9%:sta GPT-5.2:ssa) ja 92,8% GPQA Diamondissa — aito päättelyedistys, ei pelkkä työkalu-käyttöpäällys.

Frontier-koodaus

GPT-5.4 yhdistää GPT-5.3-Codexin koodausvahvuudet laajempiin kykyihin. Saa 57,7% SWE-Bench Prossa ja 75,1% Terminal-Bench 2.0:ssa. Jopa 1,5x nopeampi tokeninopeus /fast-tilassa.

Työkalu-haku (47% tokenien vähennys)

Uusi työkalu-hakuominaisuus lataa työkalumäärittelyt tarvittaessa etukäteen lataamisen sijaan. Vähentää kokonaistokenien käyttöä 47% MCP Atlas -vertailussa samalla tarkkuudella.

1M tokenin konteksti

GPT-5.4 tukee jopa 1 miljoonan tokenin kontekstia Codexissa, mahdollistaen agenttien suunnitella, toteuttaa ja tarkistaa tehtäviä pitkillä horisonteilla. Vakioikkuna on 272K tokenia.

Tietotyön johtaja

GPT-5.4 saa 83,0% GDPvalissa (nousi 70,9%:sta), 87,3% IB Modeling Tasksissa ja tuottaa 33% vähemmän vääriä väitteitä kuin GPT-5.2.

GPT-5.4 Vertailutulokset

Huippusuoritus päättelyssä, koodauksessa, tietokoneen käytössä ja tietotyössä

Päättely & Tiede

ARC-AGI-2 (Vahvistettu)
Abstrakti päättely — nousi 52,9%:sta GPT-5.2:ssa
73.3%
GPQA Diamond
Tohtorintason tieteellinen tieto
92.8%
Humanity's Last Exam (työkaluilla)
Akateeminen päättely — nousi 45,5%:sta GPT-5.2:ssa
53.8%
FrontierMath Taso 1-3
Edistynyt matemaattinen päättely
62.4%

Koodaus & Insinöörityö

SWE-Bench Pro (Julkinen)
Reaalimaailman ohjelmistoinsinööritehtävät
57.7%
Terminal-Bench 2.0
CLI- ja terminaalitehtävien suoritus
75.1%
BrowseComp
Verkkoselailu ja tutkimustehtävät
71.2%
Toolathlon
Monivaiheinen työkalujen käyttö oikeilla API:lla
68.9%

Tietokoneen käyttö & Visio

OSWorld-Verified (työpöytä)
Ylittää ihmisen peruslinjan 72,4%
75.0%
WebArena-Verified (selain)
Selaimen navigointi ja tehtävien suoritus
82.3%
Online-Mind2Web (kuvakaappaukset)
Kuvakaappauspohjainen verkkovuorovaikutus
69.1%
MMMU Pro (ilman työkaluja)
Multimodaalinen ymmärrys
78.4%

Tietotyö

GDPval (voittaa tai tasapeli)
44 ammattia, 9 toimialaa — nousi 70,9%:sta
83.0%
IB Modeling Tasks
Investointipankkitoiminnan taulukkolaskentatehtävät
87.3%
Esitysmieltymys
Ihmisarvioijat suosivat GPT-5.4:n esityksiä
71%
Väärien väitteiden vähennys
Vähemmän faktavirheitä vs GPT-5.2
-33%

GPT-5.4 Täydellinen vertailutulos

GPT-5.4 vs GPT-5.2 — täydelliset suoritustiedot

BenchmarkGPT-5.4GPT-5.2
OSWorld (Computer Use)75.0%47.3%
ARC-AGI-273.3%52.9%
GPQA Diamond92.8%88.1%
GDPval83.0%70.9%
HLE (with tools)53.8%45.5%
SWE-Bench Pro57.7%43.2%
Terminal-Bench 2.075.1%61.4%
IB Modeling Tasks87.3%74.1%

Lähde: OpenAI:n virallinen julkaisu, 5. maaliskuuta 2026

GPT-5.4 Hinnoittelu

API-hinnoittelu GPT-5.4:lle ja GPT-5.4 Prolle

ModelSyöteVälimuistissa oleva syöteTuloste
GPT-5.4$2,50/1M$0,25/1M$15/1M
GPT-5.4 Pro$30/1M$180/1M

Erä- ja Flex-käsittely saatavilla puoleen normaalihintaan. Prioriteettikäsittely 2x. GPT-5.2 poistuu käytöstä 5. kesäkuuta 2026.

GPT-5.4 UKK

Usein kysytyt kysymykset GPT-5.4:stä

Mikä on GPT-5.4?

GPT-5.4 on OpenAI:n tehokkain frontier-malli, julkaistu 5. maaliskuuta 2026. Se yhdistää päättelyn, koodauksen ja natiivin tietokoneen käytön yhdessä mallissa — ensimmäistä kertaa OpenAI on yhdistänyt nämä kyvykkyydet yhdessä julkaisussa.

Miten GPT-5.4 vertautuu GPT-5.2:een?

GPT-5.4 ylittää merkittävästi GPT-5.2:n: ARC-AGI-2 nousi 52,9%:sta 73,3%:iin, GDPval 70,9%:sta 83,0%:iin, OSWorld 47,3%:sta 75,0%:iin (ylittäen ihmisen suorituksen) ja väärät väitteet vähenivät 33%.

Mitä on GPT-5.4:n tietokoneen käyttö?

GPT-5.4 voi käyttää tietokoneita natiivisti Playwright-koodin ja kuvakaappauspohjaisien hiiri/näppäimistö-komentojen avulla. Saavuttaa 75,0% OSWorldissa, ylittäen ihmisen peruslinjan 72,4% — tehden siitä vahvimman mallin työpöytäautomaatioon.

Mikä on GPT-5.4:n hinnoittelu?

GPT-5.4 API-hinnoittelu: $2,50/1M syötetokenia, $0,25/1M välimuistissa olevaa syötettä, $15/1M tulostetta. GPT-5.4 Pro: $30/1M syöte, $180/1M tuloste. Erä- ja Flex-käsittely saatavilla puoleen hintaan. GPT-5.2 poistuu käytöstä 5. kesäkuuta 2026.

Mitä on työkalu-haku GPT-5.4:ssä?

Työkalu-haku on uusi ominaisuus, joka lataa työkalumäärittelyt tarvittaessa kaikkien määrittelyjen etukäteen sisällyttämisen sijaan. 250 tehtävässä 36 MCP-palvelimen ollessa käytössä se vähensi kokonaistokenien käyttöä 47% samalla tarkkuudella — merkittävä kustannussäästö yrityksen agenttivirroille.

Minkä konteksti-ikkunan GPT-5.4 tukee?

GPT-5.4 tukee vakio 272K tokenin konteksti-ikkunaa, ja 1M tokenin konteksti on saatavilla Codexissa (laskutetaan 2x normaalihinnalla yli 272K:n). Se on ensimmäinen OpenAI-malli, joka tukee yli 256K tokenin kontekstipitkiä.

Miten GPT-5.4 vertautuu Gemini 3.1 Prohon?

GPT-5.4 johtaa tietokoneen käytössä (75,0% OSWorld vs ei vastaavaa), tietotyössä (83,0% GDPval) ja ARC-AGI-2:ssa (73,3% vs 77,1% Gemini 3.1 Prolle). Gemini 3.1 Pro johtaa koodauksessa (80,6% SWE-Bench vs 57,7%) ja GPQA Diamondissa (94,3% vs 92,8%). Molemmat ovat frontier-malleja eri vahvuuksilla.

Onko GPT-5.4 saatavilla ChatGPT:ssä?

Kyllä. GPT-5.4 Thinking on saatavilla Plus-, Team- ja Pro-tilaajille ChatGPT:ssä, korvaten GPT-5.2 Thinkingin. GPT-5.4 Pro on saatavilla Pro- ja Enterprise-suunnitelmille. Enterprise- ja Edu-järjestelmänvalvojat voivat ottaa varhaisen pääsyn käyttöön järjestelmänvalvojan asetuksista.

Tietoa GPT-5.4:stä

GPT-5.4 on OpenAI:n lippulaiva-päättelymalli, julkaistu 5. maaliskuuta 2026. Se on ensimmäinen mainline-malli, joka yhdistää päättelyn, koodauksen (GPT-5.3-Codex) ja natiivin tietokoneen käytön yhdessä julkaisussa. GPT-5.4 ylittää ihmisen suorituksen OSWorld-työpöytänavigaatiossa, vähentää vääriä väitteitä 33% vs GPT-5.2 ja esittelee työkalu-haun, joka leikkaa tokenikustannuksia 47% monimutkaisissa agenttivirroissa.

Tärkeä huomio: Gemini3.us on itsenäinen harrastaja- ja kehittäjäyhteisöalusta. Emme ole sidoksissa OpenAI:hin, sen hyväksymiä tai virallisesti yhteydessä siihen. Tarjoamme maksullisen pääsyn OpenAI:n virallisiin API-palveluihin infrastruktuurimme ja toimintamme tukemiseksi.

Kokeile GPT-5.4 nyt

Koe OpenAI:n tehokkain malli — natiivi tietokoneen käyttö, 1M konteksti ja frontier-päättely