Julkaistu 5. maaliskuuta 2026

GPT-5.4

OpenAI:n tehokkain ja tehokkain frontier-malli ammattikäyttöön

75,0% OSWorld (ylittää ihmisen) • 92,8% GPQA Diamond • 73,3% ARC-AGI-2 • 47% tokenien vähennys työkalu-haulla

Tutustu vertailutuloksiin

75,0%

OSWorld (Tietokoneen käyttö)

92,8%

GPQA Diamond

73,3%

ARC-AGI-2

83,0%

GDPval Tietotyö

GPT-5.4 Ominaisuudet & Kyvykkyydet

Ensimmäinen OpenAI-malli, joka yhdistää päättelyn, koodauksen ja natiivin tietokoneen käytön yhdessä julkaisussa

Natiivi tietokoneen käyttö

GPT-5.4 saavuttaa 75,0% OSWorldissa, ylittäen ihmisen suorituksen (72,4%). Käyttää työpöytiä Playwright-koodin ja kuvakaappauspohjaisien hiiri/näppäimistö-komentojen avulla.

Edistynyt päättely

GPT-5.4 saa 73,3% ARC-AGI-2:ssa (nousi 52,9%:sta GPT-5.2:ssa) ja 92,8% GPQA Diamondissa — aito päättelyedistys, ei pelkkä työkalu-käyttöpäällys.

Frontier-koodaus

GPT-5.4 yhdistää GPT-5.3-Codexin koodausvahvuudet laajempiin kykyihin. Saa 57,7% SWE-Bench Prossa ja 75,1% Terminal-Bench 2.0:ssa. Jopa 1,5x nopeampi tokeninopeus /fast-tilassa.

Työkalu-haku (47% tokenien vähennys)

Uusi työkalu-hakuominaisuus lataa työkalumäärittelyt tarvittaessa etukäteen lataamisen sijaan. Vähentää kokonaistokenien käyttöä 47% MCP Atlas -vertailussa samalla tarkkuudella.

1M tokenin konteksti

GPT-5.4 tukee jopa 1 miljoonan tokenin kontekstia Codexissa, mahdollistaen agenttien suunnitella, toteuttaa ja tarkistaa tehtäviä pitkillä horisonteilla. Vakioikkuna on 272K tokenia.

Tietotyön johtaja

GPT-5.4 saa 83,0% GDPvalissa (nousi 70,9%:sta), 87,3% IB Modeling Tasksissa ja tuottaa 33% vähemmän vääriä väitteitä kuin GPT-5.2.

GPT-5.4 Vertailutulokset

Huippusuoritus päättelyssä, koodauksessa, tietokoneen käytössä ja tietotyössä

Päättely & Tiede

ARC-AGI-2 (Vahvistettu)

Abstrakti päättely — nousi 52,9%:sta GPT-5.2:ssa

73.3%

GPQA Diamond

Tohtorintason tieteellinen tieto

92.8%

Humanity's Last Exam (työkaluilla)

Akateeminen päättely — nousi 45,5%:sta GPT-5.2:ssa

53.8%

FrontierMath Taso 1-3

Edistynyt matemaattinen päättely

62.4%

Koodaus & Insinöörityö

SWE-Bench Pro (Julkinen)

Reaalimaailman ohjelmistoinsinööritehtävät

57.7%

Terminal-Bench 2.0

CLI- ja terminaalitehtävien suoritus

75.1%

BrowseComp

Verkkoselailu ja tutkimustehtävät

71.2%

Toolathlon

Monivaiheinen työkalujen käyttö oikeilla API:lla

68.9%

Tietokoneen käyttö & Visio

OSWorld-Verified (työpöytä)

Ylittää ihmisen peruslinjan 72,4%

75.0%

WebArena-Verified (selain)

Selaimen navigointi ja tehtävien suoritus

82.3%

Online-Mind2Web (kuvakaappaukset)

Kuvakaappauspohjainen verkkovuorovaikutus

69.1%

MMMU Pro (ilman työkaluja)

Multimodaalinen ymmärrys

78.4%

Tietotyö

GDPval (voittaa tai tasapeli)

44 ammattia, 9 toimialaa — nousi 70,9%:sta

83.0%

IB Modeling Tasks

Investointipankkitoiminnan taulukkolaskentatehtävät

87.3%

Esitysmieltymys

Ihmisarvioijat suosivat GPT-5.4:n esityksiä

71%

Väärien väitteiden vähennys

Vähemmän faktavirheitä vs GPT-5.2

-33%

GPT-5.4 Täydellinen vertailutulos

GPT-5.4 vs GPT-5.2 — täydelliset suoritustiedot

Benchmark	GPT-5.4	GPT-5.2
OSWorld (Computer Use)	75.0%	47.3%
ARC-AGI-2	73.3%	52.9%
GPQA Diamond	92.8%	88.1%
GDPval	83.0%	70.9%
HLE (with tools)	53.8%	45.5%
SWE-Bench Pro	57.7%	43.2%
Terminal-Bench 2.0	75.1%	61.4%
IB Modeling Tasks	87.3%	74.1%

Lähde: OpenAI:n virallinen julkaisu, 5. maaliskuuta 2026

GPT-5.4 Hinnoittelu

API-hinnoittelu GPT-5.4:lle ja GPT-5.4 Prolle

Model	Syöte	Välimuistissa oleva syöte	Tuloste
GPT-5.4	$2,50/1M	$0,25/1M	$15/1M
GPT-5.4 Pro	$30/1M	—	$180/1M

Erä- ja Flex-käsittely saatavilla puoleen normaalihintaan. Prioriteettikäsittely 2x. GPT-5.2 poistuu käytöstä 5. kesäkuuta 2026.

GPT-5.4 UKK

Usein kysytyt kysymykset GPT-5.4:stä

Mikä on GPT-5.4?

GPT-5.4 on OpenAI:n tehokkain frontier-malli, julkaistu 5. maaliskuuta 2026. Se yhdistää päättelyn, koodauksen ja natiivin tietokoneen käytön yhdessä mallissa — ensimmäistä kertaa OpenAI on yhdistänyt nämä kyvykkyydet yhdessä julkaisussa.

Miten GPT-5.4 vertautuu GPT-5.2:een?

GPT-5.4 ylittää merkittävästi GPT-5.2:n: ARC-AGI-2 nousi 52,9%:sta 73,3%:iin, GDPval 70,9%:sta 83,0%:iin, OSWorld 47,3%:sta 75,0%:iin (ylittäen ihmisen suorituksen) ja väärät väitteet vähenivät 33%.

Mitä on GPT-5.4:n tietokoneen käyttö?

GPT-5.4 voi käyttää tietokoneita natiivisti Playwright-koodin ja kuvakaappauspohjaisien hiiri/näppäimistö-komentojen avulla. Saavuttaa 75,0% OSWorldissa, ylittäen ihmisen peruslinjan 72,4% — tehden siitä vahvimman mallin työpöytäautomaatioon.

Mikä on GPT-5.4:n hinnoittelu?

GPT-5.4 API-hinnoittelu: $2,50/1M syötetokenia, $0,25/1M välimuistissa olevaa syötettä, $15/1M tulostetta. GPT-5.4 Pro: $30/1M syöte, $180/1M tuloste. Erä- ja Flex-käsittely saatavilla puoleen hintaan. GPT-5.2 poistuu käytöstä 5. kesäkuuta 2026.

Mitä on työkalu-haku GPT-5.4:ssä?

Työkalu-haku on uusi ominaisuus, joka lataa työkalumäärittelyt tarvittaessa kaikkien määrittelyjen etukäteen sisällyttämisen sijaan. 250 tehtävässä 36 MCP-palvelimen ollessa käytössä se vähensi kokonaistokenien käyttöä 47% samalla tarkkuudella — merkittävä kustannussäästö yrityksen agenttivirroille.

Minkä konteksti-ikkunan GPT-5.4 tukee?

GPT-5.4 tukee vakio 272K tokenin konteksti-ikkunaa, ja 1M tokenin konteksti on saatavilla Codexissa (laskutetaan 2x normaalihinnalla yli 272K:n). Se on ensimmäinen OpenAI-malli, joka tukee yli 256K tokenin kontekstipitkiä.

Miten GPT-5.4 vertautuu Gemini 3.1 Prohon?

GPT-5.4 johtaa tietokoneen käytössä (75,0% OSWorld vs ei vastaavaa), tietotyössä (83,0% GDPval) ja ARC-AGI-2:ssa (73,3% vs 77,1% Gemini 3.1 Prolle). Gemini 3.1 Pro johtaa koodauksessa (80,6% SWE-Bench vs 57,7%) ja GPQA Diamondissa (94,3% vs 92,8%). Molemmat ovat frontier-malleja eri vahvuuksilla.

Onko GPT-5.4 saatavilla ChatGPT:ssä?

Kyllä. GPT-5.4 Thinking on saatavilla Plus-, Team- ja Pro-tilaajille ChatGPT:ssä, korvaten GPT-5.2 Thinkingin. GPT-5.4 Pro on saatavilla Pro- ja Enterprise-suunnitelmille. Enterprise- ja Edu-järjestelmänvalvojat voivat ottaa varhaisen pääsyn käyttöön järjestelmänvalvojan asetuksista.

Tietoa GPT-5.4:stä

GPT-5.4 on OpenAI:n lippulaiva-päättelymalli, julkaistu 5. maaliskuuta 2026. Se on ensimmäinen mainline-malli, joka yhdistää päättelyn, koodauksen (GPT-5.3-Codex) ja natiivin tietokoneen käytön yhdessä julkaisussa. GPT-5.4 ylittää ihmisen suorituksen OSWorld-työpöytänavigaatiossa, vähentää vääriä väitteitä 33% vs GPT-5.2 ja esittelee työkalu-haun, joka leikkaa tokenikustannuksia 47% monimutkaisissa agenttivirroissa.

Tärkeä huomio: Gemini3.us on itsenäinen harrastaja- ja kehittäjäyhteisöalusta. Emme ole sidoksissa OpenAI:hin, sen hyväksymiä tai virallisesti yhteydessä siihen. Tarjoamme maksullisen pääsyn OpenAI:n virallisiin API-palveluihin infrastruktuurimme ja toimintamme tukemiseksi.

Kokeile GPT-5.4 nyt

Koe OpenAI:n tehokkain malli — natiivi tietokoneen käyttö, 1M konteksti ja frontier-päättely