OpenAI on julkistanut o3-mallin, joka parantaa merkittävästi loogisten ja matemaattisten ongelmien ratkaisemista, asettaen uuden standardin tekoälymalleille ja luoden kilpailua Googlen äskettäin esittelemän Gemini 2.0 Flash Thinking mallin kanssa.
Tärkeimmät havainnot
- OpenAI:n o3-malli on merkittävästi parannettu versio edeltäjästään o1:stä.
- o3-malli on kolme kertaa parempi ARC-AGI-testissä, mikä mittaa loogisten ja matemaattisten ongelmien ratkaisukykyä.
- Google ja OpenAI kilpailevat tiukasti tekoälyn kehittyneimmän mallin asemasta.
- o3-mallin kehitys korostaa keskittymistä lisäominaisuuksien, kuten loogisen päättelyn, parantamiseen skaalauksen sijaan.
- Vaikka mallia ei ole vielä julkaistu julkisesti, ulkopuoliset voivat hakea sen testaajiksi.

OpenAI:n uusi AI-malli: o3
OpenAI on ilmoittanut parannellusta versiosta kehittyneimmästä tekoälymallistaan, nimeltään o3. Uuden mallin julkaisua edelsi Googlen oman päättelyyn kykenevän mallin, Gemini 2.0 Flash Thinking, julkistus. OpenAI:n o3 korvaa aiemman o1-mallin, joka esiteltiin syyskuussa. Molemmat mallit keskittyvät vaiheittaiseen loogiseen päättelyyn tarjotakseen parempia vastauksia kysymyksiin.
OpenAI:n toimitusjohtaja Sam Altman kuvailee tätä uuden AI-vaiheen alkuna, jossa mallit suoriutuvat yhä monimutkaisemmista päättelyä vaativista tehtävistä. o3-malli ylittää monilla mittareilla edeltäjänsä, mukaan lukien koodaukseen liittyvät taidot sekä matematiikan ja tieteen osaamisen. Erityisesti se on kolme kertaa parempi vastaamaan ARC-AGI-testin kysymyksiin, jotka mittaavat mallien kykyä käsitellä vaikeita matemaattisia ja loogisia ongelmia.
Kilpailu OpenAI:n ja Googlen välillä
Kilpailu OpenAI:n ja Googlen välillä käy kovana. Noam Shazeer, Google-tutkija, esitteli äskettäin yhtiön uuden päättelymallin ja nimitti sitä “täyteläisimmäksi malliksemme” Sundar Pichain mukaan. Googlen uusi malli saavutti korkean tuloksen SWE-Bench-testissä, joka mittaa agenttikykyjä. OpenAI:n o3 on kuitenkin huomattavasti edeltäjäänsä o1 parempi.
Ofir Press, Princetonin yliopiston tutkija, katsoo o3:n olevan merkittävä edistysaskel. OpenAI:n on osoitettava kykynsä edistää kehitystä houkutellakseen investointeja ja rakentaa kannattavaa liiketoimintaa. Samaan aikaan Google pyrkii säilyttämään asemansa tekoälytutkimuksen eturintamassa. Uudet mallit osoittavat, kuinka AI-yritykset keskittyvät skaalauksen sijaan lisää ominaisuuksien kehittämiseen. OpenAI tarjoaa kaksi versiota uudesta mallista: o3 ja o3-mini. Mallia ei vielä julkaista julkisesti, mutta ulkopuoliset voivat hakea testaajiksi.
OpenAI:n mallit ja päättelyn merkitys
OpenAI on paljastanut lisätietoja o1-mallin käytetyistä tekniikoista, kuten deliberative alignment. Tämä menetelmä kouluttaa mallin turvamääräyksillä ja antaa sen pohtia ongelman luonnetta ja vastauksiaan. Tämän lähestymistavan ansiosta malli on vaikeammin huijattavissa, koska sen päättelyprosessi havaitsee ilkivaltayritykset.
Vaikka suuret kielimallit osaavat vastata hyvin moniin kysymyksiin, ne usein kompastelevat perusmatematiikkaa tai logiikkaa vaativissa pulmissa. OpenAI:n o1-malli sisältää vaiheittaisen ongelmanratkaisun harjoittelun, mikä parantaa vastauskykyä. Päättelyä suorittavat mallit ovat myös tärkeitä, kun yritykset pyrkivät ottamaan käyttöön niin sanottuja AI-agentteja, jotka kykenevät ratkaisemaan monimutkaisia ongelmia käyttäjän puolesta.
Mark Chen, OpenAI:n tutkimuksen johtaja, totesi, että malli vaikuttaa ohjelmointikykyjensä puolesta uskomattomalta. Vaikka teknologiajättiläiset eivät ole vielä saavuttaneet läpimurtoa vuoden lopussa, AI-ilmoitusten tahti on ollut huimaava. Google esitteli hiljattain uuden lippulaivamallinsa, Gemini 2.0:n. OpenAI on puolestaan julkistanut uuden version videomallistaan ja ilmaisen ChatGPT-hakukoneen sekä tavan käyttää ChatGPT:tä puhelimella.


































