Anthropic Uusien AI-mallien Julkaisu
Anthropic on esitellyt kaksi uutta AI-mallia, Claude 4 Opus ja Claude Sonnet 4, jotka parantavat merkittävästi suunnittelua ja muistamista, ja ovat saatavilla maksullisina ja osittain myös maksuttomina versioina.
Tärkeimmät Havainnot
- Claude 4 Opus parantaa pelisuoritusta Pokémon-peleissä erinomaisilla suunnittelu- ja muistitoiminnoilla.
- Uusien mallien versiohyppäys 3.7:stä 4:ään tuo mukanaan kehittyneitä päätöksentekomahdollisuuksia ja pitkäaikaista kontekstin muistamista.
- Antropic pyrkii kehittämään AI-agentteja, jotka voivat toimia itsenäisesti monimutkaisissa tehtävissä.
- Claude-mallit ovat kehittyneet vähentäen kiertokeinojen käyttöä koodauksessa ja muissa tehtävissä.
- Turvallisuusluokitukset ASL-3 ja ASL-2 varmistavat, että mallit käsitellään niiden riskien mukaisesti mahdollistaen turvallisen käytön.

Antropic on julkistanut kaksi uutta tekoälymallia kehittäjäkonferenssissaan San Franciscossa: Claude 4 Opus ja Claude Sonnet 4. Claude 4 Opus on saatavilla maksullisten käyttäjien käyttöön, ja Claude Sonnet 4 on avoinna kaikille, sekä maksullisille että maksuttomille käyttäjille. Uusien mallien kehityksessä on siirrytty suoraan versiosta 3.7 versioon 4. Näissä malleissa parannukset keskittyvät suunnitteluun, päätöksentekoon ja keskustelujen kontekstin muistamiseen pitkän ajan jälkeen. Erityisesti Claude 4 Opus on kehittynyt huomattavasti Pokémon-pelissä suorituksensa osalta.
Antropic esitteli muutama kuukausi sitten Twitch-striimin nimeltä “Claude Plays Pokémon” saadakseen esille Claude 3.7 Sonnetin kyvyt. Tämä demonstraatio osoitti, kuinka Claude pystyy analysoimaan peliä ja tekemään päätöksiä vaiheittain ilman laajaa ohjausta. Projektin taustalla ollut David Hershey valitsi Pokémon Redin yksinkertaiseksi harjoituskentäksi, jolloin pelin vuoropohjaiset elementit eivät vaadi reaaliaikaista reagointia – tilanne, jossa Anthropicin nykyiset mallit ovat edessä haasteiden kanssa.
AI-podcastin Kehittäminen
Hersheyn tavoitteena oli tutkia, miten Claudea voitaisiin käyttää agenttina monimutkaisissa tehtävissä. Vaikka Claude 3.7 Sonnet kohtasi joitakin pulmia pelissä, kuten juuttumisen tiettyihin kaupunkeihin, uusi Claude 4 Opus paransi merkittävästi toimintojaan. Pitkäaikainen muisti ja suunnittelukyky mahdollistivat paremman navigoinnin Pokémon-tehtävien läpi.
- Claude 4 Opus tarjoaa parannettuja pitkäaikaisen muistin ja suunnittelukyvyn ominaisuuksia, jotka ovat merkittäviä Pokémon-tutkimuksissa.
- Uudet mallit ovat keskittyneet vähentämään kiertoteiden käyttöä tehtävien suorittamisessa.
- Tutkimukset ovat paljastaneet 65 prosentin vähenemisen tehtävien kiertämisessä, erityisesti koodausaiheissa.
Antropicin Pokémon-tutkimuksessa käsitellään tekoälyn päätöksenteon ymmärtämistä monimutkaisissa tehtävissä ja sen ohjaamista oikeaan suuntaan. Tällaiset kysymykset ovat keskeisiä AI-agenttien kehityksessä, jotka pyrkivät itsenäisempään toimintakykyyn.
Turvallisuus ja luotettavuus ovat olleet Antropicin kehitystyön ytimessä. Antropicin päätiemä Jared Kaplan on todennut, että Claude 4 Opus on heidän ensimmäinen ASL-3-turvallisuusmallinsa. Tämä malli lisää potentiaalisia riskejä katastrofikäytöksessä verrattuna ei-AI-tilanteisiin, mutta yhtiön turvallisuusryhmä on tehnyt kattavia arviointeja riskien vähentämiseksi ja parantaakseen mallien luotettavuutta. Claude Sonnet 4 -mallille on myös annettu ASL-2-luokitus, mikä osoittaa huolellista varovaisuutta lisätutkimuksia odotellessa.


































