AI-koodihallusinaatiot uhkaavat ohjelmistojen toimitusketjuja, koska ne voivat johtaa vaarallisiin riippuvuuspaikannushyökkäyksiin, mikä kasvattaa ohjelmistohyökkäysten riskiä merkittävästi.
Tärkeimmät havainnot
- Tekoälymallit luovat usein olemattomia riippuvuuksia, mikä lisää ohjelmistojen haavoittuvuutta.
- Avoimen lähdekoodin mallit hallusinoivat merkittävästi enemmän kuin kaupalliset mallit.
- Riippuvuuspaikannushyökkäykset mahdollistavat haitallisten komponenttien tunkeutumisen ohjelmistoihin helposti.
- JavaScriptin monimutkaisuus ja laajempi pakettikokoelma kasvattaa hallusinaatioiden todennäköisyyttä verrattuna Pythoniin.
- Riippuvuushallintaohjelmistot voivat vahingossa suosia vaarallisia versioita näiden hallusinaatioiden vuoksi.
“`

Keinotekoisten koodin hallusinaatiot ja niiden uhka
Uusi tutkimus on paljastanut, että tekoälyn tuottamat koodit sisältävät useammin keksittyjä tietoja, joita voidaan käyttää harhauttamaan ohjelmistoja vuorovaikuttamaan vaarallisen koodin kanssa. Tutkimuksessa, jossa käytettiin 16 suosittua suurta kielimallia tuottamaan 576 000 koodiesimerkkiä, havaittiin, että 440 000 pakkausriippuvuudesta oli “hallusinoituja”. Tämä tarkoittaa, että ne olivat olemattomia.
Avoimen lähdekoodin mallit hallusinoivat eniten, jopa 21 prosenttia riippuvuuksista liittyi olemattomiin kirjastoihin. Lähdekoodin riippuvuudet ovat oleellinen osa modernia ohjelmistojen toimitusketjua, sillä ne säästävät ohjelmoijat koodin uudelleenkirjoittamisen vaivalta.
Riippuvuuspaikannuksen muistutukset
Nämä olemattomat riippuvuudet muodostavat uhan ohjelmistojen toimitusketjuille lisäämällä niin sanottuja riippuvuuspaikannushyökkäyksiä. Tämäntyyppiset hyökkäykset toimivat saattamalla ohjelmistopaketin käyttämään väärää komponenttiriippuvuutta, esimerkiksi julkaisemalla haitallisen paketin, jolla on sama nimi kuin laillisella paketilla mutta uudemmalla versiolla. Ohjelmisto valitsee joissain tapauksissa haitallisen version, koska se näyttää tuoreemmalta.
- Tämä hyökkäysmenetelmä esiteltiin ensimmäisen kerran vuonna 2021.
- Demonstraatiossa osoitettiin, kuinka väärennetty koodi voi tunkeutua suurten yritysten, kuten Applen, Microsoftin ja Teslan, verkkoihin.
Hallusinaatioiden vaikutus hyökkäyksiin
Tutkimus huomasi eroja eri suurten kielimallien ja ohjelmointikielten välillä, jotka tuottivat eniten pakettihallusinaatioita. Avoimen lähdekoodin mallit, kuten CodeLlama ja DeepSeek, tuottivat lähes 22 prosenttia hallusinaatioista, kun taas kaupalliset mallit, esimerkiksi ChatGPT-sarja, tuottivat hieman yli viisi prosenttia.
Pythonilla kirjoitettu koodi johti harvempiin hallusinaatioihin kuin JavaScript-koodi. Erojen syyt ovat monimutkaisia, mutta niitä voisi selittää muun muassa JavaScriptin laajempi pakettikokoelma ja monimutkaisempi nimistö verrattuna Pythoniin. Tämä monimutkaisuus voi lisätä mallien epävarmuutta niiden sisäisissä ennusteissa, lisäten hallusinoitujen pakettien määrää.


































