Verkossa olevat henkilökohtaiset tiedot saatetaan käyttää ilman lupaa generatiivisen tekoälyn koulutukseen, mutta on olemassa keinoja minimoida tämän riskin toteutuminen.
Tärkeimmät havainnot:
- Teknologiayritykset käyttävät usein ilman lupaa verkosta kerättyjä tietoja tekoälyn koulutukseen.
- Osa yrityksistä tarjoaa nyt käyttäjille mahdollisuuden estää tietojensa käytön tekoälyn koulutuksessa.
- Prosessi tietojen poistamiseksi malleista on usein monimutkainen, ja automaattiset tietojen luovutukset ovat yleisiä.
- Useat yritykset, kuten Adobe ja Amazon AWS, tarjoavat vaihtoehtoja kieltäytyä tietojen analysoinnista ja käytöstä.
- Verkkosisällön suojaamiseksi voi käyttää verkkosivuston robots.txt-tiedostoa estämään tekoälybotsien pääsyn sivuston sisältöön.

Kuinka estää tietojesi käyttö tekoälyn koulutuksessa
Jokainen verkkoon tehty päivitys, kuten vanha blogiartikkeli tai epäselvä Instagram-selfie, on todennäköisesti päätynyt käytettäväksi generatiivisen tekoälyn harjoittelumateriaalina. Suurten kielimallien, kuten ChatGPT:n, toiminta perustuu valtavaan määrään tietoa, jota yritykset usein keräävät verkkosivuilta ilman lupaa tai yksityisyyden suojelun huomiointia. Monet teknologiayritykset kaappaavat laajoja verkkosisältöjoukkoja väittäen, että nämä ovat välttämättömiä generatiivisen tekoälyn kehittämiseen. Oikeusjuttujen ja tutkimusten kasvaessa jotkut yhtiöt tarjoavat käyttäjille mahdollisuuden kieltää sisältönsä käyttö tekoälyn koulutuksessa. Tämä artikkeli opastaa, kuinka voit estää tietojesi hyväksikäytön ja mitä vaihtoehtoja on tarjolla.
Rajoitukset
Ennen kuin opit kieltäytymään tietojen käytöstä, on tärkeää ymmärtää realiteetit: monet tekoälysovelluksia kehittävät yhtiöt ovat jo ehtineet käyttää verkossa julkaistut tietosi. Yhtiöt ovat usein salaperäisiä tavoitteidensa ja surffaamansa sisällön tarkkuuden suhteen.
- Vaikka olisi mahdollista saada tietojasi poistettua malleista, on todellisten prosessien tuntemus vähäistä ja tietojen poistaminen voi olla työlästä.
- Useimmat yritykset tekevät datan jakamisen ja käyttäjästä pois sulkemisen vaikeaksi asettamalla oletukseksi automaattisen rekisteröitymisen tietojen luovutukseen.
Tässä annamme vinkkejä, miten voi hallita tietojesi käyttöä muutamien yhtiöiden osalta.
Estäminen yrityskohtaisesti
Monen yrityksen palveluista voi erikseen kieltäytyä tietojen käytöstä tekoälyn koulutukseen. Esimerkiksi Adobe antaa mahdollisuuden kieltää sisällön analysoimisen, kun taas Amazon AWS tarjoaa tavan estää asiakastietojen käytön koulutuksessa.
Google Gemini’ssa, Grammarlyssa, ja HubSpotissa voi tehdä erilaisia estotoimia käyttäjätilien asetuksissa. Joissakin tapauksissa, kuten Slackin, käyttäjän hallintohenkilöstö voi ottaa yhteyttä yritykseen tiedon käytön estämiseksi.
Suojaa sisältösi
Jotkut verkkosisällönhallintajärjestelmät, kuten Squarespace ja Substack, tarjoavat mahdollisuuksia päivittää verkkosivuston robots.txt-tiedostoa siten, ettei tekoälybotsit pysty haravoimaan sivuston sisältöä. Automattic, joka omistaa muun muassa WordPressin ja Tumblrin, tarjoaa käyttäjilleen vaihtoehdon estää sisältönsä jakaminen kolmansille osapuolille.
Nämä ovat kuitenkin voimassa vain, jos tekoälyyritykset kunnioittavat tätä estoa. Lisäksi käyttäjät voivat käyttää ulkoisia työkaluja, kuten “Have I Been Trained?” tarkistaakseen ja pyytääkseen kuvien käyttöä koulutuksessa.

































