DeepSeekin Avoimen Lähdekoodin Tekoälymallien Käyttö ja Sensuuri
DeepSeekin avoimen lähdekoodin tekoälymallien käyttö nostaa esiin merkittäviä sensuurimekanismeja, jotka ilmenevät erityisesti, kun malli toimii kiinalaisten tietokontrollisäädösten alaisuudessa ja sisältää opetuksen aikana syntyneitä ennakkoasenteita.
Tärkeimmät Havainnot
- DeepSeek sensuroi vastauksiaan erityisesti arkaluontoisissa poliittisissa kysymyksissä, kuten Kiinan hallituksen kaltaisista aiheista.
- Sensuuri on voimakkainta, kun malli toimii DeepSeekin sovellusympäristössä, mutta sitä esiintyy myös teknisellä tasolla mallin sisäänrakennettujen ennakkoluulojen kautta.
- Mallien avoimen lähdekoodin luonne mahdollistaa jälkikoulutusennakoiden säätämisen, mutta se on monimutkainen tehtävä.
- Ennakkoluuloja voi yrittää lieventää käyttämällä vähemmän koulutettuja malliversioita.
- Sensuurista huolimatta monet yritykset saattavat käyttää DeepSeekin malleja taloudellisten syiden vuoksi, ohittaen mahdolliset moraaliset huolenaiheet.

Vain kaksi viikkoa sen jälkeen, kun DeepSeek julkaisi avoimen lähdekoodin tekoälymallinsa, kiinalainen startup-yritys on edelleen julkisten keskustelujen keskiössä tekoälyn tulevaisuudesta. Vaikka yritys vaikuttaisi johtavan Yhdysvaltalaisia kilpailijoitaan matemaatikan ja päättelykyvyn osalta, se sensuroi aggressiivisesti omia vastauksiaan. Kysymykset Taiwanista tai Tiananmenista saavat vain harvoin vastauksen DeepSeek R1:ltä.
WIRED tutki, miten sensuuri toimii teknisellä tasolla, testaamalla DeepSeek-R1:tä sen omalla sovelluksella, kolmannen osapuolen Together AI -alustallaan sekä WIREDin omalla tietokoneella käyttäen Ollama-sovellusta. Tulokset osoittivat, että yksinkertaisin sensuuri on vältettävissä välttämällä DeepSeekin sovellusta, mutta malli sisältää myös opetuksen aikana syntyneitä ennakkoasenteita.
Sovellustason sensuuri
DeepSeek nousi suosioon Yhdysvalloissa, mutta käyttäjät huomasivat mallin kieltäytyvän vastaamasta Kiinan hallitukselle arkaluontoisiin aiheisiin, kun sitä käytettiin DeepSeekin verkkosivuston, sovelluksen tai API:n kautta. Nämä kieltäytymiset tapahtuvat sovellustasolla ja ovat näkyvissä vain, kun käyttäjä on vuorovaikutuksessa R1:n kanssa DeepSeekin hallitsemassa kanavassa.
Kiinalaiset generatiivisen tekoälyn mallit, kuten DeepSeek, joutuvat noudattamaan tiukkoja tietokontrollisäädöksiä. DeepSeek-aloittaa Yakefun mukaan mukauttamalla mallinsa paikallisten käyttäjien tarpeisiin ja kulttuuriseen kontekstiin. Tämä varmistaa hyväksynnän erittäin säännellyillä markkinoilla.
Sisäänrakennettu ennakkoluulo
DeepSeek-R1-malli, joka on isännöity Together AI -palvelussa, ei välttämättä suoralta kädeltä kieltäydy vastaamasta kysymyksiin, mutta se osoittaa merkkejä sensuurista tuottamalla lyhyitä vastauksia, jotka on selvästi koulutettu yhdeksi hallituksen retorikkaan poliittisissa asioissa. Malli voi seurata hallituksen linjaa mainitsematta arkaluontoisia tapahtumia, ja se keskittyy enemmän Kiinan kommunistipuolueen saavutuksiin ja myönteiseen kehitykseen.
Tällainen sensuuri viittaa siihen, että kaikki tekoälymallit ovat jossain määrin ennakkoluuloisia koulutuksensa vuoksi. Esikoulutusennako on mahdollista havaita, koska mallin data voi olla puolueellista.
Ennakko- ja jälkikoulutusennakoiden poistaminen
Koska DeepSeek on avoimen lähdekoodin malli, sen jälkikoulutusennakoita voi teoriassa säätää. Prosessi on kuitenkin haastava. Yhteisön kehittämät mallit, kuten Dolphin, yrittävät poistaa jälkikoulutusennakoita eri tavoin, kuten muuttamalla mallin painotuksia tai kouluttamalla mallia uudelleen sensuroiduista aiheista kootun tietokannan avulla.
Toinen tapa lähestyä asiaa on käyttää “perus” versiota mallista, kuten DeepSeek-V3-Base, joka ei ole saanut yhtä paljon jälkikoulutusta. Näin mallit on helpompi poistaa sensuroidusta sisällöstä.
Miksi se merkitsee
Vaikka kiinalainen sensuuri tekoälymalleissa saakin usein huomiota, se ei välttämättä estä yrityksiä ottamasta DeepSeekin malleja käyttöön. Moni ei-kiinalainen yritys saattaa valita liiketaloudellisia pragmaatisia syitä moraalisten näkökohtien sijaan.
Esimerkiksi Taiwanin ja Tiananmenin aiheet ovat täysin merkityksettömiä, kun tarkoituksena on tehdä parempaa koodia tai matemaattisesti haastavampia ongelmia. Kiinalaisten mallien censuuriongelmat voivat herättää kysymyksiä, mutta linjaus aiheuttaa vähemmän päänvaivaa heidän kotimaassaan.


































