DeepSeek: Kiinalainen AI-innovaattori
Kiinalainen AI-startup DeepSeek on noussut merkittäväksi toimijaksi tekoälykentällä haastamalla tunnettuja nimiä, kuten OpenAI:n, avoimen lähdekoodin AI-mallillaan. Tämä malli on saavuttanut erityisesti Piilaaksossa huippuarvosteluja esitellen yrityksen teknologista huippuosaamista, joka perustuu resurssien optimointiin ohjelmistopohjaisesti.
Tärkeimmät havainnot
- DeepSeekin malli on avoimen lähdekoodin ja se on ylittänyt monet alan johtavat mallit suorituskyvyssä.
- Yhdysvaltojen asettamat vientirajoitukset ovat ajaneet DeepSeekin kehittämään innovatiivisia teknologioita, jotka eivät ole riippuvaisia huipputeknisistä resursseista.
- Yrityksen juuret ovat High-Flyer-rahastossa, ja sen tiimi koostuu pääosin huipputason kiinalaisista tutkijoista.
- DeepSeek on saavuttanut merkittäviä teknologisia edistysaskeleita Multi-head Latent Attention ja Mixture-of-Experts -tekniikoiden avulla.
- DeepSeekin avoimuus innovaation jakamisessa on parantanut sen asemaa globaalissa AI-tutkimusyhteisössä.

Kiinalainen AI-startup DeepSeek on noussut nopeasti maailman tietoisuuteen julkistettuaan uuden avoimen lähdekoodin mallin, joka on herättänyt huomiota erityisesti Piilaaksossa. DeepSeek-R1-malli on ylittänyt monella mittarilla alan johtavat mallit, kuten OpenAI:n mallit. Yhdysvaltojen ja Kiinan välisessä teknologisessa kylmässä sodassa asetetut vientirajoitukset ovat pakottaneet kiinalaiset yritykset keksimään uusia tapoja edetä AI-kehityksessä.
Toisin kuin monet muut kiinalaiset AI-yritykset, jotka tukeutuvat pitkälti huippulaitteistojen saatavuuteen, DeepSeek on keskittynyt resurssien optimointiin ohjelmistopohjaisesti. Tämän ansiosta yritys on pystynyt erottumaan kilpailijoistaan kehittämällä teknologiaa, joka ei ole riippuvainen resursseista, mutta on silti huipputeknologiaa.
Hedgerahaston rahoitus
DeepSeek syntyi High-Flyer-rahaston syvällisen oppimisen tutkimusosastosta nimeltään Fire-Flyer. High-Flyer on yksi Kiinan menestyneimmistä kvantitatiivisista hedge-rahastoista ja se on kerännyt huomattavia määriä hyödykkeitä analysoidakseen taloustietoja. Vuonna 2023 rahasto päätti perustaa DeepSeekin ja keskittyä uudenlaisten huippumallien kehittämiseen.
- Liang Wenfengiä ajoi eteenpäin tieteellinen uteliaisuus, ei liiketoiminnallinen voitontavoittelu.
- DeepSeek on noussut yhdeksi Kiinan johtavista AI-yrityksistä.
- Yritys ei turvaudu teknologiajättien rahoitukseen.
DeepSeekin tutkimustiimi koostuu pääasiassa Kiinan huippuyliopistojen jatko-opiskelijoista, jotka ovat saaneet tunnustusta tieteellisissä julkaisuissa ja akateemisissa konferensseissa. Liang halusi koota nuoren tutkijajoukon, joka voisi vapaasti hyödyntää resursseja epätavanomaisiin tutkimusprojekteihin. DeepSeekin kulttuuri eroaa merkittävästi kiinalaisista internet-yrityksistä, joissa resurssit ovat usein kilpailtua valuuttaa.
Vuonna 2022 Yhdysvaltojen hallitus otti käyttöön vientirajoituksia, jotka rajoittavat kiinalaisten AI-yritysten pääsyä huipputeknologian siruihin. Tämä tilanne pakotti DeepSeekin kehittämään uusia, tehokkaampia tapoja kouluttaa mallejaan. Yritys on muun muassa tehnyt merkittäviä edistysaskeleita Multi-head Latent Attention (MLA) ja Mixture-of-Experts -teknologioissa, joiden avulla he pystyvät vähentämään laskentatehoa.
DeepSeekin uusin malli vaatii vain kymmenesosan Meta-yhtiön vastaavien mallien tarvitsemasta laskentatehosta. DeepSeekin avoimuus ja halu jakaa kehittämiään innovaatioita ovat ansainneet sille paljon hyvää tahtoa globaalissa AI-tutkimusyhteisössä.


































