• Tietoa meistä
  • Mainosta
  • Tietosuoja ja käyttöehdot
  • Ota yhteyttä
Tekoäly Tutuksi
  • Uutiset
    • All
    • Agentit ja Automaatio
    • Apple
    • Arvostelut
    • Automotive
    • Google
    • Kielimallit
    • Kuva ja ääni
    • Meta
    • Microsoft
    • Nvidia
    • Samsung
    • Sekalaiset
    • Sosiaalinen media
    • Sovellukset
    • vertailut
    • Video

    Google DeepMindin johtaja: Gemini-mallit vievät kohti AGI:tä

    Google tuo AI Mode -hakukokemuksen laajasti käyttöön Yhdysvalloissa

    Jack Dorseyn Block kehitti tekoälyagentin parantamaan tuottavuutta

    YouTuberin ääni kloonattiin AI:n avulla Doom-videoihin

    Tekoälyagenttien virheiden vastuullisuus: Kuka maksaa laskun?

    Politico kohtaa oikeustaistelun tekoälyn käytöstä uutistoimituksessa

    Anthropic esittelee uusia AI-malleja, jotka parantavat suunnittelua ja muistamista

    Meta AI:n Llama-malli käytössä hallituksen sähköpostien analysoinnissa

    UAE:n uusi tekoälyhanke ja tutkimuskeskus Piilaaksossa

  • Kuva ja ääni

    ChatGPT:n Kuvageneraattorin Käyttö: Yksityisyysriskit ja Suojausvinkit

    Tietoturvavuoto paljastaa tekoälykuvien vaarallisen käytön

    Canva kohtaa tekoälyn haasteet: Miten se selviää?

    Leonardo AI:n uusi Flow State ominaisuus mullistaa luovan prosessin

    Leonardo AI:n uusi Flow State ominaisuus mullistaa luovan prosessin

    Google AI:n kyvyt: Mitä valokuvasi paljastavat?

    AI-kuvien kehitys: Tim (lora) futuristisena soturina ja lennolla

    Trending Tags

    • Flux
    • Dall-e
    • Midjourney
    • Stable Diffusion
    • Comfy UI
  • Video

    YouTuberin ääni kloonattiin AI:n avulla Doom-videoihin

    Googlen VEO 2-mallilla luodaan upeaa 3D-videota ja videonmuokkausta

    Mukauta äänipodcastisi helposti Gen FM:llä

    Asiantuntijoiden vinkit AI-huijausten välttämiseen

    Trending Tags

    • Runway
    • Google Sora
    • Elevenlabs
    • Murf.ai
  • Kielimallit

    Google DeepMindin johtaja: Gemini-mallit vievät kohti AGI:tä

    Google tuo AI Mode -hakukokemuksen laajasti käyttöön Yhdysvalloissa

    Meta AI:n Llama-malli käytössä hallituksen sähköpostien analysoinnissa

    UAE:n uusi tekoälyhanke ja tutkimuskeskus Piilaaksossa

    Tekoäly kasvattaa datakeskusten energiankulutusta huolestuttavasti

    Tekoäly ei estä uramahdollisuuksiasi: Humanististen tieteiden voima

    Trending Tags

    • Mistral
    • Meta Llama
    • Open AI Chat-GPT
    • Anthropic Claude
  • Arvostelut

    Tehosta Bloggaamista ChatGPT Canvasin Avulla

    Apple Intelligence Arvio- pikakatsaus

    Apple Intelligence Arvio- pikakatsaus

    Kokemuksia Apple Intelligence -ominaisuudesta: Siri ja sen uudet kyvyt

    Kokemuksia Apple Intelligence -ominaisuudesta: Siri ja sen uudet kyvyt

    Marvel-elokuvat: Kaviaarista vesilasiin, missä on laatua?

  • Sovellukset

    Politico kohtaa oikeustaistelun tekoälyn käytöstä uutistoimituksessa

    Google I/O 2025: Mitä odottaa tekoälyn ja Androidin tulevaisuudelta

    WhatsAppin AI-ominaisuudet ja yksityisyyden suojan haasteet

    Trending Tags

    • Nvidia
    • Invideo
    • Veed.io
    • Fliki
    • Canva
  • Agentit ja Automaatio

    Jack Dorseyn Block kehitti tekoälyagentin parantamaan tuottavuutta

    Tekoälyagenttien virheiden vastuullisuus: Kuka maksaa laskun?

    Anthropic esittelee uusia AI-malleja, jotka parantavat suunnittelua ja muistamista

    OpenAI:n Codex: Uusi työkalu koodin automatisointiin verkossa

    Tekoäly ja musiikkipetokset: Miljoonien dollarien huijauspaljastus

    Microsoftin Bing-hakudatan saatavuus päättyy: Keskitytään AI-chatbotteihin

    Trending Tags

    • Anthropic Claude
    • Open AI Chat-GPT
No Result
View All Result
  • Uutiset
    • All
    • Agentit ja Automaatio
    • Apple
    • Arvostelut
    • Automotive
    • Google
    • Kielimallit
    • Kuva ja ääni
    • Meta
    • Microsoft
    • Nvidia
    • Samsung
    • Sekalaiset
    • Sosiaalinen media
    • Sovellukset
    • vertailut
    • Video

    Google DeepMindin johtaja: Gemini-mallit vievät kohti AGI:tä

    Google tuo AI Mode -hakukokemuksen laajasti käyttöön Yhdysvalloissa

    Jack Dorseyn Block kehitti tekoälyagentin parantamaan tuottavuutta

    YouTuberin ääni kloonattiin AI:n avulla Doom-videoihin

    Tekoälyagenttien virheiden vastuullisuus: Kuka maksaa laskun?

    Politico kohtaa oikeustaistelun tekoälyn käytöstä uutistoimituksessa

    Anthropic esittelee uusia AI-malleja, jotka parantavat suunnittelua ja muistamista

    Meta AI:n Llama-malli käytössä hallituksen sähköpostien analysoinnissa

    UAE:n uusi tekoälyhanke ja tutkimuskeskus Piilaaksossa

  • Kuva ja ääni

    ChatGPT:n Kuvageneraattorin Käyttö: Yksityisyysriskit ja Suojausvinkit

    Tietoturvavuoto paljastaa tekoälykuvien vaarallisen käytön

    Canva kohtaa tekoälyn haasteet: Miten se selviää?

    Leonardo AI:n uusi Flow State ominaisuus mullistaa luovan prosessin

    Leonardo AI:n uusi Flow State ominaisuus mullistaa luovan prosessin

    Google AI:n kyvyt: Mitä valokuvasi paljastavat?

    AI-kuvien kehitys: Tim (lora) futuristisena soturina ja lennolla

    Trending Tags

    • Flux
    • Dall-e
    • Midjourney
    • Stable Diffusion
    • Comfy UI
  • Video

    YouTuberin ääni kloonattiin AI:n avulla Doom-videoihin

    Googlen VEO 2-mallilla luodaan upeaa 3D-videota ja videonmuokkausta

    Mukauta äänipodcastisi helposti Gen FM:llä

    Asiantuntijoiden vinkit AI-huijausten välttämiseen

    Trending Tags

    • Runway
    • Google Sora
    • Elevenlabs
    • Murf.ai
  • Kielimallit

    Google DeepMindin johtaja: Gemini-mallit vievät kohti AGI:tä

    Google tuo AI Mode -hakukokemuksen laajasti käyttöön Yhdysvalloissa

    Meta AI:n Llama-malli käytössä hallituksen sähköpostien analysoinnissa

    UAE:n uusi tekoälyhanke ja tutkimuskeskus Piilaaksossa

    Tekoäly kasvattaa datakeskusten energiankulutusta huolestuttavasti

    Tekoäly ei estä uramahdollisuuksiasi: Humanististen tieteiden voima

    Trending Tags

    • Mistral
    • Meta Llama
    • Open AI Chat-GPT
    • Anthropic Claude
  • Arvostelut

    Tehosta Bloggaamista ChatGPT Canvasin Avulla

    Apple Intelligence Arvio- pikakatsaus

    Apple Intelligence Arvio- pikakatsaus

    Kokemuksia Apple Intelligence -ominaisuudesta: Siri ja sen uudet kyvyt

    Kokemuksia Apple Intelligence -ominaisuudesta: Siri ja sen uudet kyvyt

    Marvel-elokuvat: Kaviaarista vesilasiin, missä on laatua?

  • Sovellukset

    Politico kohtaa oikeustaistelun tekoälyn käytöstä uutistoimituksessa

    Google I/O 2025: Mitä odottaa tekoälyn ja Androidin tulevaisuudelta

    WhatsAppin AI-ominaisuudet ja yksityisyyden suojan haasteet

    Trending Tags

    • Nvidia
    • Invideo
    • Veed.io
    • Fliki
    • Canva
  • Agentit ja Automaatio

    Jack Dorseyn Block kehitti tekoälyagentin parantamaan tuottavuutta

    Tekoälyagenttien virheiden vastuullisuus: Kuka maksaa laskun?

    Anthropic esittelee uusia AI-malleja, jotka parantavat suunnittelua ja muistamista

    OpenAI:n Codex: Uusi työkalu koodin automatisointiin verkossa

    Tekoäly ja musiikkipetokset: Miljoonien dollarien huijauspaljastus

    Microsoftin Bing-hakudatan saatavuus päättyy: Keskitytään AI-chatbotteihin

    Trending Tags

    • Anthropic Claude
    • Open AI Chat-GPT
No Result
View All Result
Tekoäly Tutuksi
No Result
View All Result

Harvard julkaisee suuren ilmaisen AI-koulutusdatan OpenAI:n ja Microsoftin tuella

1 year ago
Reading Time: 2 mins read
Home Ai uutiset
147
VIEWS
Jaa artikkeliJaa artikkeliJaa artikkeli

Harvardin yliopisto julkaisee suuren ja monipuolisen AI-koulutusdatan tukien tasapuolista pääsyä huippuluokan sisältöön yhdessä OpenAI:n ja Microsoftin kanssa.

Tärkeimmät havainnot

  • Harvardin uusi datasetti sisältää lähes miljoona julkista kirjaa, jotka ovat käytettävissä AI-työkalujen kouluttamiseen.
  • Datan rahoitus tulee muun muassa Microsoftilta ja OpenAI:lta, korostaen yhteistyötä teollisuuden ja akateemisen maailman välillä.
  • Datasetti kattaa laajan valikoiman genrejä, kieliä ja aikakausia, tarjoten ainutlaatuisen monimuotoisen lähestymistavan tekoälyn koulutusmateriaaleihin.
  • Projekti hyödyntää Googlen aikaisempia skannauksia ja pyrkii tarjoamaan aineistoa ilman tekijänoikeusesteitä.
  • Harvardin aloite pyrkii tukemaan pienempiä AI-toimijoita ja yksittäisiä tutkijoita tarjoamalla heille pääsyn laadukkaaseen dataan, joka on yleensä suurten teknologiayritysten hallussa.

Monkey Image

Harvardin yliopisto on ilmoittanut julkaisevansa korkean laadun datasetin, joka sisältää lähes miljoona julkista kirjaa. Tämä datasetti on kaikkien käytettävissä suurten kielimallien ja muiden tekoälytyökalujen kouluttamiseen. Harvardin uusi Institutional Data Initiative -aloite on luonut datasetin ja saanut rahoitusta sekä Microsoftilta että OpenAI:lta. Kirjat on skannattu osaksi Google Books -projektia, ja ne eivät enää ole tekijänoikeuksien alaisia.

Institutional Data Initiativeen kuuluva tietokanta on noin viisi kertaa laajempi kuin kuuluisa Books3 datasetti, jota on käytetty AI-mallien, kuten Metan Llama, koulutukseen. Toinen ero on se, että kyseinen tietokanta kattaa useita genrejä, kieliä ja aikakausia, kuten William Shakespearen, Charles Dickensin ja Dante Alighierin klassikot. Mukana on myös harvinaisia tšekkiläisiä matematiikan oppikirjoja ja walesilaisia taskusanakirjoja. Hankkeen johtaja Greg Leppert kuvailee projektia pyrkimyksenä “tasoittaa pelikenttää”, jotta tavallisilla ihmisillä, pienillä AI-toimijoilla ja yksittäisillä tutkijoilla on pääsy samanlaisiin huolellisesti valikoituihin sisältövarantoihin, joita yleensä vain suuret teknologiayritykset voivat koota.

Yritysten ja yhteisöjen tuki

Microsoftin varatoimitusjohtaja ja teollis- ja tekijänoikeuspäällikkö Burton Davis korostaa, että yrityksen tuki projektille on linjassa sen laajempien uskomusten kanssa liittyen “avoimien datakantojen” arvoon AI-startupien käytössä, ja sen pitäisi olla “julkisen edun mukaisesti hallittuja”. Samaan aikaan OpenAI:n pääjohtaja Tom Rubin ilmaisi yhtiönsä ilon tukea hanketta.

  • Tämä panostus julkisiin aineistoihin tulee aikana, jolloin tekoälyn koulutusdataan liittyvät oikeudenkäynnit nostavat esiin kysymyksiä tekoälytyökalujen rakennustavasta.
  • Jos yritykset menestyvät näissä oikeusjutuissa, he voivat jatkaa internetin skannausta ilman lisenssisopimuksia tekijänoikeuden haltijoiden kanssa.
  • Mikäli uudet projektit, kuten Harvardin tietokanta, etenevät edelleen, ne viittaavat julkiseen dataan kohdistuvaan nälkään.

Kansainväliset julkiset dataprojektit

Harvardin Institutional Data Initiative (IDI) tekee yhteistyötä Bostonin julkisen kirjaston kanssa skannatakseen miljoonia artikkeleita eri sanomalehdistä, jotka ovat nyt julkisia. Tietokannan tarkka julkaisumuoto on vielä auki, mutta keskusteluja Googlen kanssa käydään. Googlen kansainvälisten asioiden johtaja Kent Walker totesi yhtiön olevan ylpeä tukiessaan projektia.

Erilaisten projektien, startupien ja aloitteiden joukkoon liittyvä IDI pyrkii tarjoamaan suuria ja laadukkaita AI-koulutusmateriaaleja ilman tekijänoikeusongelmia. Yritykset, kuten Calliope Networks ja ProRata, tarjoavat lisenssejä ja hallinnoivat korvausjärjestelmiä tekijöille, jotka tarjoavat dataa AI-koulutukseen.

Tämän lisäksi, ranskalaiseen AI-startupiin Pleias liittynyt Common Corpus sisältää 3-4 miljoonaa kirjaa ja aikakauslehtikokoelmaa ja rohkenee olla ensimmäinen EU:n AI-lainsäädännön mukaiseksi täysin avoimeksi tietokannaksi koulutettu malli. Uuden pelinavauksen tekee myös tekoälyn startup Spawning, joka on kesällä julkaissut Source.Plus-nimisen julkisen kuvadatan.

Tags: Microsoft

Lisää Uutisia

Ai uutiset

Google DeepMindin johtaja: Gemini-mallit vievät kohti AGI:tä

5.6.2025
Ai uutiset

Google tuo AI Mode -hakukokemuksen laajasti käyttöön Yhdysvalloissa

5.6.2025
Agentit ja Automaatio

Jack Dorseyn Block kehitti tekoälyagentin parantamaan tuottavuutta

5.6.2025
Next Post

Sora: Vallankumouksellinen AI-videogeneraattori vai pettymys?

Leave a Reply Cancel reply

Your email address will not be published. Required fields are marked *

Pikauutiset

No Content Available

Tilaa Uutiskirje.

Lue myös

No Content Available

Categories

  • Agentit ja Automaatio
  • Ai uutiset
  • Apple
  • Arvostelut
  • Automotive
  • BMW
  • Google
  • Kielimallit
  • Kuva ja ääni
  • Meta
  • Microsoft
  • Nvidia
  • Pikauutinen
  • Samsung
  • Sekalaiset
  • Sosiaalinen media
  • Sovellukset
  • Tesla
  • vertailut
  • Video
Tekoäly Tutuksi - Sovelluksia Arkeen ja Työhön

Tekoäly Tutuksi on sinun paikkasi pysyä ajan tasalla tekoälyn kehityksestä.

Tarjoamme selkeää ja helposti ymmärrettävää tietoa tekoälyn eri osa-alueista.

Tilaa uutiskirje ja nauti tilaajien ainutlaatuisista oppaista ja asiantuntijasisällöstä.

Some

Categories

  • Agentit ja Automaatio
  • Ai uutiset
  • Apple
  • Arvostelut
  • Automotive
  • BMW
  • Google
  • Kielimallit
  • Kuva ja ääni
  • Meta
  • Microsoft
  • Nvidia
  • Pikauutinen
  • Samsung
  • Sekalaiset
  • Sosiaalinen media
  • Sovellukset
  • Tesla
  • vertailut
  • Video

Tags

Adobe Anthropic Claude Apple Autogen Canva Comfy UI Dall-e Flux Google Google Sora Langchain Meta Llama Microsoft Midjourney Mistral Murf.ai Nvidia Open AI Chat-GPT Runway Samsung Sekalaiset Stable Diffusion X.AI Grok

Uusimmat

Googlen AI Mode muuttaa hakutulosten keskustelumaisuutta

5.6.2025

Tekoälyagenttien virheiden vastuullisuus: Kuka maksaa laskun?

5.6.2025
  • Tietoa meistä
  • Mainosta
  • Tietosuoja ja käyttöehdot
  • Ota yhteyttä

© 2024 Tekoäly Tutuksi - Opi, ymmärrä, innostu!

No Result
View All Result
  • Koti
  • Kuva ja ääni
  • Video
  • Kielimallit
  • Arvostelut
  • Sovellukset
  • Agentit ja Automaatio

© 2024 Tekoäly Tutuksi - Opi, ymmärrä, innostu!

Tämä verkkosivusto käyttää evästeitä. Jatkamalla tämän verkkosivuston käyttöä annat suostumuksesi evästeiden käyttöön. Vieraile tietosuoja- ja evästekäytännössämme.