Tekoälykkäämpi Tuottaja
Tekoälyltä ei voi välttyä nyt kukaan. Se on jättimäinen juna, joka kiitää eteenpäin ilman kuskia. Samaan aikaan kun yrittää ymmärtää mikä tämä masiina edes on, tuntuu että juoksee sitä epätoivoisesti takaa. Se ei pysähdy odottelemaan meitä kyytiin. Mutta salaisuus on, että kaikista tuntuu samalta. Tämä blogi on tiivistelmä hiljattain pitämästäni keynote-esitelmästä “Tekoälykkäämpi tuottaja”.
“Kaikki luonnossa on kirjoitettu matematiikan kielellä”, sanoi Galileo Galilei, ja tämä sanonta kaikuu kovaa ja korkealta, kun puhumme tekoälystä. Tekoäly terminä on oikeasti metafora. Se on monimutkainen joukko algoritmeja ja dataa, jolla ei kuitenkaan ole varsinaista älykkyyttä. Se ei kykene ymmärtämään, päättämään tai oppimaan siinä mielessä kuin ihminen. Kun sanomme, että tekoäly “ymmärtää” tai “oppii”, viittaamme ohjelman kykyyn käsitellä tietoa, tehdä ennusteita ja mukauttaa reaktioitaan sille syötetyn datan perusteella.
Jotta junaa ei hukkaisi kokonaan, on elokuva- ja tv-tuottajan välttämätöntä ymmärtää joitakin peruskäsitteitä. Käymme niitä tässä lyhyesti läpi, samoin kuin parhaita käytäntöjä toimia uusien tekoälysovellusten kanssa. Jotta voimme edes lukea uutisia, meidän on ymmärrettävä, mitä sellaiset sanat kuin koneoppiminen, neuroverkot ja kielimallit tarkoittavat. Älä anna periksi, vaan aktivoi aivojesi harmaata aluetta kuin teini-ikäinen matematiikan tunnilla ikään.
Koneoppiminen – mitä se edes on?
Koneoppiminen on säännönmukaisuuksien etsimistä datasta. Siinä käytetään analyyttisiä menetelmiä tilastollisten havaintojen tunnistamiseksi harjoitusdatan perusteella. Tämä ohjaa järjestelmää tekemään dataan perustuvia oletuksia ja ennustuksia. Päätökset ohjelman toiminnasta tekevät ohjelman kehittäjät. He päättävät, mitä oppimisalgoritmeja käytetään, mitä säännönmukaisuuksia etsitään ja miten tietoja analysoidaan. Tulokset ovat tilastollisia todennäköisyyksiä, eivät tietoa. Koneoppimisessa on pohjimmiltaan kyse matkimisesta, ja oppimateriaalina on harjoitusdata.
Tämä data ei ole täydellistä. Datan laatu, määrä ja sisältö vaikuttavat merkittävästi tuloksiin. Aivan kuten on mahdotonta tehdä yhtä tieteellistä tutkimusta kaikesta maailmassa, on mahdotonta luoda koneoppimismenetelmä, joka ymmärtäisi kaiken. Kuten tutkimuksen kohdallakin, aina on tarve rajata aihe, valita tutkimusaineisto ja jokin käytettävä menetelmä. Pääsääntöisesti tuhansien oppimistapahtumien jälkeen algoritmi tuottaa staattisen mallin, jolla voidaan luokitella, klusteroida tai tunnistaa poikkeamia.
Poikkeuksena tästä on vahvistusoppiminen, koneoppimisen tyyppi, jossa ohjelma muuttuu ja kehittyy suorituksen aikana. Se oppii suorittamaan sille annettua tehtävää entistä tarkoituksenmukaisemmin ja mukauttaa käyttäytymistään sen perusteella, mikä johtaa haluttuun lopputulokseen. Esimerkiksi kuriirirobotit optimoivat reittejään ja jakelutapojaan vahvistusoppimisen avulla. Se ei kuitenkaan opi annettujen raaamien ulkopuolelle, vaan pikemminkin kapeutuu ja optimoituu.
Neuroverkot ja kielimallit
Neuroverkot edustavat koneoppimismenetelmää, joka jäljittelee löyhästi ihmisaivojen toimintaa. Idea on 70-vuotta vanha ja nimi on jäänyt sen peruilta mutta lähellekään tavoitetta ei olla päästy. Hienoihin saavutuksiin silti. Keinotekoinen verkko suorittaa miljardeja yksinkertaisia laskutoimituksia, ja tuhansien harjoitustapahtumien jälkeen se muodostaa “näkemyksen” tai todennäköisen arvauksen. Tuloksena on matemaattinen yleistys, monimutkainen ja monimutkainen.
Chat-GPT:n kaltaiset suuret kielimallit (Large Language Models, LLM) ovat eräs neuroverkkojen muoto, joka tuottaa matemaattisia esityksiä sanoista, lauseista ja niiden välisistä suhteista laajojen tekstimuotoisten harjoitusaineistojen perusteella. Ohjelman käyttämät säännöt koskevat merkkejä, eivät ilmaisujen merkityksiä. Kun säännöt ovat ihmisen antamat, ne voivat perustua sanojen merkityksiin – merkityksiin, joita sanoilla on ohjelman tekijälle ja käyttäjälle, ei ohjelmalle. Kielimalli on siis todennäköisyyskone, joka on koulutettu tietyillä tiedoilla, tehtävillä ja oppimisalgoritmeilla. Nämä mallit muutavat matematiikaksi harjoitusdatassa esiintyviä tietoja mutta myös siinä olevia ennakkoluuloja tai stereotyyppejä.
Neuroverkkojen monimutkaisuus merkitsee sitä, että vaikka niiden lopputulos on tarkka ja hyödyllinen, ihminen ei voi helposti tulkita sitä. Kun sanomme, että edes asiantuntijat eivät täysin ymmärrä, miten neuroverkko toimii, viittaamme näiden matemaattisten laskutoimitusten monimutkaisuuteen.
Mutta herra Galilei oli kenties oikeassa. Esimerkiksi kauhealla nimellä konvoluutiohermoverkoiksi kutsuttu verkko “ymmärtää” eli ennustaa matemaattisesti kuvia ja niiden kerroksia. Takaisinkytkentäneuroverkko oppii matemaattisesti peräkkäisrakenteisen datan keskinäisiä yhteyksiä, eli sillä on muisti. Vaikka nämä ovatkin ällistyttäviä tieteellisiä keksintöjä, vielä ei olla tilanteessa, jossa robotit valloittavat maailman.
Keinoäly (AGI, Artificial General Intelligence) eli hypoteettinen tekoälyn muoto, joka pystyisi ymmärtämään, oppimaan ja ajattelemaan kuten ihminen, on ollut spekulaatioiden aiheena vuosikymmenien ajan elokuvissa ja kirjoissa. Tällä hetkellä olemme kuitenkin kaukana AGI:n saavuttamisesta. Nykyiset tekoälyjärjestelmät ovat erikoistuneita ja kapea-alaisia. Tekoälyn kykyjen laajentaminen yleiskäyttöisemmiksi on osoittautunut haastavaksi yritykseksi, vaikka monet yritykset pyrkivät siihen julkisesti ja aktiivisesti. Tekoälyjärjestelmistä puuttuu maalaisjärki, elämänkokemus, sosiaaliset suhteet ja kyky nähdä kokonaisuuksia. Ne saattavat olla erinomaisia tietyissä tehtävissä ja yksityiskohdissa, mutta niiden on vaikea ymmärtää, mikä tehtävä kannattaa tehdä, miten reagoida, kun tehtävä epäonnistuu, tai mitä tehdä, kun olosuhteet muuttuvat.
Tarkkana kuin porkkana
Suomessa, kuten monissa muissakaan maissa, ei tällä hetkellä ole erityistä lakia tekoälyn käytöstä. Euroopan unioni on kuitenkin antanut suuntaviivoja, ja lainsäädännön toivotaan kirivän teknologisen kehityksen lähivuosina. Tulevassa EU:n lainsäädännössä, joka todennäköisesti pannaan täytäntöön vuonna 2024, tekoälysovellukset luokitellaan niiden riskitasojen perusteella. Riskit, joita ei voida hyväksyä ja jotka vaikuttavat erityisesti kriittisiin yhteiskunnallisiin toimintoihin, voivat johtaa suoranaisiin kieltoihin. Korkean riskin sovelluksiin sovelletaan sääntelyä, kun taas rajoitettuihin, matalan riskin sovelluksiin ei todennäköisesti sovelleta sääntelyä vaan suosituksia. Luovan sisällön tuottaminen kuulunee tähän matalan riskin ryhmään.
Tällä hetkellä suositellaan että tekoälyn avulla tuotettu sisältö merkitään selkeästi. Liitä kuvageneraatioosi tieto käytetystä tekoälytyökalusta. Ennen kuin käytät tekoälysovelluksia työssäsi, varmista tuotantoyhtiön käytännöt tietosuojan osalta. Jos johdat yritystä, tee selkeät ohjeet epäselvien tilanteisen varalle; oleta että kaikki käyttävät keinoälyä.
Tekoälytyökalujen kokeilemiseen liittyy riskejä, kuten epätarkkuuksia, virheitä ja mahdollisia vääristymiä. Tietoturva on ensiarvoisen tärkeää, etenkin kun käsitellään henkilötietoja tai arkaluonteisia yritystietoja. Lue aina tietosuojaselosteet huolellisesti ja ole varovainen, kun käsittelet julkaisematonta alkuperäistä kuvamateriaalia. On mahdollista että lataamalla oman kuvasi järjestelmään menetät sen tekijänoikeuden. Keinoälyn generoimiin kuviin tällä hetkellä kenelläkään ei ole tekijänoikeutta. Huomioi siis että kuka vaan muukin saa käyttää sinun tekemiä kuviasi.
Lainsäädäntö on vasta saavuttamassa tekoälyn kehityksen, joten on erittäin tärkeää pysyä ajan tasalla ja pyytää asiantuntija-apua ennen keinoälyn laajamittaista käyttöönottoa. Microsoftin, Googlen, Shutterstockin ja Adoben kaltaiset yritykset ovat luvanneet suojella maksavia asiakkaitaan mahdollisissa oikeusriidoissa.
On siis tärkeää olla tarkkana kun porkkana. Viisasta ei kuitenkaan ole jättää kokeilematta. Työkaluihin ja sovelluksiin voi tutustua leikkimällä jollain triviaalilla. Leikkiminen tekee hyvää muutenkin. Eli tekoälyä kokeilevien kannattaa aloittaa ei-kriittisillä tiedoilla. Kun löydät työkalun, joka sopii ammatillisiin tarpeisiisi, investoi lisenssiin ja varmista, että kaikki yksityisyyden suojaan ja tietosuojaan liittyvät kysymykset on otettu huomioon. Muista, että kun käytät ilmaista työkalua, olet itse tuote.
Aloitimme lainauksella suurelta tiedemieheltä, joten voimme yhtä hyvin lopettaa siihen. “Evoluution suuressa kudelmassa yhteistyö ja sosiaaliset siteet ovat olleet yhtä tärkeitä lajien selviytymiselle ja kukoistukselle kuin kilpailu. Ihmiskunnan matkaa ei ole leimannut pelkästään yksilöllinen voima, vaan kykymme tehdä yhteistyötä ja oppia toisiltamme.” Nämä Charles Darwinin sanat muistuttavat meitä siitä, että pienenä maana voimme löytää kilpailuetua yhteistyöstä ja saavuttaa paremman aseman maailmanmarkkinoilla.