Suomalaiskirjailijoidenkin teoksia on käytetty tekoälyn ”opettamiseen”. Kirjoitin aikaisemmin, kuinka joukko amerikkalaisia kirjailijoita, mukaan lukien John Grisham ja George R.R. Martin, on haastanut tekoälyfirma OpenAI:n oikeuteen tekijänoikeusloukkauksista. Nyt mm. Suomen kuvalehti kirjoittaa, että myös suomalaiskirjailijoiden teoksia käytetty luvatta tekoälyn opettamiseen. Esimerkiksi Meta-someyhtiön tekoälylle on syötetty ”Book3”-niminen paketti, joka sisältää myös suomalaiskirjailijoiden tekstejä, jotka on piratisoitu, eli niistä ei ole maksettu tekijöillleen tekijänoikeuskorvauksia eikä ilmeisesti edes kuluttajahintaa. Jutussa mainitaan mm. Mika Waltari, Kjell Westö, Tove Jansson, Riikka Pulkkinen, Johanna Sinisalo, Sofi Oksanen, Väinö Linna, Arto Paasilinna, Kari Hotakainen, Hannu Rajaniemi, Anna-Leena Härkönen, Matti Yrjänä Joensuu, Selja Ahava, Emmi Itäranta, Antti Tuomainen, Antti Leikas ja Tuomas Kyrö.
Alkuperäisen The Atlanticin jutun mukaan ”Book3” sisältää 183 000 teosta. Tätä lukua voi tietysti hämmästellä moneltakin kantilta: onhan se huikaiseva määrä, jos ajattelee minkä tietomäärän tekoäly voi niellä. Toisaalta voi myös ajatella, että jos kaikkien teoksia käytöstä maksettaisiin, loppuisivat rahat jopa Metan kokoisilta firmoilta. Toinen vaihtoehto olisi käyttää teoksia, joiden tekijänoikeudet ovat rauenneet, eli yli 70 vuotta sitten kuolleiden kirjailijoiden teoksia. Tämä rajoittaisi kielimallin kehitystä ratkaisevasti. (Puhuisiko botti silloin viime vuosisadan alun arkaaiseen tyyliin? Tämmöiset ovat konstillisen älyn neuvot, jommoisista olkaatten huvitetut?)
Tästä huolimatta olen sitä mieltä, että jokin korvausmalli pitää olla olemassa heille, jotka varsinaisen luovan työn tekevät. Nyt julkaistu uusi Kirjailijaliiton tutkimus kirjailijoiden tuloista ei lupaa hyvää. Vaikka tekoäly ei korvaisikaan kirjailijoita vielä vähään aikaan, on selvää että uusi teknologia tuo uusia kanoja nokkimaan entisestään vähissä olevia jyväsiä. Samaan aikaan sähkö- ja äänikirjamarkkinat voivat johtaa kirja-alan spotifisaatioon, jossa kirjallisuutta kaupataan minimaaliseen hintaan ja tekijöille jää vain murusia alustayhtiöiden repiessä voitot itselleen.
Edelleen kuvitellaan, että oleellista on pelkkä teknologia, ei sen sisältö.
*
Musiikin puolella Teosto on tehnyt jäsenilleen kyselyn, jossa on kartoitettu musiikin ammattilaisten aseinteita generatiiviseen tekoälyyn liittyen. Kyselyn mukaan noin kolmannes vastaajista on hyödyntänyt tekoälyä omassa työssään. Musiikin luomisprosessissa sitä käyttää 21% vastaajista. Kyselyn yhteenvedon mukaan ”harva vielä käyttää tekoälyä osana musiikin luomisprosessia”, mutta minusta reilu viidennes on jo aika paljon.
Varsinaisesti musiikkipuolella tekoäly ei ole mikään uusi asia. Jo 1960 Turun sovelletun matematiikan laitoksen ohjelmoija Markku Nurminen teki kokeiluja IBM-1130:n ohjelmilla, jotka generoivat tangoja. YLEn jutun mukaan sävellykset oli tuotettu ”syöttämällä tietokoneelle tyypillisten suomalaisten tangojen rakennusaineksia”, eli periaate oli sama kuin uudemmilla generatiivisilla tekoälytyökaluilla.
Huomiota sai myös jo vuonna 2014 professori Lior Shamir, joka analysoi tekoälyllä Beatlesin kappaleita ja loi niiden pohjalta algoritmin, joka asetti ne aikajärjestykseen. Ilmeisesti kuitenkaan visioitu sovellus, joka olisi tuottanut itse uusia Beatles-kappaleita, ei valmistunut.
Olin myös täysin varma jo ennen nykyistä tekoälyhypeä, että isot levyfirmat käyttävät tekoälyohjelmia hittiensä tuottamiseen, mutta asiaa ei kerrottu julkisuuteen. Ehkä nyt se viidennes käyttäjistä uskaltaa ainakin Teoston kyselyissä tunnustaa asian, vaikka tutkimuksesta ei selviäkään miten kauan ja miten laajasti sitä on käytetty.
Kuten tutkimuksessa joku on kommentoinut:
Tekoälyä on käytetty jo pitkään varsinkin teknisessä tuottamisessa eikä se tunnu ketään häiritsevän
sekä
Listamusiikki on jo nyt monin paikoin hyvin laskelmoitua ja ”hittikaavalla” tuotettua, joten sen voi aivan hyvin ulkoistaa koneellisesti.
Niinpä, aika vähän luovuutta pop-musiikissa tunnutaan tarvitsevan, oli prosessissa tekoäly mukana tai ei.
Generointia helpottaa, että musiikki on hyvin pitkälle teoretisoitu: se perustuu sävellajeihin, intervalleihin, sointuihin, sointuprogressioihin ja tahtilajeihin jne. siten, että periaatteessa mikä tahansa sävellys on purettavissa osiinsa. Musiikin perusteorian ulkopuolelle jäävät mm. äänenväri, eli soundi, ja muu esitystekniset nyanssit, mutta sekään ei varmasti ole kehittyneemmille tekoälytyökaluille enää mikään ohjelma kopioida tiettyjen esiintyjien tyyliä ja soundia.
Joku voisi sanoa, että kirjallisuuskin perustuu kieleen ja kielillä on oma kielioppinsa samalla tavalla kuin musiikin teoria on ”musiikin kielioppi”, mutta tekisin tässä sen semanttisen eron, että kieli viittaa johonkin itsensä ulkopuoliseen, kun taas musiikin merkitys on siinä itsessään. Melodia ei viittaa mihinkään referenttiin samalla tavalla kuin kielen lause (mukaan lukien fiktiiviset lauseet). Tähän ei kannata mennä sen syvemmälle, muuten kuin huomauttamalla, että tekoälyn on helpompi generoida melodioita kuin lauseita, koska edellisten ei tarvitse perustua ulkoisen maailman vastaavuuksille.
*
Tappaako tekoäly sitten kaiken kulttuurin, taiteen ja luovuuden? Kun syntetisaattorit yleistyivät musiikissa 1970-luvulla, panikoitiin samaan tapaan, että nyt tekniikka korvaa oikeat soittajat (tämä kerrotaan mmm. tällä hetkellä yöpöydällä nurin niskoin olevassa kirjassa Mikko Mattlar: Synteettinen Suomi, 2019).
Nyt 50 vuotta myöhemmin syntetisaatori voi olla yleisempi soitin pop-musiikissa kuin kitara, mutta ihminen sitä soittaa silti. Tekoäly voi tulla mukaan prosessiin, mutta se tuskin poistaa ihmistä siitä välistä. Ylipäätään 1970-luvulla yleistynyt teknologia, josta synteettiset soittimet olivat vain osa, synnyttivät musiikkiteollisuuden, joka tarjosi muusikoille töitä aivan uudella tavalla verrattuna 1950-lukua edeltävään gramofoni/tanssilava/pelimanni -kulttuuriin. Vielä eivät ole tietokoneohjelmat korvanneet sinfoniaorkestereita, joskin klassiseen musiikkiin pätevät eri lainalaisuudet kuin populaarimusiikkiin.
Samalla tavalla kirjallisuudessa kirjoittajien (ja julkaistujen nimikkeiden) määrä on jatkuvassa nousussa siitä huolimatta, että ihmiset lukevat vähemmän. Uusi digitaaliteknologia mahdollistaa pienten tarvepainatusten edullisen tulostamisen. Mihin siinä kuviossa tekoälyn kirjoittamia kirjoja edes tarvitaan?
Uskon, että vielä on ihmisiä, jotka haluavat tehdä musiikkia ja kuunnella ihmisten tekemää musiikkia ja niitä, jotka haluavat kertoa oman tarinansa ja niitä, jotka haluvat sen lukea. Se voi olla hupeneva määrä ihmisiä ja joillekin voi kelvata kuunneltavaksi vaikka puhelinvaihteen jonotusmusiikki, mutta niin on ollut jo ennen generatiivista tekoälyä eikä siinä ole mitään uutta.
Suomen kokoisella kielialueella olisi kuitenkin hyvä olla kulttuurillle jokin muu rahoitusmalli kuin sama, jolla myydään burgereita. Jos musiikkia ja kirjallisuutta aletaan halpuuttaa, tulee tekijöiden toimeentulo turvata apurahoilla.
LISÄYS
Särö-lehden jutussa Toivonen ja Kirjailijaliiton puheenjohtaja Ville Hytönen keskustelevat aiheesta.