Kirjoitin aikaisemmin Orwellin ”Värssyttimestä”, kojeesta joka mainitaan hänen tunnetuimmassa romaanissaan 1984.
Automaattisesti tuotettua taidetta on ennustettu muissakin scifi-tarinoissa, joista yllättävän kaukonäköinen on vuonna 1953 ilmestynyt Roald Dahlin Suuri automaattinen kielikone (alk. The Great Automatic Grammatizator, suom. Pertti Saarikoski, löytyy kokoelmasta Rakkaani, kyyhkyläiseni, 1961).
Tarinassa insinööri Adolph Knipe rakentaa tietokoneen, ”suuren automaattilaskukoneen” (alk. ”the great automatic computing engine”), mutta saa pian heureka-oivalluksen ja ymmärtää, että myös kieli on joukko matemaattisten kaavojen kaltaisia sääntöjä. Siksi on mahdollista rakentaa kone, joka voisi generoida tekstiä, jos sille vain annettaisiin sanat ja aihe.
Tämä on totta: kielitiede on omistautunut kielen kuvailuun lähes matemaattisten kaavojen avulla. Kirjahyllyni päällä on Iso suomen kielioppi, jossa on 1698 sivua tiukkaa pränttiä suomen kielen säännöistä. Näiden sääntöjen avulla on teoreettisesti mahdollista luoda kaikki kieliopilliset suomen kielen lauseet, jos vain sille antaa tarpeelliset sanat (sanat löytyvät Nykysuomen sanakirjasta, jossa on 4 588 sivua ja 201 000 hakusanaa, oma sarjani taitaa olla taloyhtiön häkkivarastossa). Sen lisäksi tarinoiden rakennetta on analysoitu Aristoteleen päivistä alkaen.
Uudemmissa kielimalleissa, kuten OpenAI:n GPT:ssä kuitenkin on toimittu toisin päin: koska kielioppi on varsin monimutkainen systeemi, sille ei ole opetettu sääntöjä, vaan on annettu tarpeeksi suuri tekstikorpus, josta se on itse muodostanut säännöt, tai pikemminkin laskenut todennäköisyydet miten lause voisi jatkua.
Tietyssä mielessä ihmisetkin oppivat kielen näin: eihän lapsi kieltä omaksuessaan tankkaa Isoa Suomen kielioppia, vaan muodostaa malleja ympäristöstä kuulemansa perusteella. Aikuisetkaan eivät ole tietoisia monista, hyvin monimutkaisistakin säännöistä, mutta eivät silti tee virheitä äidinkielessään. Esimerkiksi, miksi vesi taipuu genetiivissä veden? Kukaan äidinkielinen suomen kielen puhuja ei tee siinä virhettä, vaikka ei osaisikaan sanoa miksi (siinä vaikuttaa ainakin 3 sääntöä: nominin sanavartalon t ~ s -vaihtelu, t:n astevaihtelu, vartalon viimeisen tavun i:n äännevaihtelu… sen lisäksi useimmat suomalaiset ääntäisivät sen veen, koska äännehistoriallisesti siitä on kadonnut spirantti ð ja niin edelleen…)
Dahl ei kerro novellissaan tarkkaan, miten kielikoneen ohjelmointi tapahtuu, mutta kertoo Knipen työhuoneen täyttävistä paperilapuista:
formulae and calculations; lists of words, thousands and thousands of words; the plots of stories, curiously broken up and subdivided; huge extracts from Roget’s Thesaurus; pages filled with the first names of men and women; hundreds of surnames taken from the telephone directory…
Tuhannet sanat kuulostavat vähältä kielimallien ahmimiin korpuksiin verrattuna, mutta tämän perusteella vaikuttaisi, että tarinan konetta koulutetaan sanalistoilla ja osasiinsa analysoiduilla tarinoilla.
Vaikka Knipellä on ainakin omien sanojensa mukaan luomisen palo tarinoiden kirjoittamseen, pian motiivi koneen rakentamiselle kääntyy taloudelliseksi; tosin en ole aivan varma onko tässä kohtaa Dahl ironinen vai tosissaan. Knipe laskee tienaavansa koneella miljoonia, koska lehtiin lähetetyistä novelleista maksetaan niin korkeita summia. Itse en osaa vahvistaa tarinassa mainittuja nurkkanovellien julkaisupalkkioita oikeiksi tai vääriksi.
Pian novellien luomisesta Knipe siirtyy kokonaisten romaanien generoimiseen. Koneen päivitetyssä versiossa ovat painikkeet, jotka antavat mahdollisuuden valita tekstilajin, teeman, kirjallisen tyylin, henkilöhahmot ja niin edelleen. Generatiivisessa tekoälyssä näitä kutsuttaisiin prompteiksi.
Kielikoneen, eli generatiivisen tekoälyn ongelmat tarinassa ovat uskottavia. Lukijat kaikesta huolimatta haluavat lukea ihmisten kirjoittamia tarinoita, joten jonkun täytyy antaa nimensä käytettäväksi julkaisussa. Ensimmäiset ehdokkaat kieltäytyvät raivokkaasti, mutta pian varsinkin luomiskykynseä menettäneet tyhjän paperin kammoiset juoppokirjailijat antavat laittaa nimensä generoituihin teoksiin. Miksi edes vaivautua kirjoittamaan, kun vipua kääntämälläkin saa tekstiä aikaiseksi?
Pian kirjallisuusmarkkinat onkin vallannut kirjallinen hevonpaska, koneen generoima geneerinen höttö, joka vie työt oikeilta kirjailijoilta ja leivän heidän lastensa suista.
Novelli on hämmästyttävän tarkkanäköinen ennustus ottaen huomioon, miten alkeellisia tietokoneet olivat novellin kirjoittamisen aikaan. Toinen luenta tietenkin on, että Dahl halusi teknologian sijasta kuvata satiirisesti aikansa huonoa kirjallista kulttuuria — joka on toki ikuisuuskysymys — ja siinäkin mielessä novelli on hämmästyttävän tarkkanäköinen.
*
Uusimmassa Parnassossa (6-7/2023) Ville-Juhani Sutinen kirjoittaa Stanisław Lemin kokeellisesta scifi-tarinasta Bittikirjallisuuden historia, joka sopii hyvin tämän bloggauksen jatkoksi. Siinä tietokoneelle on annettu tehtäväksi kääntää Dostojevskiä, mutta lepotilassa kone generoi sivutuotteena romaanin, joka on koneen ”kirjoittama”, mutta muistuttaa täydellisesti Dostojevskiä tyyliltään.
Lainaan sellaisenaan tarinasta saman profeetallisen kohdan kuin Sutinen:
He pelkäsivät, että tämän luovan palvelualan käyttö muuttaisi kulttuurin painajaismaiseksi paratiisiksi, jossa kuka tahansa kuluttaja voisi minkä vain päähänpiston pohjalta vastaanottaa mestariteoksia, joiden pikatuotannosta vastaisivat koneelliset demonit muuntumalla erehtymättä Shakespearen, Leonardon tai Dostojevskin hengiksi. Sen seurauksena arvohierarkiamme romahtaisivat, sillä pian rämpisimme mestariteosten keskellä kuin roskassa.
Tarinaa ei ole tietääkseni suomennettu, eikä lainaukseen ole merkitty lähdettä tai kääntäjää, joten oletan Sutisen sen itse kääntäneen englanninkielisestä laitoksesta. Se löytyy mm. Archive.org:n digikirjastosta.
Tarinassa tekoälyä kutsutaan ”koneen uneksi”. Jotain unenomaista generatiivisessa tekoälyssä onkin — se kierrättää ihmisten tuottamaa materiaalia samalla tavalla kuin ihmisen alitajunta ja nostaa siitä esiin kuvia ja kertomuksia. Toisaalta promptien antaminen tekoälylle tuo mieleeni hypnoosin suggestiot: tekoälyn käyttäjä kertoo sille, mistä sen pitää uneksia.