Vain älyä vailla

Tekoälyvallankumous saattaa olla lopussa, ei alussa.

T:Teksti:

Tekoälyn kehitys on ihmiskunnalle suurempi uhka kuin ilmastonmuutos, koska vain ensimmäinen voi johtaa ihmisten sukupuuttoon. Supertekoäly voi pitää meitä turhina, niin kuin me olemme pitäneet niin monia sukupuuttoon jo tuhoamiamme lajeja.

Ei, supertekoälyn syntyminen, niin sanottu singulariteetti, on ihmiskunnan toivoista suurin. Sen avulla voimme matkata tähtiin, tietoisuutemme koneisiin ladattuina.

Ensimmäistä näkökantaa edustaa muun muassa toimittaja-tietokirjailija Pekka Vahvanen. Jälkimmäisen kannalla on esimerkiksi yrittäjä-futurologi Ray Kurzweil.

Kumpikin ärsyttää minua. Pidän laadukkaasta scifistä, en hähmäisistä uhkakuvista enkä hypestä, sillä ne ovat useimmiten huonoa scifiä vailla todellisuuspohjaa.

Ne kuitenkin riivaavat julkista tekoälykeskustelua. Siksi lähes jokainen tekoälystä kertova juttu on enemmän tai vähemmän väärässä, sanoo tekoälytutkija, professori Jussi Rintanen Aalto-yliopistosta.

”Artikkelista toiseen toistetaan samat väärinkäsitykset ja harhaanjohtavat asiat, eikä niitä oikeastaan koskaan selitetä kellekään. Minulla nousee hiukset pystyyn melkein joka kerta, kun luen tekoälystä jostain lehdestä.”

Osin ongelma on ollut tekoälytutkijoissa, jotka ovat lähteneet hypeen mukaan ja puhuneet asioista tavoilla, ”jotka voi ymmärtää ihan totaalisesti väärin”, Rintanen sanoo.

Rintasen mielestä tieteen ja tekniikan eturintamassa olevien asioiden raportoinnissa terve lähtökohta olisi, ettei sellaisista asioista kannata paljon puhua, joita ei tällä hetkellä ole olemassa. Spekulatiivisuus on ollut teko-älykeskustelun ongelma 1960-luvulta asti.

”Tekoäly ratkaisee tietysti kaikki ongelmat, mutta ei nyt ihan vielä, vaan vasta muutaman vuoden kuluttua”, Rintanen summaa vuosikymmeniä jatkuneen spekulatiivisen hypen.

Jätetään scifi Leena Krohnille, Alex Garlandille ja muille sen osaaville. Mitä tekoälyn tutkimuksessa tapahtuu todella?

Viime vuosina on puhuttu loputtomiin hermoverkoista ja syväoppimisesta. Niiden ansiosta kännykät tunnistavat suomea ja monia muita kieliä vähintään kelvollisesti, muuttavat sanelun valmiiksi tekstiksi ilman jatkuvia virheitä. Kymmenessä vuodessa kehitys on ollut valtavaa.

Hermoverkot ovat vieneet myös kuvantunnistuksen uudelle tasolle. Hermoverkkoja hyödyntävät ohjelmat tunnistavat esimerkiksi kissakuvat koirakuvista suhteellisen luotettavasti.

Ne tunnistavat kuitenkin vain kuvia, eivät kissoja ja koiria. Samoin puheentunnistus on vain signaalin tulkintaa, se ei ymmärrä sanojen merkityksistä mitään.

Suuria läpimurtoja ei ole tehty 30 vuoteen.

René Magritte, Kuvien petollisuus. John Searle, Kiinalaisen huoneen argumentti. Syntaksista ei voi johtaa semantiikkaa.

Vielä muutama vuosi sitten suosittu tarina kuitenkin oli, että syväoppimisessa hermoverkko ymmärtää abstrakteja käsitteitä, Rintanen selittää.

”Syväoppiminen ei lopulta tarkoita mitään muuta kuin sitä, että hermoverkossa on useita kerroksia.”

Vanhanaikaisissa hermoverkoissa oli vain pari kerrosta. Niitä ei voinut kutsua syviksi. Viime vuosien edistysaskeleet on saavutettu hermoverkoilla, joissa on kymmeniä kerroksia.

Idea on melko yksinkertainen: hermoverkon alin kerros vastaa kuvassa olevia pikseleitä. Sieltä jokainen pikseli yhdistyy laatijan haluamalla tavalla seuraavan kerroksen solmuihin, nuo solmut sitä seuraavan kerroksen solmuihin ja niin edelleen, kunnes päästään ylimmälle tasolle, jossa on lopulta enää yksi solmu. Jos hermoverkon on haluttu ”näkevän” koirakuvan ja sille on myös syötetty koirakuva, loppusolmussa pitäisi olla joko luku yksi tai jokin lukuarvo hyvin lähellä sitä. Jos sille taas on syötetty jokin muu kuin koirakuva, tuloksen pitäisi olla jotakuinkin luku nolla.

Kun hermoverkolle syötetään miljoona erilaista koirakuvaa, se opetetaan tunnistamaan koirakuvat muista kuvista. Opettamisprosessi on Rintasen sanoin sokea.

”Tuo prosessi ei tiedä koirista ja muista asioista yhtään mitään. Se tuijottaa vain kuvapisteitä, mikä väri ja mikä tummuus, ja kuinka vahva on uskomus, että kyseessä on koirakuva.”

Kysymys jokaisen koirakuvan kohdalla on, miten eri solmujen painoarvoja muutetaan niin, että hermoverkon ulostulo on yksi muuttamatta painoarvoja kuitenkaan liikaa. Tämä toistetaan miljoona kertaa.

Siinä koko juttu. Ja se vain SATTUU TOIMIMAAN. Kukaan ei tarkkaan tiedä, miksi.

Alun perin luultiin, että hermoverkolla olisi ymmärrys abstrakteista käsitteistä, koska ne matkivat alkeellisesti ihmisaivojen toimintaa.

”Ajatus oli, että aivan ylimmillä tasoilla on esimerkiksi kissan ja koiran käsite jotenkin automaattisesti. Kukaan ei tiedä miten, mutta täysin maagisesti siellä on kissan ja koiran käsite opittu näyttämällä miljoona kuvaa.”

Rintanen myöntää vielä muutama vuosi sitten itsekin ajatelleensa, että ehkä hermoverkon ylätasoilla todella on ymmärrys esimerkiksi koiran käsitteestä.

”Niin kauan kuin emme ole nähneet itseajavaa autoa, joka toimii kaikissa tilanteissa, sitä autoa ei ole.” – Jussi Rintanen

Nyt tuo uskomus on kuitenkin murskattu. Tutkijat ovat huomanneet, että kymmenientuhansien pikseleiden joukosta ei tarvitse muuttaa kuin muutama pikseli sieltä täältä, ja yhtäkkiä hermoverkon hetki sitten satavarmaksi luulema koirakuva onkin sen mielestä varmasti autokuva.

Prosessilla ja algoritmeilla ei siis ole mitään tekemistä ihmisen tai muiden nisäkkäiden näkökyvyn kanssa. Rintanen antaa esimerkiksi rajatapauksen: jos kuvankäsittelyohjelmassa koirakuvista korvattaisiin koiran turkki kissan turkilla, niin luulisiko hermoverkko sitä kissa- vai koirakuvaksi?

”Sitä on täysin mahdotonta sanoa etukäteen.”

Hermoverkkoa pitäisi erikseen opettaa, että nyt on tuotettu koiran kuvia, joissa koirilla on kissan turkki, mutta ne ovat silti koiria.

”Algoritmi ei pysty itse millään keksimään sitä oppimista.”

Tämä kaikki on silti hermoverkkojen ja tekoälyn menestystarinaa: hermoverkot voidaan opettaa tunnistamaan ja luokittelemaan automaattisesti asioita. Ne ovat aivan riittävän hyviä, kun puheentunnistuksen ei tarvitse mennä jokaisen sanan kohdalla oikein tai kun Googlen kuvahaussa 20 koirasta yksi onkin kissa.

Ongelma on kuitenkin, että kun hermoverkko/tekoäly/tietokone osaa erotella kissakuvia koirakuvista, sen luullaan helposti pystyvän tekemään vaikka mitä muuta, kuten sanomaan, että tunnistetussa koirakuvassa koira juoksee nurmikolla. Ei pysty.

”Kaikki mahdolliset kuvassa olevat eri asiat pitäisi jokaikinen erikseen opettaa, ja tämä muuttuu nopeasti mahdottomaksi.”

Opetettavia käsitteitä (tai käsitteiden ilmentymiä, sillä käsitteistä sinänsä hermoverkot eivät siis ymmärrä mitään) ja niiden yhdistelmiä on liian paljon. Miljardeja tarvittavia kuvia ei ehkä ole edes olemassa, ja ennen hermoverkkojen opettamista ihmisten pitäisi luokitella jokainen kuva.

Tietokoneiden laskentatehon ja muistikapasiteetin kasvu mahdollisti ”silmittömän suuret” hermoverkot ja viimeisen 10–20 vuoden huiman kehityksen. Tietokoneiden nopeus ja muisti eivät enää ole pullonkaula, vaan ongelmat ovat perustavampaa laatua: mitä tehdä, kun laskentatehon puolesta hermoverkon kokoa voisi hyvin kasvattaa, mutta mitään iloa siitä ei enää ole?

Eli:

1) hermoverkoille opetettavien asioiden määrä on niin suuri, ettei pidemmälle ehkä päästä,

2) hermoverkot ovat jo nyt niin isoja, ettei pidemmälle ehkä päästä,

3) emme tiedä, mitä hermoverkot tarkkaan ottaen tekevät ja miten avoimet ongelmat edes voitaisiin ratkaista.

Tilanne on sama kuin insinööritaidossa ennen fysiikkaa, havainnollisti Toronton yliopiston apulaisprofessori David Duvenaud MIT:n Technology Review’n jutussa puolitoista vuotta sitten. Jotkut rakentavat sillan ja saavat sen juuri ja juuri pysymään pystyssä. Toiset saavat sillan pysymään pystyssä lisäämällä siihen pilarit. Vähän myöhemmin keksitään, että kaarisillat ne vasta kovia ovatkin. Taustalta kuitenkin puuttuu ymmärrys, miksi kaaret toimivat niin hyvin.

”Jotta nykytasolta päästäisiin eteenpäin, täytyisi keksiä jotain uutta”, Rintanen sanoo.

Suuria läpimurtoja ei ole kuitenkaan tehty 30 vuoteen. Syväoppimisessa olennainen backpropagation-algoritmi nykymuodossaan on vuodelta 1986. Konvoluutiohermoverkot ovat myös 1980-luvulta. Tekoälytutkimukseen on pantu valtavat määrät rahaa ja resursseja, mutta suhteessa panostusten määrään menestystarinoita on ”yllättävän vähän”.

Rintasen mukaan avoimet ongelmat pätevät melkein jokaiseen tekoälyllä brändättyyn alueeseen. Esimerkiksi todella itseajavat autot ovat edelleen kaukana massatuotannosta.

”Niin kauan kuin emme ole nähneet itseajavaa autoa, joka toimii kaikissa tilanteissa, sitä autoa ei ole.”

Ennen kuin hermoverkkojen ja syväoppimisen taustalla oleva ”fysiikka” keksitään, jos keksitään, olemme pikemminkin hypetetyn tekoälyvallankumouksen lopussa, emme sen alussa.

Tekoälystä puuttuu edelleen äly. Samoin äly puuttuu niin älypuhelimista kuin älytelevisioista – oikeastaan se puuttuu kaikesta, mitä sen nimissä markkinoidaan. Esimerkiksi Android-puhelinten kohdalla äly on pikemminkin lupaus siitä, että laitteet tallentavat suurimman osan tekemisistäsi ja ovat osa Alphabetin eli Googlen valvontataloutta.

Tekoälyn sijaan olisi parempi puhua kehittyneestä atk:sta eli automaattisesta tietojenkäsittelystä. Tekoälyn mainitseminen saa ihmiset (ja toimittajat) hämilleen ja luulemaan sovelluksista liikoja.

Kyllä, edistyneillä ohjelmistoteknologioilla (”tekoäly”) ratkaistaan vähitellen yhä uusia sellaisia ongelmia, joihin pystyi aiemmin vain ihminen. Ne eivät kuitenkaan jäljittele ihmisten ajattelua eivätkä muodosta minkäänlaista uhkaa muille kuin vanhoille työpaikoille. Luova tuho.

IBM:n Watson-tekoäly voitti Jeopardy-visailun. Pian sen johdannaisen piti tehdä lääkärin töitä paremmin kuin lääkäreiden.

Ei tee. Se auttaa skannerien tuottamien kuvien tunnistusongelmissa. Lääkäri voi tällöin keskittyä johonkin tähdellisempään. Siinä kaikki.

Huoli pois, Pekka Vahvanen. Ihmiset ehtivät todennäköisesti tuhota planeetan hallitsemattomaksi riistäytyneellä ilmastonmuutoksella kauan ennen kuin tekoälystä voisi edes kehittyä uhka.