07. toukokuuta 2004
Teksti:

Onhan noita logeja: biologi tutkii elämää, geologi kiviä, seminologi keinosiemennystä. Mutta yksi on ylitse muiden, nimittäin ontologi. Ontologi tutkii sitä, mitä on. Siis kaikkea.
    Tämä laajahko tutkimuskohde on ollut tapana jättää filosofien huoleksi, mutta nyt Helsingin yliopiston tietojenkäsittelytieteen laitoksen propellipäät ovat tökänneet lusikkansa kaikkeuden sakeaan soppaan.
    Professori Eero Hyvösen johtaman ja Tekesin eli Teknologian kehittämiskeskuksen sekä 12 yrityksen, museon ja muun organisaation rahoittaman Suomalaisen semanttisen webin ontologiat -hankkeen kunnianhimoinen tavoite on ”kansallisen ontologiajärjestelmän kehittäminen”.
    Aikooko Hyvösen ryhmä siis tyhjentävästi selvittää, mitä Suomessa on ja mitä ei ole?
    Ei nyt ihan, mutta sinne päin: Hyvösen ryhmän visiona on Suomi, jossa kaikki sähköisessä muodossa oleva tieto – museoiden, kirjastojen, arkistojen, hallinnon, julkisten palvelujen, yritysten ja jopa yksityishenkilöiden tietokannat ja verkkosisällöt – saadaan yhteismitalliseen muotoon, mikä mahdollistaa aivan uudenlaisen ”älykkään” internetin, semanttisen webin, syntymisen.
    ”Perinteisissä tietokannoissa ja webissä tietoa etsitään hakusanojen avulla. Semanttisessa webissä haku perustuu hakusanojen takana oleviin käsitteisiin ja näiden käsitteiden välisiin suhteisiin eli ontologioihin”, Hyvönen aloittaa.
    ”Ontologiat mahdollistavat myös sivujen automaattisen linkittämisen toisiinsa niiden sisällön perusteella sekä semanttisen surffailun.”

Semanttinen web toisin sanoen hahmottaa maailmaa samalla lailla kuin ihminenkin: käsitteiden ja niistä syntyvien assosiaatioiden avulla.
    Jos tulevaisuuden webbisurffaaja esimerkiksi törmää Ateneumin taidemuseon sivuilla Kullervon sotaanlähtö -freskoon, jossa huono-onninen Kullervo hummallaan ratsastaen töräyttelee luutorveaan, surffaajalle tarjotaan seinämaalauksen taustatietojen – kuten, että fresko on Vanhan ylioppilastalon Musiikkisalissa – lisäksi linkkejä esimerkiksi Kansalliskirjaston Kullervo-aiheisiin runoihin, luonnonhistoriallisessa museossa esiteltäviin hevosiin, sotahistoriaa käsitteleviin sivustoihin, aikakaudelle tyypillisiä sotatorvia sisältäviin museokokoelmiin tai insesti-tabua käsitteleviin tutkielmiin.
    Kansallista ontologiajärjestelmää lähdetäänkin rakentamaan museosta. Hyvösen ryhmä on rakentanut ”älykkään” MuseoSuomi-sivuston, joka avattiin yleisölle maaliskuun alussa.
    Esillä on aluksi esineistöä Kansallismuseon sekä Espoon ja Lahden kaupunginmuseoiden kokoelmista. Myöhemmin verkon on tarkoitus kattaa yhä useampia Suomen museoita ja lopulta myös muut kansalliset muistiorganisaatiot, kuten arkistot ja kirjastot.

Samanlaisen tiedonhaun tekeminen esimerkiksi Google-hakukoneella on mahdollista, mutta paljon vaivalloisempaa. Jos Googlen hakukenttään kirjoittaa pelkästään sanan ”Kullervo”, vempain heittää käyttäjän urheiluseura Joutsenon Kullervon suunnistusjaoston sivuille. ”Oikean” tiedon kaivamiseen saattaa tuhrautua tunteja, eikä lopputuloksesta voi sittenkään olla varma.
    ”Perinteisessä webbihaussa tulee nykyään valtava määrä väärää tietoa. Museoiden fyysisissä kokoelmissa taas on niin paljon esineitä, että ne jäävät henkilökunnaltakin helposti piiloon. Semanttinen web mahdollistaa informaatiotulvan hallitsemisen, oikean tiedon löytämisen”, uskoo MuseoSuomi-hankkeen tutkimushenkilöstön jäsen, opiskelija Mirva Salminen.
    Kun kansallinen ontologia – ja kansallisen tiedon yhdistävä supertietokanta – joskus valmistuu, voidaan ryhmän jäsenten mukaan puhua kirjapainotaitoon verrattavasta mullistuksesta.
    ”Tavoitteenamme on laajentaa ja parantaa kansakunnan muistia. Ennen kirjat, teokset ja dokumentit toimivat ihmisten yksittäisinä lisämuisteina, mutta uusien nyt kehitettävien menetelmien avulla voidaan ottaa käyttöön myös niiden välinen monimutkainen suhdeverkko. Näin pääsemme aloittamaan kattavan ja yhtenäisen kansakunnan lisämuistin rakentamisen”, ontologiahankkeen johtoryhmän varajäsen ja tutkija, opiskelija Tomi Kauppinen sanoo.
    ”Kullervon” tai ”sotatorven” kaltaisten konkreettisten hakusanojen ympärille on luontevaa ryhtyä ohjelmoimaan semanttista, merkityksiä yhdistelevä verkostoa. Hyvösen aivotrustin suuri jatkohaaste onkin käydä rakentelemaan abstraktien käsitteiden, kuten tunteiden – tai elämänviisauden – ontologiaa. Koneet kun ovat kovin kehnoja puntaroimaan sellaisia asioita kuin ”mielihyvä”, ”inho” tai ”onnellisuus”.
    ”Periaatteessa voimme rakentaa järjestelmän, joka suosittelee lukijalle vaikkapa kirjoja kyselemällä tämän mieltymyksiä. Ongelmana ovat mieltymysten väliset mutkikkaat semanttiset riippuvuudet, jotka esimerkiksi vaikeuttavat suositusten asettamista tärkeysjärjestykseen. Yksikin muuttujan arvon muutos voi saada koko homman vinksahtamaan päälaelleen. Sille, jota kiinnostaa tekoäly, pitää suositella ammattikirjallisuuden ohella scifiä, mutta vain sillä edellytyksellä, ettei hän ilmoita vihaavansa fantasiaa”, Hyvönen hymähtelee.

Henrikki Timgren
Kuvitus Kirmo Kivelä

http://museosuomi.cs.helsinki.fi/