Nollat ja ykköset muistavat käyttäjän

31.01.2017 - 18:22 Anni Huttunen, kuva: Onni Ojala

Hakukoneiden tulosten järjestystä hallinnoidaan algoritmeilla. Utain testasi miten nopeasti hakukone oppii tunnistamaan käyttäjän profiilin.

Vanha viisaus kuuluu, että tieto on valtaa. Jos tämä on totta, sen kahvassa ovat tällä hetkellä valtavat, monikansalliset yritykset kuten Google. Muutaman muun jätin kanssa yritys hallitsee leijonanosaa koko maailman tietoliikenteestä.

Google on ensisijainen tiedonhaun lähde lukemattomille ihmisille. Hakukone toimii porttina ihmisten ja tiedon välillä. Periaatteet, joiden mukaan tieto löytyy tai on löytymättä, ovat tärkeitä valtaisan käyttäjämäärän takia. Näitä periaatteita hallitsevat algoritmit.

Tampereen yliopiston viestintätieteiden tiedekunnan yliopistotutkija Heikki Keskustalo ja yliopistolehtori Paavo Arvola vääntävät rautalangasta, mitä mystisillä algoritmeilla tarkoitetaan.

– Algoritmi on peräkkäisrakennetta, valintaa ja toistoa, eli kaavamaista menettelytapaa, Keskustalo selittää.

Arvola kuvailee algoritmin toimivan kuin ruuanlaitto-ohje. Siinä kuvaillaan mitä pitää tehdä ja millä tavalla halutun lopputuloksen saamiseksi. Mitä pidemmälle teknologia kehittyy, sitä monimutkaisempia algoritmeja koneille voi opettaa. Samalla niiden olemassaolosta tulee entistä huomaamattomampaa.

Essi testasi oppiiko kone tuntemaan

Tietokoneen kyky muodostaa profiili sen käyttäjästä perustuu esimerkiksi IP-osoitteeseen ja evästeisiin. Näiden lisäksi selaimen käyttö Gmail-tiliin kirjautuneena antaa Googlelle luvan pitää kirjaa kaikista hauista ja vierailluista sivuista.

Loin Essi Testi -nimisen profiilin 48 tunnin ajaksi testatakseni algoritmien toimintaa käytännössä. Essi aloitti raivokkaan fitness-aiheisten sivujen ja nopeiden laihdutuskeinojen etsimisen Googlesta. Facebookissa Essi liittyi kaikkiin painonpudotusryhmiin, joita löysi, ja tykkäsi kaikesta kehonrakennukseen liittyvästä.

Testissä huomasin, että algoritmi sopeutuu uuteen käyttäjään nopeasti. Kokeilun ensimmäiset tunnit Facebook ehdotti Essille ryhmiä, jotka sopivat aiempaan selaushistoriaani. Vegaanista ruokavaliota ja kierrätystä koskevat ehdotukset vaihtuivat kuitenkin pian. Mitä useammasta fitness-kropan saavuttamiseen ohjeistavasta ryhmästä Essi tykkäsi, sitä vähemmän algoritmi tarjosi entisen kaltaista sisältöä.

Miksi löydän, mitä löydän?

Yksi ensimmäisistä tunnetuista algoritmeista on Eukleideen algoritmi. Sen avulla ratkaistaan kahden kokonaisluvun suurin yhteinen nimittäjä käyttäen jakoyhtälöä. Tuolloin algoritmeja käytettiin matemaattisten pulmien ratkaisuun, nyt niiden avulla optimoidaan sisältöä kunkin käyttäjän mieltymyksiin sopivaksi.

– Algoritmit ja niiden toimintaperiaatteet ovat liikesalaisuuksia. Todennäköisesti niitä muutetaan ja kehitetään jatkuvasti, Keskustalo kertoo.

Hakukonetulosten näkyvyysjärjestys perustuu Keskustalon mukaan lähes aina muutamaan seikkaan. Käyttäjän profiloinnin lisäksi tuloksiin vaikuttaa esimerkiksi se, onko sivulle linkkejä muilta sivuilta ja löytyykö sivulta hakukoneeseen syötettyjä sanoja. Lisäksi tuloksiin vaikuttavat sivun latautumisnopeus ja soveltuvuus mobiililaitteille.

Palataanpa vielä testiin. Essi kokeili lisätä kaveriksi pari ystävääni. Samassa tarjonta muuttui täysin. Kaikki laihdutukseen ja kehonrakennukseen liittyvät ehdotukset katosivat ja tilalle tuli yliopisto-opiskelijoille suunnattuja ryhmiä sekä bändien sivuja.

Kavereilla oli selvästi valtavan suuri vaikutus siihen, millaisia arvoja algoritmi ajatteli Essin edustavan.

||

Lisää kommentti

Tämän kentän sisältö pidetään yksityisenä eikä sitä näytetä julkisesti.
CAPTCHA
Tämä kysymys esitetään, jotta lomakkeen automatisoitu käyttö voitaisiin estää.
Kuva CAPTCHA
Kirjoita kuvassa näkyvät merkit.