Hyvän kuvan sanotaan olevan
tehokkaampi kuin tuhat sanaa. Entä miten on, jos niitä sanoja on miljoonia?
Vastaavatko ne tuhansia kuvia vai meneekö suurin osa kuitenkin hukkaan? Big
data on käsitteenä nousemassa hype-vaiheeseen, mutta monelle se on vielä vähän
outo. Ronskisti pelkistettynä taustalla on ilmiö, jossa kaikenlaista tietoa on
saatavilla enemmän tai vähemmän vapaasti joko itse keräämällä tai valmiina
paketteina niin paljon, etteivät perinteiset keinot riitä kaiken sen
käsittelyyn. Yksittäisillä murusilla ei välttämättä ole arvoa, mutta kymmeniä,
satoja tai miljoonia muruja yhdistämällä saadaankin aivan uudenlainen kuva
asiasta tai henkilöstä. Ongelma on kääntynyt tiedon etsimisestä sen
jalostamiseen.
Maailmalta on alkanutkin kantautumaan uutisia, joissa
valitellaan data-analyytikkojen liian vähäistä määrää. Jo tällä hetkellä
kysyntää osaamiselle on paljon ja tilanne on muuttumassa vakavaksi
osaamispulaksi. Samaan aikaan, kun yrityksissä suunnitellaan kiivaasti business
intelligence tai big data projekteja, ei yleinen tietämys tai kokonaisuuksien
hallinta ole pysynyt perässä. Jos vain sokkona lähdetään louhimaan
tietomassoja, ei siitä välttämättä jalostu timanttia kovankaan paineen alla.
Käännetäänpä katse hetkeksi toisaalle. Yritysten yksityisten tietovarastojen lisäksi world wide web ja erityisesti sosiaalisen median sovellukset ovat tämän hetken data-aarreaitta. Tietoverkkojen syöverissä, käyttäjälle näkymättömissä oman internetselaimen ja sisältöpalvelimen välinen viestintä käydään koneiden ymmärtämällä tavalla. Tämän protokollan määrityksessä on pari mielenkiintoista komentoa: PUT ja DELETE, joiden merkitykset ovat englantia ymmärtäville kovin intuitiivisia: kuka tahansa pystyisi poistamaan sisältöä tai vaikka tallentamaan oman versionsa olemassa olevan www-sivun päälle. Joskus "muinoin", kun www oli vain rajatun insinöörijoukon työväline, olivat nämä komennot ihan oleellisia työvälineitä. Käytön levitessä ne oli kuitenkin oletuksena syytä ottaa pois käytöstä, sillä kaikki verkossa liikkuvat eivät ole ajamassa pelkästään yhteistä etua.
Edellinen esimerkki antaa luvan muodostaa aasinsillan
verkkorikollisuuteen. Jos yhä suurempi osa tiedosta tullaan tallentamaan ja
käsittelemään digitaalisesti tietoverkkoympäristöissä, kasvaa näiden
väärinkäytön riski samassa suhteessa. Tietoturvasta puhutaan paljon, mutta
kuinka voidaan suojautua, jos ei tiedetä miltä tai ketä vastaan pitäisi
suojautua. Taitojaan kokeilevat nuorukaiset, jonkin aatteen ajamat aktivistit
tai omaa etuaan tavoittelevat rikolliset sekä teollisuusvakoilijat etsivät
jatkuvasti haavoittuvuuksia julkisista verkkojärjestelmistä. Ja keinoja on
paljon.
Meillä on siis käsissämme paradoksin ainekset: verkkoihin
pitäisi mennä, sieltä pitäisi kerätä dataa, dataa pitäisi ymmärtää ja sitä
pitäisi osata suojata tuntematonta vihollista vastaan. Jos edellisestä listasta
otetaan yksittäisiä tekijöitä, on niihin löydettävissä helppoja ratkaisuja,
mutta kokonaisuutena käsittely on haastavaa ja pitää sisällään voimakkaan
strategisen ulottuvuuden.
Informaatioteknologia ja tiedon hyväksikäyttö
mahdollistavat paljon, mutta niitä pitää käyttää systemaattisesti ja käyttöä
tulee myös johtaa ja seurata tai muuten järjestelmät kääntyvät itseämme
vastaan.
jani.kurhinen(at)jyu.fi