Oblac

Data Fornication

Big data. Small data. Lični podaci. Tajni podaci. Prosečni rezultati. Šareni grafikoni i gladne pita karte. Tabele i redosledi. Mašinsko učenje. Podaci koji prave nove podatke. Meta-podaci. I beskonačan broj fotki mačaka.

Sve(t) vrvi od podataka. No, sada kada imamo sve podatke, da li imamo i sve odgovore?

Walmart i Best Buy, američke kompanije, sigurno imaju najveće baze proizvoda, cena, kupaca i čega sve ne. Sigurno troše novce dostojne omanjeg grada na održavanje i prikupljanje svega toga. No njihova zarada (revenue) ne raste. Zašto?

Idemo dalje: postoji nemali broj istraživanja koja kao rezultat daju samo sumirane podatke: tabele, proseke, grafikone - i tu sve prestaje. Kao da je krajnji grafikon cilj samom sebi. To su one analize gde je srednja vrednost i pitanje i odgovor na sve, počevši od nastanka univerzuma do toga zašto postoji toliko fotki mačaka.

Podaci != Razumevanje

Pozajmiću dva citata:

You can have data without information, but you cannot have information without data.

DKM kaže ovde dve stvari. Izdvojio bih prvi deo: podaci su, sami po sebi, bezvredni. Gomila ničega, mačka u džaku. Podaci ne nose bilo kakvu informaciju. Podaci su samo glupe jedince i nule; izjednačene su fotke mačaka sa rezultatima istraživanja.

Prvi korak u osvešćivanju podataka je stvaranje informacija na osnovu podataka. Da, ovo je trenutak kada se ujedinjuju svi Excel-i sveta i vesele se.

Ipak, rano je za radovanje: sumiranje podataka je takođe bezvredno! Sumiranje je tek probiranje i prebiranje; razdvajanje mačaka od ostatka svega; redukcija velikih skupova na veličine koje ljudski um može da procesira.

Ali ono ne sme da bude samo sebi cilj.

Gospođa Fiorina jako lepo kaže:

The goal is to turn data into information, and information into insight.

Ovde izdvajam drugi deo: uvid je razumevanje. I samo tada podaci konačno imaju smisla, kada postanu nekakav uvid. A znamo: tek na osnovu uvida možemo nešto i učiniti.

Samo-uvid ovog teksta

Hajde, igre radi, da kažemo da je gornji tekst nekakav skup podataka - beznačajan niz slova i znakova.

Vadimo informacije iz teksta:

InformacijaVrednost
broj reči:273
broj znakova:1705
broj citata:2
broj naslova:2
broj mačaka:

Ah, kako bi samo mogao lep grafik da se napravi:

Bezvredno.

Potreban nam je kontekst u kome podaci važe. Ovde je to domen leksike, napisanih reči i rečenica. Informacije se moraju izvući iz tog konteksta. Sledi analiza, da bi konačno izdvojili uvid:

Podaci su bezvredni. Iz njih treba izvući informacije, koje služe da bi došli do uvida, razumevanja, a potom i akcije.

Dopunio sam prethodni citat akcijom. To je mali, lični pečat koji želim da naglasim: ako razumevanje ne prati akcija, čemu onda sve to?

Zato: prikupi, analiziraj, razumi i uradi.