I veckan drog Java-mässan Jfokus i gång, med uppskattningsvis 1 500 besökare. Ett av de hetaste namnen var Eva Andreasson, produktchef på Cloudera, som är en av giganterna på big data och plattformen Hadoop. Eva Andreasson berättade om hur tekniken kan användas i praktiken. Hon inledde med att fråga åhörarskaran på 500 personer, om de känner till begreppet big data. Ungefär halva publiken räckte upp händerna.

– Det är betydligt fler än för bara ett år sedan, då ungefär en tiondel av 300 personer ansåg att de visste vad det handlade om, säger hon.

Cloudera är en av de verkliga kometerna – och giganterna – inom big data. Eva Andreasson är en företagets centrala produktchefer. Hon flyttade till Kalifornien när hon arbetade på Bea Systems, Därefter arbetade hon bland annat med Java Virtual Machine på Oracle innan hon så småningom blev senior produktchef på Cloudera.

Hennes anförande på konferensen handlade om hur man kan analysera Twitterströmmar med hjälp av Hadoop, något som är hett för såväl militärer som omvärldsanalytiker och marknadsförare som behöver få koll vilka twittrare som får flest retweets, vilka som är mest inflytelserika eller vem har flest följare.

– Problemet med att använda traditionella SQL-baserade sökningar är att det blir komplext och att det är svårt att analysera komplexa data med traditionella metoder, säger Eva Andreasson.

Hon visade hur man kan använda verktyget Flume, för bland annat insamling och aggregering av strukturerade och ostrukturerade data, och Hive, som är en slags datalager för Hadoop, som det går att köra SQL-liknande kommandon med. Utifrån bland annat dessa verktyg går det att ta fram ett beslutsstöd som är mer flexibelt än traditionella verktyg, som ofta är låsta kring ett antal förspecificerade frågeställlningar. Med Hadoop kan analyserna ändras allteftersom, beroende på vad användaren behöver analysera och vilka nya data som kommer in.

Ett företag som använder Hadoop i praktiken är speljätten King.com i Stockholm. Med hjälp av Hadoop hanterar företaget en extrem datatillväxt, med en trefaldig ökning av antalet händelser per dag, till drygt tre miljarder per dag i dagsläget. Men allt är inte guld och gröna skogar.

– För att satsa på big data gäller det att vara ett företag som har lätt att rekrytera rätt kompetens. Man bör också ställa sig frågan om man verkligen behöver Hadoop. Det finns ju enklare lösningar. I vårt fall var det en självklarhet, det fanns inget annat. Sedan är tekniken relativt ny och den är inte bara att plugga in och köra, säger Lars Sjödin, utvecklingschef på King.com.

Fakta

Java-mässsan Jfokus ägde rum från måndags till onsdag på Stockholm Waterfront Conference Center. Totalt drog seminariet uppskattningsvis 1 500 besökare.