Ett av de problem som möter kunder som vill konsolidera datahantering för olika typer av analyser är att i stort sett varje leverantör har en egen bild av hur det ska gå till, beroende på det egna företagets historia, aktuella produktutbud och visioner. Här är några exempel.
– För två år sedan började vi arbeta med Birst som från början är molnbaserat och inte bygger på en massa olika moduler. Det är en stor skillnad mot gamla dinosaurier som IBM, Microsoft och Oracle, säger Stefan Lavén, vd på Lincube som är en svensk och nordisk partner till Birst.

Ett genomgående tema för Birsts lösning, som den är implementerad hos MTG, är att hålla sig till olika typer av Amazontjänster i molnet och att bara flytta data vid behov.
Läs också: Big data - trenden har landat
På EMC lyfter man fram Isilon som är en samlingslösning för att bygga egna så kallade datasjöar (data lakes) för data med olika struktur. Isilon består av noder som innehåller bland annat processorer, minne, diskar och mjukvara. Där dumpas data från de mest skilda källor. En finess är att data som finns i en Isilondatasjö kan hanteras rakt av i Hadooplösningar, de behöver alltså inte överföras till ett dedicerat Hadoopkluster innan analyser körs. Nyligen har EMC lanserat möjligheter att utvidga Isiloninstallationer till molntjänster.
Men är det en rimlig lösning för mindre kundföretag att bygga datasjöar?
– Förut pratade jag inte big data med mindre kunder, men i dag är det intressanta lösningar för alla som vill vara långt framme och agera lite smartare än andra, säger Angelo Rivano, försäljningschef för Isilon på EMC i Sverige.

En tredje leverantör är Mapr Technologies som bland annat har en egen Hadoopinstallation och säljer lösningar till kunder som hanterar verkligt stora datamängder. Teknikchefen MC Srivas som var på Sverigebesök nyligen berättar till exempel om en kund som lagrar 20 miljarder mejlfiler varje dygn. För närvarande finns det 1 500 miljarder meddelandefiler lagrade.
Srivas är, kanske lite oväntat, ingen anhängare av nosql-databaser som grafdatabaser, som han ser som nischprodukter, och framhäver i stället det etablerade språket sql. Men det är ingen tvekan om var hans fokus främst ligger, nämligen att skapa skalbara och tillförlitliga lösningar för hantering av verkligt stora datavolymer:
– Kvaliteten för datahanteringen bestäms av kvaliteten på klustret som används, hur lång medeltiden är till dataförlust. Och när dataförluster inträffar försöker vi inte bygga om diskarna, utan vi bygger om data. Det går mycket snabbare, säger MC Srivas.