Få teknikområden andas så mycket ”gammel-it” som datalager, eller data warehouse som det heter på engelska. De som säljer lösningar byggda på modern teknik för ofta fram datalager som exempel på dålig tillgänglighet, krånglig hantering och oförmåga att hantera nya typer av data.

Vad är ett datalager? Enkelt uttryckt är det en separat datastruktur och arkitektur för att köra beslutsstöd, alltså analyser och rapporter baserade på data. Ett datalager körs typiskt på egen hård- och mjukvara, som är skild från den hård- och mjukvara som används för att hantera databaser för mer verksamhetsnära och transaktionsbaserade affärssystem och liknande.

Ur ett dataperspektiv bygger datalager ofta på en helt annan datamodell än de transaktionsbaserade databaserna. Det är en datamodell som är mer lämpad för analyser. Data kopieras från transaktionsdatabaserna till datalagren, och omformas på vägen.

Läs också: 5 starka trender inom dataanalys just nu

Snowflake Computing är ett amerikanskt företag som jobbar hårt med att modernisera teknik för datalager. Computer Sweden fick tillfälle att prata med svenska Denise Persson som är marknadschef på Snowflake, stationerad i San Mateo i Kalifornien. Vi brakar på med den mest uppenbara frågan:

Varför hackas det så mycket på datalager?

– Det har traditionellt varit svårt att få tillgång till data från datalager, framför allt i realtid. Datalagren har verkligen varit i händerna på it-avdelningarna, säger Denise Persson.

Det här vill Snowflake råda bot på och man gör det med följande strategier:

  • Snowflake är tillgängligt som en molntjänst, med alla generella fördelar som det för med sig. Denise Persson framhåller bland annat skalbarhet, både vad gäller datavolymer och antalet användare som kan få tillgång till data.
  • Tjänsten kan förutom traditionella relationsdatabaser även hantera det som Denise Persson kallar ”semistrukturerade” data, till exempel loggdata och maskingenererade data. Det här gör att Snowflake kan konkurrera med nyare teknik som Hadoop och nosql-databaser. Och det går att koppla ihop strukturerade relationsdatabaser med semistrukturerade data.
  • Att tjänsten är baserad på traditionell teknik för relationsdatabaser, som frågespråket sql, gör att den även är en lösning för att ersätta traditionella datalager som kunderna har kört på egen hårdvara rakt av. Det här ger ofta nödvändig funktionalitet som inte finns enkelt tillgänglig med till exempel Hadoop och nosql-databaser.

Hur ser det ut i praktiken, kör kunderna traditionella datalager på Snowflake eller är det nya datastrukturer som gäller?

– 40 procent av de data som hanteras är semistrukturerade. Poängen är att det inte finns någon möjlighet att göra det med traditionella datalager.

Snowflake är inte ensamma om att erbjuda datalager i molnet. Vad tycker Denise Persson om konkurrenterna? Amazons Redshift beskriver hon som en lösning för traditionella strukturerade datalager som körs i molnet. Den har samma begränsningar som traditionella datalager. Men hon säger att Redshift kan vara en bra lösning för vissa behov.

Googles Bigquery beskriver hon som en väldigt bra frågemotor som är extremt bra för vissa användningsfall. Men det är en begränsad lösning. Den kanske främsta begränsningen med Bigquery är att det inte går att hantera så avancerade datamodeller, vilket behövs för många typer av dataanalyser.

Läs också: Nu åker databaserna upp i molnet – i en rasande fart

Just nu är Snowflake aktuellt med att lansera drift på Microsofts molnplattform Azure, vilket gjordes förra veckan. Hittills har det varit tillgängligt på Amazons molnplattform.

Hur viktigt är det att Snowflake kan köras på Azure?

– Det är otroligt viktigt, framför allt i Norden där många stora kunder vill köra på Azure. I USA är Amazon störst. Dessutom har en majoritet av företagen en strategi med att använda flera molnplattformar.

Än så länge finns Azurestödet bara i en Azureregion i USA. Det ska komma stöd för Azureregioner i Europa ”under hösten”. Den som är nyfiken kan i alla fall experimentera med Snowflake på Azure i USA, med begränsade datamängder, och sedan köra skarp drift senare när möjligheten finns i Europa.

I dag har Snowflake cirka 50 kunder i Sverige. Med Azurestödet hoppas man få många stora företag som kunder i Sverige.

– Det finns en extrem potential, till exempel inom bank- och finanssektorn och även bland återförsäljarkedjor i Sverige. I dag har vi till exempel stora spelföretag som kunder i Sverige. Men vi riktar oss också mot mindre kunder.

I dagsläget har Snowflake drygt 500 anställda globalt och siktar på 800 innan året är slut. Innan årsskiftet är målet att ha åtta anställda i Sverige, bland annat lösningsarkitekter. Snowflake är finansierat med investeringskapital och går ännu inte med vinst.

– Nu är vi ensamma om den här lösningen, men det kommer naturligtvis konkurrenter. Nu gäller det att få så många kunder som möjligt, avslutar Denise Persson.


ANNONS: Storsatsande eventet IBM Analytics University kommer till Stockholm 17-20 september 2018