Sajten Db-Engines erbjuder ett sätt att ha koll på databasmarknaden. Där finns en topplista som påminner om Tiobes för programmeringsspråk. Det handlar alltså om att mäta intresse på webben.

På Db-Engines senaste topplista har tre nosql-databaser slagit sig in på topp tio: MongoDB (5), Cassandra (9) och Redis (10). Dessutom återfinns två Hadoopbaserade produkter på topp-20: Hbase (15) och Hive (17). Notera att plattformen Hadoop som sådan inte är med på listan. Och lägg till det att Splunk som också kan beskrivas som en alternativ databaslösning hamnar på plats 20 och att fler nosql-databaser dyker upp därefter.

Andra tecken på att alternativa databaslösningar rör sig framåt med stormsteg är att de allt oftare dyker som komponenter i applikationer i drift. Men det kanske största tecknet på att relationsdatabasen utmanas är innovationstakten vad gäller nosql-databaser och Hadoop.

På nosql-sidan märks bland annat version 2.0 av dokumentdatabasen CouchDB från Apache som kommit i en förhandsversion. Bland nyheter märks en ny lösning för klustring, vilken förhoppningsvis kommer att bidra till att CouchDB inte främst ses som en databas som körs på en server, utan även i större installationer.

Couchbase är en annan dokumentdatabas som finns i version 3.0.1 sedan en månad tillbaka. Bland nyheterna märks bättre utnyttjande av minne och flashminne, för att förbättra prestandan. Dessutom har lösningen för att synkronisera data mellan noder i kluster och mellan datacenter förbättrats. Lägg till det en förhandsversion av ett sql-liknande frågespråk som heter n1ql.

På Hadoopfronten märks version 1.0 av Splice Machine som lanserades i mitten av november. Det är en lösning för att köra en relationsdatabas i en Hadoopimplementation. Syftet är naturligtvis att komma i från begränsningarna med att Hadoop i grunden är en batchlösning (satsvis bearbetning).

Ett annat intressant Hadoopprojekt är Apaches Tez. Det är ett ramverk för att köra interaktiva jobb med bra prestanda, som är under utveckling. Den senaste versionen av Tez är 0.5.1.

Fakta

Hadoop är ett ramverk för att hantera stora datamängder i distribuerade mijöer, alltså flera samverkande datorer. I praktiken fungerar Hadoopinstallationer ofta som databaser för satsvis bearbetning av stora datamängder.
Hadoop har skapats av Apache Software Foundation.