En av utmaningarna med stora datavolymer är att sortera dem snabbt, vilket är viktigt inte minst för söktjänster. Därför väcker allmänt tillgängliga sorteringstester intresse.

En av testerna heter Minute och går ut på att sortera så mycket data som möjligt under en minut. Fram tills nyligen var det Yahoo som hade rekordet med 500 GB data. Nu har forskare på Microsoft lyckats med bedriften att sortera 1 401 GB under samma tidsrymd.

Allra mest imponerande är kanske att Microsoftgänget gjorde det hela med "bara" 1 033 diskar i 256 datorer, medan Yahoo använde 5 624 diskar i 1 406 datorer.

Microsofts lösning, som heter Flat Datacenter Storage, påminner om ramverket Hadoop vad gäller att fördela arbetet på flera datorer. En skillnad är att de olika datorerna kommunicerar med varandra under tiden som sorteringen utförs. Varje dator kan skicka och sända data med en hastighet på 2 GB per sekund.

Microsoft presenterar sin sorteringslösning på konferensen ACM Sigmod/Pods som pågår i Scottsdale i Arizona just nu.