– Vi mäter framför allt två saker, hur lång tid det tar innan en låt börjar spelas för användaren och hur mycket det hackar i uppspelningarna, berättar Oskar Stål, teknikchef på Spotify.

Mätningarna visar att medeltiden till uppspelning är 235 millisekunder när Spotify körs på klientdatorer som pc, vilket inte är märkbart för användaren, och att det inte hackar särskilt mycket i länder med avancerad infrastruktur och lite mer i länder där kapaciteten är lägre.

Spotify kopplar de här kvalitetsmåtten till en vilja att sänka kostnader för it-infrastruktur, samt att undvika komplexitet.

– Vi frågar oss om vi verkligen ska hålla på och bygga datacenter och köpa hårdvara.

Rädsla för att det kan bli problematiskt att garantera kvaliteten när användningen ökar spelar också in. Slutsatsen är att lagringstjänster i molnet är ett attraktivt alternativ.

Molntjänster kan inte erbjuda samma prestanda som Spotifys 6 000 egna servrar som finns i fyra datacenter (i Stockholm, London och på båda amerikanska kusterna). Det tar två till fem sekunder innan uppspelningen börjar om en låt strömmas från Amazons lagringstjänst S3.

Amazon har andra lagringstjänster med bättre prestanda, men lösningen nu är att använda en kombination av de egna datacentren och Amazons S3. Det är möjligt att få ut bättre prestanda från S3, men det skulle kräva mer jobb från Spotifys sida.

Alla låtar, i alla format och komprimeringsgrader, finns i form av ljudfiler på Amazons S3. Dessutom lagrar varje datacenter 25 procent av det totala antalet låtar. Eftersom det är de 25 procent som spelas oftast i regionen som datacentret betjänar fungerar de egna datacentren också som cacheminnen för användarna.

”Vi kanske lagrar alla ljudfiler på en molntjänst snart, eller om fem år. Vi hoppas kunna dra i gång en test av hur det fungerar snart”

Innehållet stämmer till stor del överens mellan de olika datacentren, men inte helt, på grund av regionala skillnader i musiksmak. Från de egna datacentren strömmas 400 TB data per dygn till användarna, enligt Spotifys egna uppskattningar. Den datavolymen innefattar även annat innehåll än ljud, som bilder och text.

Förutom att datacentren fungerar som gigantiska cacheminnen mellanlagras ljudfiler även på användarnas egna klientenheter. Sammantaget betyder det att de låtar som en användare, eller en geografisk grupp av användare, lyssnar på ofta spelas upp blixtsnabbt. Om det är en mindre populär låt, till exempel från en obskyr depprockargrupp från 1980-talet, kan det ta upp till fem sekunder. Först måste låten hämtas från S3 till ett av Spotifys egna datacenter, sedan strömmas den till användaren.

När är tiden mogen för att låta en molnleverantör ta hand om all datalagring?

– Jag vet inte, det kan vara snart eller om fem år. Vi hoppas kunna dra i gång ett test av hur det fungerar snart.

Förhoppningen är att kunna köra tester med riktiga användare i början av 2014. Då får kanske en halv procent av användarna sina låtar från Amazons S3. Strömningen av musiken sköts då av mjukvara som körs på Amazons molnplattform, i stället för på Spotifys egna servrar.

Oskar Stål berättar att användningen av molntjänster för lagring inte bara innebär en förenklad tillvaro. Det ställs högre krav på Spotifys mjukvara för att hantera lösningar med molntjänster för lagring. Speciellt när lagringstjänsterna är kopplade till andra molntjänster för att strömma musik. Det är enklare om lagring och strömning sköts i Spotifys egna datacenter.

Det är bland annat därför Spotify har en teknikorganisation med 360 anställda, varav ”kanske 250” är utvecklare.

Fakta

  • I dag lagrar Spotify 20 miljoner låtar, i 200 miljoner filer, på Amazons lagringstjänst S3.
  • Varje låt finns i minst sex olika ljudfiler.
  • Varje dygn läggs 20 000 låtar, i 120 000 ljudfiler, till samlingen.
  • Med en medelstorlek på 4,5 MB per ljudfil blir den totala lagringsvolymen cirka 900 TB, eller nästan en petabyte.
  • Anledningen till att förhållandet mellan antalet låtar och antalet ljudfiler är olika för det existerande beståndet och nya låtar är att det ibland finns olika versioner av låtar för olika marknader och att det finns en del dubbletter.
  • Av tradition använder Spotify filformatet Ogg Vorbis, men numera används även mp3-formatet, eftersom det finns en webbläsarklient för att spela upp musik.
  • För båda formaten lagras minst tre olika versioner, där versionerna har olika grad av komprimering.