Hur många gånger har Sriram Vangal verkligen satt sin fot i Linköping? Enda gången lär ha varit när han försvarade sin licentiat-avhandling där. Men med det satte han Linköpings universitet på teknikens världskarta. För i sin licentiatavhandling beskrev Sriram Vangal framtiden för Intels processorer, Polarisarkitekturen.

Processorer med två kärnor – enkelt uttryckt två processorer i samma kapsel – börjar komma i de snabbaste persondatorerna. En del har fyra kärnor. Jämfört med Polarisprocessorn är fyrkärniga processorer blaha-blaha. Polarisprocessorn har åttio kärnor. Och fler kan det bli.

Professor Atila Alvandpour på Linköping har varit handledare för Sriram Vangal, och kontakten har mest skett via e-post och telefon. Bakom lic-avhandlingen ligger två års arbete.
Först när allt var klart for Sriram Vangal till Linköping för att försvara sin avhandling. Vilket naturligtvis gick bra.

Och resultatet blev inte bara en binge papper.
Intel har redan tillverkat Polarisprocessorn i liten skala. Hela avhandlingsarbetet gjordes medan Sriram Vangal arbetade på Intels forskningsgrupp i Hillsboro, Oregon.

Som namnet antyder är Sriram Vangal indier, uppvuxen i en ingenjörsfamilj och utbildad i Bangalore. Han har jobbat på Intel i USA sedan han var 23 år. Nu är han 34.
Atila Alvandpour lärde känna honom när båda arbetade på Intel, och när Alvandpour återvände till professuren i Linköping rekryterade han Vangal till forskarutbildningen. Där är han kvar – nu ska han doktorera.

Det kommer att dröja flera år innan Polarisprocessorer finns att köpa, men Sriram Vangal verkar nöjd. Hittills fungerar prototypen perfekt, ”inte en enda bugg”.
Vad är då poängen med en processor med 80 kärnor – 80 små processorer som kan fungera självständigt, men som också samarbetar?

Det finns två fördelar.
Den första är strömsnålhet.

Prototypen till Polarisprocessorn klarar en svensk biljon (en miljon miljoner) flyttalsoperationer på en sekund. (Flyttal definieras här som decimalbråk. Decimalkommat kan stå var som helst i talen.)

På 1990-talet kom den första superdatorn som kunde räkna lika fort, Asci Red, utvecklad av Sandia National Laboratories och Intel. Den var bestyckad med 10 000 processorer av typ Pentium Pro och drog 500 kilowatt.

Polarisprocessorn gör samma jobb på 62 watt. Alltså som en läslampa. En del av förklaringen är att processorn bara aktiverar så många kärnor som behövs för jobbet. Resten får vara vilande.

Å andra sidan kan man skruva upp processorns klockfrekvens från 3,1 till 5,7 gigahertz. Då blir den nästan dubbelt så kraftfull, men till priset av att strömförbrukningen stiger till 265 watt.

Det räcker för att steka ägg, men det är fortfarande bara en tvåtusendel av 500 kilowatt.

Kravet på strömsnålhet är inte bara en fråga om ekonomi och miljö. Det är också en fråga om användbarhet. En processor som ska finnas i en bärbar dator eller i en mobiltelefon får inte bli så het att användaren bränner sig. Benämningen ”laptop” för bärbar dator börjar redan bli föråldrad, för de kraftfullaste bärbara datorerna går inte att ha i knät utan grytlapp.
Den andra fördelen är att Polarisprocessorn fungerar som en parallelldator.

Parallelldatorerna är vår tids superdatorer.
Avancerade vetenskapliga och tekniska beräkningar delas upp i småbitar. Parallelldatorns många processorer löser varsin bit på samma gång.

Nu kan en enda processor tillämpa samma arbetssätt.

Det besvärliga med det arbetssättet är att samordna arbetet. Arbetsuppgifterna ska pytsas ut och resultaten ska samlas in med så lite väntetid som möjligt. Speciella kompilatorer gör att programmerarna inte behöver bekymra sig om att anpassa programmen till parallelldatorer, men sedan gäller det att hårdvaran inte får bli en flaskhals.

Sriram Vangal kom fram till att en enkel grundkonstruktion ger högst prestanda..

De 80 processorkärnorna är var för sig enkla och de är exakt likadana. Det krångliga är det intrikata systemet som de använder för att kommunicera med varandra. Det är en så kallad mesh-arkitektur där varje kärna pratar med sina närmaste grannar. Varje kärna har en egen router som skickar, tar emot och vidarebefordrar data till grannarna. Det interna kommunikationsnätet är utformat för att kunna växa utan att bli långsammare.

Konstruktioner där alla kärnor kan prata direkt med alla andra blir ohanterliga när nätverket växer. Och konstruktioner där allt går via en central nod blir överbelastade och skapar köer. I nätverk i alla format, från internet och Skype till Polarisprocessorn, fungerar det bäst när varje enhet kommunicerar direkt med ett begränsat antal andra noder.

Fakta

  • Polarisprocessorn är även känd som Teraflops Research Chip.
  • Består av 80 kärnor, det vill säga 80 identiska, relativt enkla processorer. De har totalt 100 miljoner transistorer.
  • Kärnorna kommunicerar med varandra genom ett nätverk. Varje kärna har en inbyggd router som sänder, tar emot och vidarebefordrar data och instruktioner. De kan pumpa mellan varandra i en takt på 1,6 terabit per sekund.
  • Delar av processorn kan stängas av eller köras på lågvarv beroende på behovet av kapacitet.
  • Strömförbrukningen är 62–265 watt per timme.
  • Klockfrekvensen är 3,1–5,7 gigahertz.
  • Beräkningskapaciteten är en teraflops vid lägsta klockfrekvens och 1,8 teraflops vid högsta klockfrekvens. En teraflops är tusen miljarder flyttalsoperationer per sekund.