Hur frågar du Google vad huvudstaden heter i Senegal? Ett nytt frågespråk låter dig ställa sådana frågor och få svar.
Frågespråket heter Sparql, uttalas ”sparkle”, och ingår i projektet Semantiska webben.

Sparql ska förverkliga målet att den som söker efter information på internet bara ska behöva tala om vilken information som efterfrågas.

Du kan inte hitta särskilt mycket poesi genom att söka på ordet ”poesi” i Google. När, eller om, den semantiska webben förverkligas ska vi kunna göra det – även på sidor där ordet ”poesi” inte står någonstans i texten.

Semantiska webben är ett projekt som snart har pågått i tio år utan att lämna några större spår.

Idén är att all information på webben ska beskrivas på ett maskinläsbart sätt, inte bara sida för sida utan även mer detaljerat, ner till varje enskild bit information på en sida.

Att informationen ska beskrivas kan jämföras med när böckerna på ett bibliotek delas in i ämnesgrupper.
Mycket lite har hänt sedan 1999, när Tim Berners-Lee startade projektet Semantiska webben.

Men om det blir ett vanligt sätt att beskriva innehållet på webbsidor kommer dagens fritextsökande sökmotorer som Google att få ställa om sig.

Idén att lagra vartenda ord på varenda webbsida kommer fortfarande att vara intressant, men det kommer att finnas enklare sätt att hitta information. Sparql är ett steg i den riktningen.

Rdf, resource description frame­work, är en viktig komponent i Semantiska webben – det är ett system för att förse webbsidor med innehållsdeklarationer som förstås av datorer.
Till exempel att en sida om ”Rom” handlar om staden, inte om den folkgrupp som förr kallades för zigenare, eller om spritdrycken eller fiskägg.

Sparql har utarbetats i arbetsgruppen för rdf.

– Grundidén med Semantiska webben är att ta idén med webben, alltså en mängd sammankopplade dokument från hela världen, och tillämpa den på data, säger Lee Feigenbaum.

En annan medlem av W3C, Ian Jacobs, säger:

– Ett sätt att förstå Semantiska webben är att tänka sig webben som en enda stor databas. I en databas kan man söka och ändra data. Fler och fler webbsidor liknar databaser.
Att söka igenom databaser som produktkataloger med hjälp av Google är besvärligt. Försök hitta lägsta priset på din önskemobiltelefon med hjälp av Google.

Därför innebär den semantiska webben att Google, som lever på webbannonser baserade på sökningar, kan få ompröva sin affärsmodell, säger Jonas Lamis, chef för företaget Scivestor:

– Om jag kan ha en agent som söker för min räkning och hittar det som jag tycker är intressant, så behöver jag inte titta på Googles annonser.

Mest intresse för Semantiska webben finns inom hälsovården och biovetenskaperna, säger Jacobs.

Läkemedelsföretaget Eli Lilly använder teknik från Semantiska webben för sin forskning.

– Vi använder det i våra verktyg för utvärdering av läkemedelsmål. Det hjälper oss att hitta mesta möjliga information om intressanta läkemedelsmål, säger Susie Stephen, chefsforskare på Eli Lilly och ordförande för W3Cs grupp för utbildning inom den semantiska webben. (Ett läkemedelsmål är ett protein i kroppen som ska bearbetas med en viss drog.)

Andra företag som har deltagit i arbetet med Sparql är Agfa-
Gevaert, HP, IBM, Matsushita och Oracle. Det är alltså inte förvånande att dessa företag stöder Sparql.

HP har redan ett så kallat ramverk för den semantiska webben, Jena. Det innehåller frågespråk, protokoll och program för bearbetning av resultaten.

Sparql har redan realiserats i form av 14 kända tillämpningar.
Ett exempel, som närmast får ses som en demonstration av vad som är möjligt, är webbplatsen Dbpedia som hanterar uppslags-boken Wikipedia som en uppslagsbok och extraherar information ur den.

Sparql-tillämpningar är gjorda för att kunna köras på hela webben. Frågorna ska kunna köras mot utspridda datakällor, oavsett filformat. Sparql ska också kunna användas för att kombinera existerande informationskällor, så kallade hopkok.
Huvudstaden i Senegal heter förresten Dakar.

Fakta

Sparql är ett frågespråk för informationssökning på webben. Det är också ett protokoll för kommunikation med informationskällorna. Sparql kan utvinna information ur många olika informationsformat i en enda sökning.
Förutsättningen är att informationen är strukturerad på ett sådant sätt att den är maskinläsbar.
Semantiska webben är ett projekt som går ut på att komplettera webbsidor med information, metadata, som beskriver informationen på ett sätt som kan användas i automatiska sökningar.
Sparql är en del av Semantiska webben, som är ett initiativ från webbens ledningsgrupp World Wide Web Consortium, W3C.