måndag 13 februari 2012

Tipsa oss!08 453 62 20

Minsta lilla information ska bli sökbar på webben - Computer Sweden:

Smartare sökningar med semantik

Fakta

Sparql är ett frågespråk för informationssökning på webben. Det är också ett protokoll för kommunikation med informationskällorna. Sparql kan utvinna information ur många olika informationsformat i en enda sökning.
Förutsättningen är att informationen är strukturerad på ett sådant sätt att den är maskinläsbar.
Semantiska webben är ett projekt som går ut på att komplettera webbsidor med information, metadata, som beskriver informationen på ett sätt som kan användas i automatiska sökningar.
Sparql är en del av Semantiska webben, som är ett initiativ från webbens ledningsgrupp World Wide Web Consortium, W3C.

Hur frågar du Google vad huvudstaden heter i Senegal? Ett nytt frågespråk låter dig ställa sådana frågor och få svar.
Frågespråket heter Sparql, uttalas ”sparkle”, och ingår i projektet Semantiska webben.



Sparql ska förverkliga målet att den som söker efter information på internet bara ska behöva tala om vilken information som efterfrågas.

Du kan inte hitta särskilt mycket poesi genom att söka på ordet ”poesi” i Google. När, eller om, den semantiska webben förverkligas ska vi kunna göra det – även på sidor där ordet ”poesi” inte står någonstans i texten.

Semantiska webben är ett projekt som snart har pågått i tio år utan att lämna några större spår.

Idén är att all information på webben ska beskrivas på ett maskinläsbart sätt, inte bara sida för sida utan även mer detaljerat, ner till varje enskild bit information på en sida.

Att informationen ska beskrivas kan jämföras med när böckerna på ett bibliotek delas in i ämnesgrupper.
Mycket lite har hänt sedan 1999, när Tim Berners-Lee startade projektet Semantiska webben.

Men om det blir ett vanligt sätt att beskriva innehållet på webbsidor kommer dagens fritextsökande sökmotorer som Google att få ställa om sig.

Idén att lagra vartenda ord på varenda webbsida kommer fortfarande att vara intressant, men det kommer att finnas enklare sätt att hitta information. Sparql är ett steg i den riktningen.

Rdf, resource description frame­work, är en viktig komponent i Semantiska webben – det är ett system för att förse webbsidor med innehållsdeklarationer som förstås av datorer.
Till exempel att en sida om ”Rom” handlar om staden, inte om den folkgrupp som förr kallades för zigenare, eller om spritdrycken eller fiskägg.

Sparql har utarbetats i arbetsgruppen för rdf.

– Grundidén med Semantiska webben är att ta idén med webben, alltså en mängd sammankopplade dokument från hela världen, och tillämpa den på data, säger Lee Feigenbaum.

En annan medlem av W3C, Ian Jacobs, säger:

– Ett sätt att förstå Semantiska webben är att tänka sig webben som en enda stor databas. I en databas kan man söka och ändra data. Fler och fler webbsidor liknar databaser.
Att söka igenom databaser som produktkataloger med hjälp av Google är besvärligt. Försök hitta lägsta priset på din önskemobiltelefon med hjälp av Google.

Därför innebär den semantiska webben att Google, som lever på webbannonser baserade på sökningar, kan få ompröva sin affärsmodell, säger Jonas Lamis, chef för företaget Scivestor:

– Om jag kan ha en agent som söker för min räkning och hittar det som jag tycker är intressant, så behöver jag inte titta på Googles annonser.

Mest intresse för Semantiska webben finns inom hälsovården och biovetenskaperna, säger Jacobs.

Läkemedelsföretaget Eli Lilly använder teknik från Semantiska webben för sin forskning.

– Vi använder det i våra verktyg för utvärdering av läkemedelsmål. Det hjälper oss att hitta mesta möjliga information om intressanta läkemedelsmål, säger Susie Stephen, chefsforskare på Eli Lilly och ordförande för W3Cs grupp för utbildning inom den semantiska webben. (Ett läkemedelsmål är ett protein i kroppen som ska bearbetas med en viss drog.)

Andra företag som har deltagit i arbetet med Sparql är Agfa-
Gevaert, HP, IBM, Matsushita och Oracle. Det är alltså inte förvånande att dessa företag stöder Sparql.

HP har redan ett så kallat ramverk för den semantiska webben, Jena. Det innehåller frågespråk, protokoll och program för bearbetning av resultaten.

Sparql har redan realiserats i form av 14 kända tillämpningar.
Ett exempel, som närmast får ses som en demonstration av vad som är möjligt, är webbplatsen Dbpedia som hanterar uppslags-boken Wikipedia som en uppslagsbok och extraherar information ur den.

Sparql-tillämpningar är gjorda för att kunna köras på hela webben. Frågorna ska kunna köras mot utspridda datakällor, oavsett filformat. Sparql ska också kunna användas för att kombinera existerande informationskällor, så kallade hopkok.
Huvudstaden i Senegal heter förresten Dakar.

2008-01-27 15:12
Just nu på Cloudmagazine.se | besök sajten »
Smygtitt på Libreoffice Online

Artikelkommentatorerna ansvarar själva för sina inlägg
RSS Den här artikeln har 8 kommentarer:

Ord och begrepp - (ehl) 2008-01-27 15:56

Ord och begrepp - (Jakob Persson) 2008-01-27 17:26

Sökmotorer är "dumma" - (Nils H) 2008-01-27 21:19

Skills - (Daniel Scythe) 2008-01-28 07:59

Spam - (Jimpan) 2008-01-28 10:41

idag e vi trötta... - (Svensk Bäver) 2008-01-28 12:22

Tjao... - (Zelest) 2008-01-28 13:50

Successivt mer semantisk webb - (Pär Lannerö) 2008-01-29 11:30

OBS! Denna artikel är mer än 60 dygn gammal och är därför stängd för vidare debatt.

1 500 utvecklare samlas

Teknik I dag mjukstartar jättekonferensen Jfokus i Stockholm. 1 500 utvecklare kommer de närmaste dagarna att förkovra sig i Java, webbutveckling, mobilutveckling och mycket annat.

(5 kommentarer)

CS Jobb:

  1. Utvecklarkonferenser

    Jobb Besökarna fortsätter att strömma till, samtidigt som evenemangen växer i antal. Här finns en lista på årets utvecklarkonferenser.

(2 kommentarer)

Computer Sweden:

  1. Vilken typ är du?

    Teknik Programmerare kan delas in i väldigt olika kategorier. CS utvecklingsreporter Lars Danielsson listar fem arketyper.

(3 kommentarer)


Loopiamejl borta för gott

Nyheter Analysen av Loopias säkerhetskopior efter mejlhaveriet är klar. Det har tagit åtta veckor och slutsaten är att en del mejl är borta för alltid.

(31 kommentarer)

Computer Sweden:

  1. Ingen lösning i sikte

    Nyheter Efter Loopias kraftiga haveri i början av december är mejlen fortfarande borta.

(30 kommentarer)

Computer Sweden:

  1. Konkurrenternas kupp

    Nyheter Flera konkurrenter lanserar flyttjänster för att sno kunder.

(12 kommentarer)


- Computer Sweden:

Nu vill KTH uppgradera

(3 kommentarer)


- Computer Sweden:

Så enkelt hackas Google Wallet

(13 kommentarer)


- Computer Sweden:

Därför får plattan vika

(30 kommentarer)


- IT24:

SJ kastar av Polopoly
- plockar upp Adobe

(6 kommentarer)


- Computer Sweden:

Ny jättefusion inom mjukvara

Mest läst

Efter jobbet





Krönikan

Dålig täckning inte bara på internetsociologer

I en demokrati bör inte en privatperson angripas offentligt av en mediemakthavare

Senaste nytt





Missa inte











Partnermaterial

Nya kompendier

Kundvård med kunden i framsätet

Utvalda whitepaper

Säkerställ era webbapplikationers tillgänglighet
Ta kontroll över filöverföringarna
Inriktning, profilering och anpassning

Nyhetsbrev

CS nyhetsbrev varje dag

Utbildningsguide

Utbildningsguiden

Senaste tidningen

Kompendier



RSS-flöden

Nyhetsbrev
  • Dagliga
  • Veckobrev
  • Affärsfokus
  • CSjobb
  • Affärssystem
  • Språksamt

Prenumerera här

Kontakta oss
Prenumerationsärenden:
computersweden.se/info
eller ring 08-799 62 35.

Ring
till 08-453 60 00.
Skicka gärna e-post till: cs@idg.se

Postadressen är:
Computer Sweden 106 78 Stockholm

Om tidningen




AdtechSynpunkter på sajten? Kontakta nyhetschef Linus Larsson
Kontakta CS redaktion | Policy om personuppgifter & copyrightinfo
Karlbergsv. 77 106 78 Stockholm Tel: 08-453 60 00 | Copyright © 1996-2012 International Data Group