De tecknade filmerna är kanske inte i Pixarklass, men den svåra biten är inte datoranimeringen. Den svåra biten är språkvetenskap.

Med programmet Carsim kan man mata in en tidningsnotis om en bilolycka. Programmet framställer då en datoranimerad film som visar hur olyckan gick till.


Korsning. Carsim är en korsning mellan språklig analys och datoranimering. Kollisionen på bilden har ritats av ett datorprogram som först har analyserat ett tidningsartikel om olyckan. I själva verket är det en 3d-film.

Det är som att göra en maskin­översättning från text till bild.
Ett datorprogram ska analysera texten och ta fram all information som behövs för att göra en komplett representation av händelsen från början till slut.

Datoranimering är obeveklig när det gäller kravet på komplett och motsägelsefri information.

Vanlig maskinöversättning från språk till språk blir utskrattad med jämna mellanrum, men det är mycket svårt att få det rätt när ingen människa är inblandad.

Mänskliga översättare kan be­döma rimligheten i olika tolkningar av originaltexten och översättningen, men det kan inte datorprogram.

En klassisk nöt inom maskin­översättning är så kallad pronomenresolution. ”Jag träffade honom på stan när jag var på väg till Per, och vi gick hem till honom tillsammans” är en fullständigt normal mening, men hur vet ett översättningsprogram att den första "honom" är en person som troligen har nämnts tidigare i texten, medan den andra "honom" är Per.

Visserligen kan en rak översättning bli rätt utan att man reder ut vem "honom" är, men om syftet är att programmet i någon mening ska förstå texten – göra en maskinsammanfattning av innehållet – är pronomenresolution nödvändigt.

I datoranimering är kraven på exakthet ännu högre.

Ska man visa vart Per och jag gick går det inte att sväva på målet.

Tar vi trafikolyckor så är det troligen minst två bilar inblandade.

Troligen kallas båda bilarna för "bilen" på sina ställen i texten.
Alltså måste programmet Carsim kunna skilja mellan "bilen" och ”bilen”. Och även om det står ”bilen” många gånger i texten får det inte bli hur många bilar som helst i filmen.

Programmet måste räkna ut vilka aktörer som finns i texten. Varje händelse måste knytas till rätt aktör.

Det är också nödvändigt att fastställa i vilken ordning händelserna inträffar – tidningsartiklar beskriver inte alltid händelser i tidsordning.

Det blir rätt i ungefär hälften av fallen, säger Richard Johansson, doktorand vid Lunds tekniska högskola.
Richard Johansson har gått vidare med den språkvetenskapliga komponenten av Carsim – den svåraste biten.

Det går bra. I början av juni vann han och hans handledare, docenten Pierre Nugues, första pris vid Conference on computational natural language learning, Conll, för sitt parsningsprogram.

Det är ett smakprov på Richard Johanssons doktorsavhandling om så kallad semantisk parsning, som läggs fram i höst.

Ett parsningsprogram är ett program som går igenom en text, ord för ord, för att se om den uppfyller vissa formella krav.
Semantisk parsning innebär att programmet granskar textens innehåll.

Pronomenresolutionen, som jag nämnde tidigare, är en del av uppgiften. Programmet ska också förstå vilka verb och adjektiv som hör ihop med olika substantiv. Man kan säga att det handlar om att bygga upp en modell av de händelser som texten beskriver.

– Man lägger upp en databas över entiteter i texten, säger Pierre Nugues.

De personer och föremål som nämns i texten tilldelas olika roller i händelseförloppet.

Det har flera tillämpningar:

  • Svara på frågor. Om en användare ställer en fråga till ett datorprogram, och svaret på frågan finns i texten, ska ett program som använder semantisk parsning kunna svara på frågan.
  • Maskinöversättning. Det kan bli enklare att göra en korrekt översättning av en text om översättningsprogrammet "förstår" det händelseförlopp som texten beskriver. (Men de mest framgångsrika översättningsprogrammen arbetar inte med språkvetenskapliga metoder, utan med sannolikhetsbaserade metoder.)
  • Textsammanfattning. Datorprogram kan automatiskt korta och sammanfatta en text.
  • Informationsextraktion. Vilka påståenden görs i texten?

Dessutom kan tekniken användas för att undersöka om en text är fullständig och motsägelsefri.

Det var Pierre Nugues, docent i datavetenskap vid LTH, som kläckte idén till Carsim.

Det utvecklades av doktoranden Rickard Johansson med stöd av verket för innovationsforskning, Vinnova.

Programmet har fått pris från Microsofts utvecklingscenter i Köpenhamn, men Nugues och Johansson har nu släppt det – det gick inte att få finansiering för vidareutveckling.

Jag frågar honom ifall textvisualisering inte kan bli ett komplement till maskinöversättning.

– Det finns inget intresse, säger han.

– Vi fick inga anslag, och då kan vi inte hålla på.

Han är förvånad över att tekniken inte väckte större intresse.

– Vi sålde det till ett företag i Kanada, säger Pierre Nugues.

Fakta

Carsim är ett program som framställer datoranimerade tredimensionella filmer, baserat på tidningsartiklar om bilolyckor.
Programmet analyserar texten, rekonstruerar händelseförloppet och de inblandade fordonen och demonstrerar sedan händelse­förloppet i form av en film.
Det blir rätt i ungefär hälften av fallen.
Felkällor är dels ofullständig information i tidningsartikeln, dels att programmet av olika skäl inte förmår analysera texten korrekt.
Den grundläggande tekniken är så kallad semantisk parsning, en genomgripande datoriserad analys, ord för ord, av textens innehåll.