Dina lunchtweets och iakttagelser framför tv:n kan tyckas obetydliga för den amerikanska kongressen, men Twitter innehåller mycket mer. 2010 tecknade USAs kongressbibliotek ett avtal med Twitter om leverans av alla publika meddelanden som skickats sedan sajten startade 2006. Nu meddelar biblioteket att de hittills lyckats arkivera över 170 miljarder meddelanden och att de satt upp en funktion för att samla in alla nya meddelanden som skickas via Twitter.

Sättet att samla in information löpande är nytt för kongressbiblioteket och förhoppningen är att ett stort twitterarkiv ska kunna användas av forskare som ett komplement till annan information i form av tidningar och böcker som redan samlas in.

Den första omgången twittrande mellan åren 2006 och 2010 bestod av 21 miljarder meddelanden. De levererades till biblioteket som tre filer i komprimerat format och tog upp 2,3 terabyte på hårddisken. Sedan dess har samlingen vuxit avsevärt och den tar nu upp drygt 67 terabyte i komprimerad version.

Sedan förra året är insamlandet automatiserat och twittrandet samlas i filer uppdelat per timma. Som allt annat digitalt material som samlas in till biblioteket så sparas de på band i två upplagor för långtidslagring.

Enligt biblioteket har det redan inkommit fler än 400 förfrågningar från forskare runt om i världen som vill ta del av materialet eller delar av det. Frågorna handlar bland annat om hur meddelanden spridits i samband med terrorattacker eller utbrott av influensa. Men ingen av forskarna har ännu fått tillgång till materialet. Kongressbibliotekets sökteknik klarar inte av de stora informationsmängderna och en enskild sökning på materialet kan ta mer än ett dygn.