Culture

Comment la Bibliothèque du Congrès va archiver Twitter

Temps de lecture : 2 min

Library of Congress Reading Room 1, maveric2003 via Flickr,CC-Licence-by

En avril 2010, la Bibliothèque du Congrès, bibliothèque nationale des États-Unis et plus grande bibliothèque au monde, avait annoncé via son compte Twitter qu'elle allait acquérir les archives de Twitter, depuis sa création en 2006.

Lors de l'annonce de la donation en 2010, les utilisateurs du service émettaient 50 millions de tweets par jour. En juin 2011, ce nombre est passé à plus de 140 millions, relate Audrey Watters sur le site O'Reilly, qui s'interroge sur les moyens employés par la Bibliothèque pour archiver les tweets.

Elle rappelle que beaucoup de données numériques sont déjà archivées par la Bibliothèque: les sites web des campagnes présidentielles américaines depuis 2000, ainsi que des magazines, films et matériaux du Folklife Center. Au total, plusieurs pétabytes (milliards de mégabytes) sont déjà archivés.

Audrey Watter a interrogé Martha Anderson, à la tête du Programme d'infrastructure et de préservation de l'information numérique nationale (National digital information infrastructure and preservation program) et Leslie Johnston, qui gère l'architecture technique du projet.

Leur travail est colossal: elles doivent imaginer ce que les chercheurs ou le public va vouloir tirer des informations contenues dans les tweets. Car contrairement à ce que l'on pourrait penser, «il y a des gens que ça intéresse» de savoir ce que vous avez mangé au petit-déjeuner, racontait Christopher Beam sur Slate en mai 2010.

Martha Anderson et Leslie Johnston sont toutes deux en train d'étudier et de mettre en place les outils qui vont permettre à la fois d'archiver mais surtout de consulter les tweets, qui contiennent bien plus d'information que les 140 caractères de texte autorisés. Beaucoup de tweets contiennent en plus une URL réduite, l'adresse d'un site web résumée à l'aide des sites bit.ly ou tinyurl. Les deux employées comptent sur l'aide de l'Internet Archive et de son projet 301works pour conserver une signification derrière ces adresses, et pourquoi pas en produire une cartographie.

Selon elles, une équipe se réunira durant l'été 2011 afin d'établir un plan de travail, et un premier accès sera mis à disposition des chercheurs dans les quatre à cinq mois qui suivront.

Newsletters

Les plus belles photographies de pomme de terre

Les plus belles photographies de pomme de terre

Inspiré en partie par la photographie de pomme de terre de Kevin Abosch vendue un million d'euros en 2016, le premier concours de photos de pomme de terre (Potato Photographer of the Year 2020) vient d'élire son photographe de l'année. Florilège.

«Dawson City», «White Riot», le temps gelé, le temps incandescent

«Dawson City», «White Riot», le temps gelé, le temps incandescent

Odyssée poétique à travers les décennies avec Bill Morrison, pamphlet engagé et électrique chez Rubika Sha, d'une manière très différente, ces deux films mettent en lumière les puissances toniques du documentaire.

«Newport Beach» a réinventé les ados à la télé (et sauvé les geeks)

«Newport Beach» a réinventé les ados à la télé (et sauvé les geeks)

Ça fait dix-sept ans que le pilote de The O.C. a été diffusé à la télévision américaine, en plein cœur de l'été –le 5 août 2003 très exactement. En France, il a fallu attendre octobre 2004 pour voir débarquer la série, rebaptisée Newport Beach,...

Newsletters