25 août 2012

DIV : Un cadre européen pour conserver l'information numérique.

Le problème du stockage et de la conservation de l'information numérique, par essence importante, labile et codée, est une préoccupation majeure de notre siècle. Il convient en effet de la protéger, de l'indexer et de la rendre accessible aux générations futures. C'est pourquoi un projet financé par l'Union Européenne a élaboré une architecture de référence afin de conserver l'information numérique et la rendre utilisable à l'avenir, quel que soit le lieu ou de la manière dont elle est enregistrée.
Un problème réside dans l'évolution technologique incessante, qui rend très vite obsolète à la fois les matériels de saisie, de stockage et de restitution, et les méthodes et formats dans lesquels l’information numérique est traitée. Pourtant, on sait que la prospérité des générations futures dépend de leur accès à l'information du passé.
Jusqu'ici elle a été assurée par la parole, les mythes, les chansons et le théâtre, le dessin, la gravure, l'art, la tradition, etc., et surtout l'écriture et plus récemment l'imprimerie. Aujourd'hui, l'ensemble de ce patrimoine tend à se numériser et l'ensemble de l'information nouvelle produite l'est, en quasi-totalité, de manière numérique.
Face à cette problématique critique, l’Union européenne a mis en œuvre le projet SHAMAN qui propose un cadre de conservation numérique de pratiquement n'importe quel format de données. Shaman signifie "être éclairé" en Tungus, dérivé lui-même du sanskrit Shramana (orthographié Chaman en français) et signifiant "détenteur des connaissances".
Ce projet collaboratif d'un consortium associant plusieurs sociétés et universités européennes vient de publier son rapport final, ayant atteint son objectif en fin 2011. Le travail de l'équipe du projet a consisté d'abord à analyser les pratiques et les préoccupations de ceux qui utilisent les méthodes de conservation des objets numériques dans une grande diversité d'organisations. Le but est de produire une solution qui simplifie le travail de conservation, notamment pour les institutions, entreprises et personnes pour lesquelles cette préservation ne fait pas partie des préoccupations ou exigences prioritaires.
L’architecture de référence du SHAMAN (SRA pour Shaman Reference Architecture) repose sur la technique du Grid Computing pour l'hébergement en raison de sa robustesse et de ses redondances. La technique du Cloud Computing n’a pas été retenue en raison de l’immaturité des technologies et de sa faible fiabilité face à des entreprises malveillantes. SHAMAN propose une vue holistique et unifiée de la préservation numérique autour de trois prototypes qui ont été testés respectivement par la Bibliothèque nationale allemande, dans un contexte industriel et dans les universités.
Le premier est à dominante méthodologique et montre que l’intégralité du cycle de vie numérique (création, montage, archivage, adoption et réutilisation) pourrait être appliqué aux livres, aux images et aux vidéos. Le deuxième est plus technologique en garantissant la conformité légale et améliorant la robustesse de sauvegarde. Le troisième est plus adapté au secteur de la science et de la santé qui génère un volume considérable et exponentiel de données toujours accessibles et réutilisables.
Selon les responsables du projet, il est probable qu’avec le développement de l’open data (ouverture des données) SHAMAN trouve facilement de nouvelles applications.