La fin du document ?

Ce billet est inspiré de ma participation à une des tables rondes du forum des Archivistes français de Troyes et d'une réflexion de Jean-Séverin Lair du ministère de la Culture au sujet des cultures croisées des archivistes et des informaticiens.

Un des défis de l'archivage électronique est de maintenir la valeur probante des documents transférés par les producteurs aux archivistes. Cette valeur confèrera par extension sa valeur patrimoniale aux documents en restituant les informations qu'ils contiennent dans le contexte de leur production.



Par mimétisme, la signature électronique va remplacer la signature manuscrite et venir s'aposer sur le document officiel nativement numérique. Dans les faits, le certificat électronique associé au flux de données produits par l'application informatique chargée de rendre lisible pour un humain les 1 et 0 manipulés par les machines va tracer l'action effectuée ou encapsuler les données de manière à en prouver l'authenticité. Le législateur dans toute sa prudence juridique a assorti de toutes les précautions cette notion de garantie, conscient de la fragilité des supports numériques. Cette signature contient également des éléments de contextualisation avec le producteur et son éventuelle organisation de rattachement.



Initialement on a donc imaginé de crypter un document avec une signature numérique en s'appuyant sur le système de signature asymétrique et de conserver le document signé dans un coffre. A l'image du coffre suisse pour lequel 2 clés sont nécessaires pour accéder au contenu, le système de clé privé-clé publique permet de garantir que le document numérique a bien été produit par une personne ou un organisme dont l'identité est avérée. Toutefois, par soucis mercantiles ou par peur de la fragilité technologique, ces systèmes de certification ont une durée de validité limitée et nécessitent pour conserver leur valeur d'être fréquemment mis à jour. Pour conserver une facture signée pendant 10 ans il est donc nécessaire de la resigner 3 fois en cassant à chaque fois le précédent certificat garantissant l'authenticité du document associé.

Devant la prespective de cette activité de conservation, les archivistes ont milité pour limiter le plus possible le recours à la signature électronique dans le cadre de la simplification des procédures administratives et ont introduit l'idée que l'acte de versement du document original au service d'archives compétent valait preuve de son authenticité. Ils ré-introduisent par là la pratique de la diplomatique appliquée au monde numérique.

La diplomatique numérique

Lecteur de signes, l'archiviste les structure pour les rendre signifiants en ajoutant aux mots disponibles des signifiés extérieurs qui les rattachent entre eux et au monde. Si le temps le permettait, ses éléments d'analyse pourraient porter sur la véracité ou la validité d'un ensemble de données au moment de son versement. En fouillant dans les traces l'accompagnant, il pourrait reconnaître des motifs de confiance familiers ou déceler des éléments éveillant sa suspiscion. Il pourrait ainsi aposer son sceau dans la vie du jeu de données dont la survie repose sur sa vigilance et son oeil bienveillant. Pour lui rendre toute sa place il intégrerait les éléments de valeur probante et enrichierai au passage les motifs de nouvelles relations que ce jeu de données serait alors à même de tisser.

Pour prendre un exemple, l'étude des identifiants des données versées, la présence d'éléments de documentation technique ou fonctionnelle, la présence d'exemples de requêtes ou de tests, une somme de contrôle, un format de fichier RGI, un notice normalisée indiquent dès les premières analyses à l'archiviste quel va pouvoir être son niveau de responsabilité sur l'utilisation conditionnelle de cette information dans un cadre juridique. Dans la plupart des cas, il faudrait refuser les versements actuels d'archives électroniques. Issus de bases de données maintes fois remaniées et recopiées, purgées ou sauvgardées, elles parviennent généralement à l'âge définitif sans traces de producteur originel ni carte d'identité technique. Au mieux on pourra faire de la fouille textuelle et utiliser de l'intelligence artificielle pour structurer leur contenu en information, au pire on les perdra dans une migration de format qui aura mal tournée.

En un sens le conservatisme administratif rétif au changement et à l'injonction numérique nous a préserver jusqu'ici de trop grandes pertes du matériau historique de demain. En effet, dans les administrations publiques la plupart des actes sont encore signés au format papier. Le numérique progresse toutefois de manière inéluctable et sa conservation dépend de la capacité des archivistes à apprivoiser cette nouvelle matérialité. Même si c'est dur à concevoir pour certains, le numérique c'est du réel, ce sont des ondes, du courant, des résistances, des clés, du language et des signes. Il est donc tout à fait possible de lui atribuer une valeur basée sur l'analyse des signes qui le caractérisent. Et en la matière c'est la mise en relation des signes entre eux, à l'instar d'une enquête de détective qui l'accrédite et permet de la transmettre.

Pour reprendre l'exemple de la généalogie, corpus familier, on peut imaginer un versement annuel de la base de données municipale du service gestionnaire sous la forme "selectionne tous les actes de l'année 2016" ce qui pourrait de traduire dans un language informatique approximatif par la requête "select * form table_actes where année_production is $ANNEE_COURANTE".  Ce qui reviendrait dans le meilleur des cas à constituer un fichier texte composé de mots ou chiffres séparés parfois par un délimiteur unique permettant de les structurer au sein de ce fichier. S'il advenait que ce fichier soit mal nommé ou égaré, il serait toujours possible de le faire parler plus tard en déduisant son contexte de production de sa lecture mais son exploitation pourrait être plus ardue si les données présentes dans ce fichiers correspondaient en fait à des codes dont les valeurs étaient stockées dans un autre fichier. En effet dans les bases de données dites relationnelles (tiens, tiens encore des relations), on utilise des tables pour stocker des éléments auxquels font régulièrement référence les données. Par exemple des adresses, des types d'actes sont identifiées au moyen d'identifiants uniques au sein de la table qui les contient de manière à ce que les autres tables y faisant référence puissent inscrire cet identifiant comme une clé d'identification.

Si bien que ce versement devrait être conservé à proximité d'autres avec lesquels il partagerait certaines similitudes ou tout du moins à un méta-fichier expliquant le contenu des autres. A défaut de pouvoir restituer aux chercheurs les données et le système de gestion de la base permettant de l'interroger, il revient donc à l'archiviste de déposer ce fichier dans une toile descriptive qui propose un autre moteur de recherche et de restitution de l'information. Si l'on prend notamment en exemple cette définition du réseau mondial on trouve des similitudes avec la pratique de description archivistique :   

world wilde web : toile d'araignée de serveurs d'informations reliés les uns aux autres par des liens physiques (le réseau matériel) et des liens logiques (les liens hypertextes).

 

Il peut même, s'il est facétieux, proposer plusieurs représentations de la même information en disposant des annotations, des enluminures ou des éléments de styles rendant la lecture plus agréable. Si on exige le document original il le reconstitura de sa science implacable en replaçant les yeux fermés le logo, la signature, l'adresse et l'objet à leurs places habituelles et familières. On le regardera un peu avec suspiscion comme quand on résiste au pouvoir de l'illusioniste mais à la différence du magicien, les tours de l'archiviste sont à regarder les yeux ouverts. C'est même cette transparence des méthodes utilisées pour restituer le document qui en fera toute la beauté.


Tout le travail de production et de collecte des métadonnées permet donc de garantir à l'archive une structure auto-portante permettant de la déplacer hors de son contexte de production. Ces mêmes métadonnées permettent du coup de relier ces données à d'autres et composer ainsi une toile de données liées.
Cette pratique permet également d'orienter les pratiques archivistiques vers celles en vigueur sur le Web. Donner des identifiants pérennes aux données d'archives pour en garantir la citabilité, lier leurs descriptions à des descripteurs d'autorité comme un lieu, une catégorie ou une fonction dans le cas des notices d'autorité de type acteur.

La dilution de la matérialité de l'archive dans l'univers numérique transformant le document en un ensemble de données doit donc s'accompgner d'une pratique accrue de la production de métadonnées. C'est celle-ci qui garantira à la fois la pratique de la conservation préventive au gré des migrations de format de fichiers ou des agrégations de données dans des entrepôts de publication à destination des communautés de chercheurs et la valeur probante des archives électroniques enrichies d'un faisceau de traces constituant la notion de (https://fr.wikipedia.org/wiki/Preuve) preuve juridique.