Archives de l'État en Belgique

Notre mémoire à tous !

Menu

PDF comme format de conservation

Texte petit  Texte normal  Texte grand

Le format PDF est souvent utilisé pour l’archivage. Toutefois, les différentes variations de ce format ne résistent pas de façon égale à l’épreuve du temps.

Qu’est-ce que PDF ?

Mon PDF est-il approprié pour la conservation à long terme ?

Passez le test:

  1. S’agit-il d’un PDF/A-2 ou, à tout le moins, d’un PDF/A ?
    Le format est-il conforme à la norme (contrôle de validité) ?
    Les signatures ont-elles été authentifiées ?
    Le fichier est-il vierge de toute restriction de lecture et de traitement (automatiquement avec PDF/A) ?

« PDF » signifie portable document format. C’est u!n format conçu pour l’échange de documents qui doivent pouvoir être à la fois imprimés et affichés sur des ordinateurs dotés de différents systèmes d’exploitation (OS).

Un fichier PDF permet d’intégrer toutes sortes d’informations à propos d’un texte et de sa mise en page grâce auxquelles le fichier pourra être reproduit de façon (quasi) identique.

Le format PDF, dans sa version 1.7, est une norme officielle depuis 2008, via l’ISO 32000-1.

PDF est-il un format de fichier pérenne ?

Les PDF sont conçus pour pouvoir être ouverts et affichés d’une manière constante sur différentes plateformes. De cette manière, ils remplissent déjà par là même plusieurs conditions pour un formatage pérenne, mais attention !
 

  1. PDF reste un produit de la suite Adobe. Certes, le format est public, si bien que des logiciels de visualisation et de rédaction appropriés peuvent être programmés (entre, PDF Creator et Microsoft Word, à partir de la version 2007), mais du fait des 15 années de développement à l’origine de ce format, c’est Adobe qui a toutes les cartes en main pour concevoir des applications adaptées et déterminer l’avenir de ce format.
  2. La représentation correcte d’un PDF dépend de facteurs externes variables et d’autres formats de fichiers (images, vidéos, sons…) eux-mêmes susceptibles de changer avec le temps. Pour cette raison, le PDF en soi n’est pas un format de préservation approprié.
     

Pour résoudre ce deuxième problème, le format PDF/A a été développé par et pour les archivistes, les bibliothécaires et les producteurs d’archives.

Quelle est la différence entre PDF/A (notamment, PDF/A-2) et PDF ?

La norme PDF/A n’autorise pas l’utilisation de certaines fonctionnalités limitées dans le temps. Ces fonctionnalités varient en fonction de versions de PDF/A.

Il y a actuellement quatre types de PDF : PDF/A-1, PDF/A-2, PDF/A-3 et PDF/A-4. Ces quatre types sont distingués par différentes fins et différentes contraintes qui ne sont pas complémentaires. PDF/A-2 est actuellement le format considéré comme le plus approprié pour la conservation à long terme.

Ce format, basé sur PDF 1.7 et standardisé via l’ISO 19005-2:2011, associe fonctionnalité et résistance à l’épreuve du temps, notamment grâce à :
 

  • l’interdiction du cryptage, par exemple via un mot de passe (comme avec PDF/A-1) ;
  • la possibilité d’une compression en JPEG 2000, de sorte à pouvoir maitriser la taille des documents contenant des images (contrairement à PDF/A-1) ;
  • la possibilité de sauvegarder les ombres et les transparences (contrairement à PDF/A-1) ;
  • la préservation de l’intégrité des signatures électroniques (contrairement à PDF/A-1) ;
  • la limitation des formats de fichiers pouvant être inclus dans le document PDF (contrairement à PDF/A-3).

Comment peut-on créer un PDF/A-2 ?

Comme PDF/A-2 est désormais une norme publiée, il existe différents outils et différentes techniques pour convertir les fichiers (PDF, fichiers textes…) vers PDF/A-2. On connait notamment :
 

Malheureusement, Microsoft Word permet d’enregistrer des fichiers uniquement au format PDF/A-1.

Il arrive que les documents PDF/A contiennent des erreurs de conversion, par exemple des pages manquantes, des caractères mal encodés ou un horodatage modifié après l’opération de conversion. C’est pourquoi les PDF/A doivent toujours être contrôlés, par échantillonnage si nécessaire.

De plus, les différentes méthodes de conversion ne produisent pas systématiquement un document PDF/A parfaitement conforme à la norme. C’est pourquoi ces documents doivent être validés. Des PDF/A invalides n’apportent pas les garanties nécessaires à la conversation à long terme, ce pour quoi le format a pourtant été conçu.

Comment valider un document PDF/A-2 ?

Les outils de validation les plus connus sont :
 

Comment conserver un PDF avec une signature électronique ?

La validité d’une signature électronique est limitée dans le temps et est souvent plus courte que la durée de conservation des documents. En outre, la préservation des documents implique d’effectuer des copies sur des formats de données nouveaux ou plus pérennes. Une signature électronique ne peut alors, par définition, jamais être tout à fait préservée sur un fichier qui ne constitue pas une copie au sens strict du terme.

La meilleure solution consiste à valider les signatures électroniques avant leur expiration et de conserver comme métadonnées la date et le résultat (valide/invalide) de l’opération de validation.

Les métadonnées n’offrent pas les mêmes garanties qu’une signature électronique avancée ou qualifiée (voir cadre ci-dessous) mais, pour les archives fédérales belges, il n’y pas de problèmes :

  • pour les documents dont le délai de conservation légal est encore en cours le Code de droit économique prévoit que ces documents doivent être conservés au moyen d’un service d’archivage électronique qualifié (bien que l’entrée en vigueur de cet article ait été reportée pour le moment), lequel service doit appliquer les procédures et les technologies permettant de prolonger la fiabilité d’une signature électronique qualifiée jusqu’après la durée de validité technologique (voir le point a de l’annexe N1, qui fait référence à l’article 34 du règlement eIDAS).
  • pour les documents dont le délai de conservation légale a expiré et qui ne doivent plus être conservés qu’à des fins de recherche historique, les Archives de l’État se portent garantes de la fiabilité des métadonnées, et la fiabilité doit être la même que pour des documents, papier ou électroniques, qui ne comportent pas de signatures.
     

Trois types de signatures électroniques

Toutes les signatures électroniques ne se valent pas.

  • Une signature électronique de base est produite lorsqu’une signataire utilise l’une ou l’autre méthode pour signer électroniquement un document ou un formulaire, qu’on songe au fait de cocher une case, de griffonner des initiales avec la souris de l’ordinateur, de scanner une signature sur un document papier puis d’en coller la copie numérique sur un autre document…
  • Une signature électronique avancée permet au signataire de s’identifier d’une manière fiable et de certifier qu’un document est resté inchangé depuis qu’il a été signé.
  • Une signature électronique qualifiée remplit ces conditions et, en outre, est effectuée au moyen d’un outil qualifié et sur base d’un certificat de signatures électroniques qualifié.

Aucune de ces signatures ne peut être rejetée à la seule raison qu’il s’agit de signatures électroniques, mais seule une signature électronique qualifiée peut être parfaitement équivalente à une signature manuscrite.

Consultez cette page Web du SPF Économie pour plus de détails sur les différents types de signatures électroniques.

Faut-il supprimer les cryptages dans les documents PDF à transférer aux Archives de l’État ?

OUI.

Il est possible de limiter les traitements sur des documents PDF à l’aide de mots de passe ou en imposant l’identification des personnes autorisées : ouvrir un fichier, le modifier, ajouter ou extraire des pages, signer, remplir des champs…

Les Archives de l’État doivent cependant avoir accès à tous les aspects d’un document afin de pouvoir en assurer la gestion à long terme, sans devoir recourir au personnel du producteur d’archives ou à des mots de passe qui ont pu déjà avoir été oubliés.

C’est aussi pour cette raison qu’il vaut mieux enregistrer les fichiers destinés à être préservés au format PDF/A(-2) car, de cette façon, aucun cryptage n’est autorisé.

Question ou remarque ?

Contactez-nous.

www.belspo.be www.belgium.be e-Procurement