Archives de l'État en Belgique

Notre mémoire à tous !

Menu

Formats de fichiers durables

Texte petit  Texte normal  Texte grand

Tout comme les supports d’enregistrement, les formats de fichiers évoluent. Il importe de choisir un format durable pour éviter que les fichiers ne deviennent inaccessibles avant que leur utilité administrative, juridique ou historique ne soit révolue.

Qu’est-ce qu’un format de fichier ?

Les fichiers numériques se composent d’une série de 0 et de 1 (une séquence binaire), dont la signification dépend du format de fichier. Celui-ci indique comment la série a été générée et comment elle peut être déchiffrée. Le format est une convention indiquant comment les ordinateurs doivent lire une séquence binaire.

Le format de fichier contient donc des informations essentielles.

Qu’est-ce qu’un format de fichier durable ?

Aucun format de fichier n’est garanti pour l’éternité, mais la durabilité augmente si le fichier présente les caractéristiques suivantes :

  • Ouvert
    Contrairement aux formats fermés, un format ouvert est public et libre, de sorte que toute la communauté informatique peut développer des applications pour ce format.
     
  • Indépendant
    Contrairement aux formats propriétaires, le format indépendant n’est pas contrôlé par une personne ou une entreprise. On n’est donc pas dépendant d’autrui ou d’un abonnement pour la création, la lecture ou la conversion de fichiers dans ce format.
     
  • Largement répandu
    Pour la lecture et la gestion des formats très répandus, il existe généralement de nombreux outils, contrairement aux formats obscurs ou de niche. S’il est très répandu, un format fermé et/ou propriétaire, comme pdf ou tiff, peut être préférable à un format ouvert.
     
  • Indépendant d’une plateforme
    Contrairement aux formats spécifiques pour une plateforme, les formats indépendants d’une plateforme peuvent être ouverts avec tous les systèmes d’exploitation communs (Windows, Mac et Linux).
     
  • Non comprimé
    Par rapport aux fichiers comprimés, les fichiers non comprimés sont moins sujet à la dégradation des données (bit rot). Le risque qu’ils deviennent illisibles suite à la modification d’un seul bit est nettement moindre.
     
  • Non composé
    Par rapport aux formats « conteneurs » (wrappers), les fichiers non composés peuvent être contrôlés plus facilement et il est plus aisé de les convertir si leur lisibilité est compromise.
     
  • Standardisé
    Par rapport aux formats non standardisés, l’avenir et la diffusion des formats décrits dans une norme sont mieux garantis.

Quels sont les formats de fichier durables ?

Dans le tableau ci-dessous vous trouverez les extensions des formats de fichier adaptés à une conservation à long terme, répartis en deux catégories : les formats conseillés et les formats acceptables.

Type d’information

Formats conseillés

Formats acceptés Explications
Documents textuels

odt, txt1

docx, epub3, pdf/a2

1 Utiliser le format d’encodage ASCII ou UTF-8.

2 Dans toute la mesure du possible, utiliser pdf/a-2 (en enregistrant par exemple les documents avec PDFCreator). Ne pas utiliser pdf/a-3, car ce format peut embarquer des fichiers de tous formats (durables ou non).

Les objets numériques indispensables tels que des tables et des images doivent toujours être conservés séparément du fichier pdf/a, afin de garantir leur conservation à long terme. Les responsables de l’information doivent contrôler la conformité des fichiers pdf à l’aide d’outils de validation et, si nécessaire, adapter les workflows pour éviter la génération systématique de fichiers pdf/a non conformes. (Plus d’info sur la page PDF comme format de conservation.)

Présentations

odp, odt

pdf/a1, pptx

Les illustrations importantes, les vidéos, les sons, etc. seront conservés et gérés séparément.

1 Voir ci-dessus. Ne pas opter pour le pdf/a si ce format entraîne une perte d’information, par exemple l’information liée aux effets.

Feuilles de calcul

csv, ods

pdf/a1, xlsx, xml

Les formules seront dans toute la mesure du possible remplacées par des valeurs fixes. Les macros doivent être désactivées par mesure de sécurité.

1 Voir ci-dessus.

Bases de données

csv, odb, sql, xml

accdb, mdb, siard

La méthode appropriée dépend du type de base de données.

La façon de traiter une base de données sera toujours étudiée en concertation avec les Archives de l’Etat avant le transfert.

Les tables liées à la base (par exemple les numéros de registre national) doivent être transférées avec la table ou rester accessibles. La documentation sur la base de données sera en outre livrée lors du transfert, pour conserver la compréhension correcte de la structure, des triggers, des fonctions, de la visualisation, des sources externes etc.

Les fichiers intégrés, tels que des images, seront conservés séparément.

Dans toute la mesure du possible, on utilisera le codage de caractères UTF-8.

Emails

eml

msg, mbox1, xml2

En fonction de la stratégie d’archivage des emails.

1 Uniquement en tant qu’alternative à pst. Eml est à privilégier !

2 Avec la DTD ou le schéma xml. Peut être généré sur base d’autres formats à l’aide d’outils tels Aid4Mail.

Images normales (2D)

dwg1, svg2, tiff3

cgm, dng, jp2, jpeg, jpg, odi, odg, png

1 DWGDirect.

2 Format d’encodage UTF-8.

3 Non comprimé. Le meilleur de tous les formats : tiff 6.0.

Images 3D, dessins CAO, modèles BIM

dxf, ifc, odg, svg1, x3d2

dwf, dwg

1 Format d’encodage UTF-8.

2 Basé sur xml ou vrml.

Données géographiques

(geo)tiff, gml

geojson, kml1

Livrer aussi toutes les métadonnées géographiques nécessaires (notamment le système de projection utilisé).

1 Xml, pas de conteneur (container).

Audio

bwf, oga, ogg1, wav2

aac, aiff2, flac, mp3, productieversie

1 Codage du flux audio VORBIS.

2 De préférence (pour l’audio dans les vidéos exclusivement) avec le codage PCM.

Vidéo

dpx, mxf1

avi1, mkv2, mov3, mp44, ogg5

Pour l’audio dans les vidéos: voir ci-dessus.

Suivre les standards industriels.

Eviter la compression.

1 Avec des images JPEG 2000 sans perte.

2 Avec codec vidéo mpeg-4-AVC(H.264) et codec audio FLAC.

3 De préférence avec sous-échantillon chroma 4:2:2.

4 Avec codec vidéo mpeg-4-AVC(H.264) et codec audio mpeg-4-AAC.

5 Avec codec vidéo THEORA et codec audio VORBIS.

Sites web

warc1 ou code source: html, css, js…

 

En fonction du site web et de vos besoins : plus d’infos.

1 Les fichiers téléchargeables et à conserver seront conservés séparément.

Que faut-il faire avec les formats de fichiers qui ne figurent pas dans le tableau ?

Pour tous fichiers qui doivent être conservés pendant plus de cinq ans il convient de faire une copie de conservation dans un format durable. Si un seul format durable n’est pas suffisant pour sauvegarder à la fois les aspects textuels et les autres aspects du fichier, faites des copies de sauvegarde dans plusieurs formats.

Conservez également le fichier original, pour le cas où des copies de conservation ou de consultation supplémentaires seraient nécessaires et pour garder ouverte la possibilité d’émulation.

Un tableau des formats de conservations (modèle), reprenant les séries numériques destinées à une conservation permanente ou ayant un délai de conservation de 5 ans ou plus (voir le tableau de tri de votre institution) ainsi que les formats de conservation nécessaires permettra de développer une approche systématique.

En créant les fichiers directement dans des formats durables, vous éviterez de devoir en faire et conserver à court terme de nouvelles versions pour assurer la lisibilité des données. Le choix de certains formats de fichiers doit être fait au niveau du service ou de l’organisation, et non individuellement.

Les Archives de l’Etat refusent-elles les formats de fichiers qui ne figurent pas dans le tableau ?

Les Archives de l’État ne refuseront que les fichiers qui ne sont plus lisibles (c’est-à-dire consultables avec un logiciel facilement disponible) au moment où ils sont présentés. Les formats figurant dans le tableau ne sont donc pas les seuls qui peuvent être transférés. En tant que producteur d’archives, vous êtes responsable de la lisibilité des fichiers jusqu'à ce qu’ils soient transférés

Selon que nous sommes ou non familiarisés avec le format, des explications supplémentaires peuvent être nécessaires pour nous permettre de conserver correctement les fichiers après leur transfert : par exemple avec quel logiciel les fichiers ont-ils été créés ? Comment les consulter ? ...

Par ailleurs, pour des raisons administratives et juridiques, la plupart des archives doivent d’abord être conservées par le producteur des archives lui-même pendant un temps considérable. (Le délai de transfert par défaut est de 30 ans et de délai de conservation administratif de nombreuses séries est encore plus long). Il est donc aussi et surtout dans l’intérêt de votre organisation d’utiliser des formats de fichiers durables.

Lors de la préparation d’un transfert, faut-il convertir certains fichiers ?

Non, vous ne devez plus effectuer de conversions à l’approche d’un transfert.

Si vos fichiers n’existent pas encore dans un format durable, nous en ferons une copie de conservation durable après le transfert. À cet effet, il nous faudra toutefois quelques informations, telles que les relations entre les tables d’une base de données, les types de fichiers intégrés dans un pdf, etc. Nous vous demanderons ces informations avant tout transfert.

Comment convertir un format de fichier ?

Cela dépend des formats source et cible, de l’ampleur de la conversion (fichiers uniques ou en vrac) et de la familiarité du gestionnaire d’informations avec le travail en mode lignes de commande.

Vous trouverez un aperçu actualisé des outils de conversion dans la base de données COPTR.

Qui est responsable ?

Le choix des formats d’enregistrement et des copies de conservation n’est pas une responsabilité individuelle. Il convient que le service ICT ou le responsable des informations de votre service définisse une stratégie pour décider quels formats il faut utiliser et veille à (faire) réaliser les copies de conservation.

Les Archives de l’État peuvent vous prêter assistance.

Modifions-nous le format des fichiers que vous avez transférés ?

  • Les formats originaux sont toujours conservés.
  • Si nécessaire, nous réalisons une conversion vers une copie de conservation durable.
  • Pour les fichiers consultables par le public, il se peut que nous fassions une copie de consultation qui réponde mieux aux besoins des utilisateurs (format de fichier plus léger, lisible avec les logiciels communs, etc.)
  • En outre, nous réalisons des back-ups conservés sur des sites différents. Les fichiers corrompus, touchés par exemple par le ‘bit rot’ (dégradation) seront remplacés par une copie d’un fichier du back-up.

Des questions ou remarques ?

www.belspo.be www.belgium.be e-Procurement