Sur les sites publics les plus visités, des PDF majoritairement inaccessibles

L’accessibilité de ces documents présents parfois massivement sur les portails publics luxembourgeois les plus visités en 2023 tend cependant à s’améliorer

vendredi 28 avril 2023


La présence sur les sites publics d’une grande quantité de fichiers PDF non accessibles est un problème clé pour les personnes handicapées. En effet, certains problèmes d’accessibilité peuvent bloquer totalement l’accès à l’information ou la mise en œuvre de procédures administratives dans le cas de formulaires. Nous étudions dans cet article l’accessibilité des PDF présents sur les 17 sites publics luxembourgeois les plus visités.

Photo d'une publication en cours d'impression sur une presse rotative
Photo : Getty Images / istockphoto.com / nyvltart

Lorsqu’un document PDF est numérisé comme une image ou non balisé, un utilisateur aveugle ou grand malvoyant n’a pas du tout accès à son contenu (pour plus de détails à ce sujet, voir l’article « PDF et accessibilité, la fausse bonne idée »).

L’étude

En avril 2023, le SIP a analysé un échantillon de fichiers PDF issus des 17 sites publics luxembourgeois les plus visités, d’après le Top 1 Million de Google :

  • adem.lu,
  • cita.lu,
  • gouvernement.lu,
  • govjobs.lu,
  • guichet.lu,
  • impotsdirects.public.lu,
  • inll.lu,
  • inondations.lu,
  • itm.lu,
  • lod.lu,
  • luxembourg.lu,
  • map.geoportail.lu,
  • meteolux.lu,
  • mobiliteit.lu,
  • petitions.lu,
  • portal.education.lu,
  • vdl.lu.

L’analyse a porté essentiellement sur les trois problèmes d’accessibilité les plus bloquants. Il existe bien entendu de nombreux autres problèmes d’accessibilité potentiels (voir le référentiel d'évaluation de l'accessibilité des documents au format PDF RAPDF pour l’ensemble des critères à respecter pour la production de PDF accessibles) mais le balisage est un prérequis. S’il est absent, un PDF est directement considéré comme non accessible.

Les résultats

Généralités

Nous avons analysé 25 398 fichiers PDF représentant un volume de 42 Go et plus de 471 000 pages. Les documents PDF représentent 95 % des fichiers bureautiques en téléchargement sur les sites analysés. Les 5 % restants sont essentiellement des documents issus de la suite Microsoft Office.

Sur l’ensemble des documents PDF disponibles en téléchargement, 46 % sont a priori exemptés de l’obligation d’accessibilité car publiés avant le 23 septembre 2018 (exemption prévue dans la loi du 28 mai 2019). Dans la suite de cet article, nous considérons uniquement les documents PDF qui sont soumis à l’obligation d’accessibilité, c’est-à-dire les formulaires et les documents publiés après le 23 septembre 2018.

Graphique 1. Répartition des PDF disponibles en téléchargement (voir description ci-dessous).
Description du graphique 1

Ce diagramme présente, sous forme d'une carte proportionnelle, la répartition des 25 398 fichiers PDF collectés dans le cadre de cette étude :

  • 13 715 PDF visés par la loi (54 %)
    • 5 623 balisés (22 % du total ou 41 % des fichiers visés par la loi)
      • 890 formulaires
      • 7 202 autres documents structurés
    • 8 095 non balisés (32 % du total ou 59 % des fichiers visés par la loi)
      • 1 295 fichiers numérisés en mode image
      • 728 formulaires
      • 6 069 autres documents non structurés
  • 11 683 PDF exemptés (46 %)

Concernant l’accessibilité de ces documents, nous avons détecté que 59 % sont non balisés. Parmi ces documents non balisés, 9 % sont des formulaires et 16 % sont des documents numérisés sur lesquels aucune reconnaissance optique de caractères n’a été réalisée.

Dans une autre perspective, si on étudie le balisage de l'ensemble des PDF en fonction de leur nature, on constate que 10 % des documents PDF environ sont des formulaires. Ces documents sont donc particulièrement importants car ils supportent des procédures administratives actives. 52 % d’entre eux ne sont pas balisés.

Point positif : très peu de documents sont protégés contre l’usage de technologies d’assistance (0,03 %).

Évolution temporelle
Graphique 2. Part des PDF non balisés par année (voir description ci-dessous).
Description du graphique 2

Ce diagramme en colonnes présente l'évolution sur quatre ans, de 2019 à 2022, de la part des PDF non balisés analysés dans le cadre de cette étude.

Graphique 3. Quantité de PDF publiés par année (voir description ci-dessous).
Description du graphique 3

Ce diagramme en colonnes présente l'évolution sur quatre ans, de 2019 à 2022, de la quantité des PDF publiés dans le cadre de cette étude.

En s’appuyant sur la date de dernière modification des fichiers étudiés, on peut identifier des tendances intéressantes sur les quatre dernières années. Si le nombre de documents publiés par année est en augmentation depuis 2019, la part des PDF non balisés est en diminution (de 64 % en 2019 à 53 % en 2022).

Si le nombre de PDF non balisés est encore bien trop élevé, notamment pour les formulaires, la tendance générale est à l’amélioration progressive de l’accessibilité des documents en téléchargement.

Comparatif des principaux sites
Graphique 4. Part des PDF balisés en pourcentage (voir description ci-dessous).
Description du graphique 4

Ce diagramme en lignes présente, dans huit sites couverts par l'étude, la part des documents PDF balisés.

On constate d’importantes disparités entre les sites quant à la part des PDF balisés. Nous avons analysé ici les sites ayant plus d’une centaine de fichiers PDF à disposition. Guichet.lu est en tête de peloton avec 82 % et meteolux.lu ferme la marche à seulement 3 %.

Ces résultats sont néanmoins à nuancer, car nos tests automatiques ne permettent pas de savoir si les documents considérés sont exempts de l’obligation de conformité avec les normes d’accessibilité. En effet un document peut être émis par un tiers et ne pas être sous le contrôle de l’organisme qui publie, ou bien une alternative accessible peut être présente. Ces deux exceptions sont prévues dans la loi.

Impact du mode de production

Nous avons ensuite voulu connaitre l’origine des fichiers balisés et non balisés. Fort heureusement le format PDF dispose de métadonnées « Creator » et « Producer » qui permettent d’identifier la provenance.

Vous trouverez ci-dessous les Top 5 des logiciels et matériels que nos tests ont pu identifier et qui ont produit le plus de documents balisés et non balisés :

Top 5 des producteurs de PDF balisés
  1. Microsoft Word
  2. Adobe Acrobat PDFMaker
  3. Adobe InDesign
  4. Adobe LiveCycle Designer
  5. Microsoft Powerpoint
Top 5 des producteurs de PDF non balisés
  1. Adobe InDesign
  2. Konica Minolta
  3. Pscript5.dll (Acrobat Distiller ou GhostScript)
  4. Microsoft Print to PDF
  5. Adobe Acrobat

On note tout de même une part importante (35 %) des fichiers dont on n’a pu identifier l’origine via leurs métadonnées.

Les principaux producteurs de PDF non balisés sont le logiciel de PAO InDesign, des scanners et la fonctionnalité d’impression en PDF incluse dans la plupart des systèmes d’exploitation récents.

Graphique 5. Part des PDF numérisés en mode image parmi les non balisés en pourcentage (voir description ci-dessous).
Description du graphique 5

Ce diagramme en lignes présente, dans six sites couverts par l'étude, la part des documents PDF numérisés en mode image parmi les non balisés, en pourcentage.

La prévalence de documents numérisés en images sur les sites publics est variée. Leur nombre est très faible sur un site comme guichet.lu (2 % des PDF non balisés sur ce site) mais très important sur celui de la Ville de Luxembourg (52 % des PDF non balisés du site).

Analyse des déclarations d’accessibilité

Tout site public est soumis à l’obligation de publier une déclaration d’accessibilité. Celle-ci est généralement disponible via un lien « Accessibilité » présent dans le footer de chaque page. Les organismes en charge de ces sites doivent y décrire le niveau d’accessibilité atteint ainsi que les problèmes d’accessibilité dont l’organisme a connaissance. Nous avons cherché à savoir si ces organismes ont conscience des problèmes d’accessibilité éventuels des fichiers PDF qu’ils publient.

11 sites sur les 17 étudiés disposent d’une déclaration d’accessibilité. Parmi ceux-ci :

  • 8 invoquent une exemption prévue par la loi pour les documents anciens (4) ou pour les documents provenant de tiers (7).
  • 7 invoquent une exemption pour charge disproportionnée : les travaux de mise en conformité de leurs documents PDF seraient trop coûteux par rapport au bénéfice estimé pour les citoyens.
  • 3 mentionnent les PDF comme une non-conformité qui sera corrigée.

Aucune de ces déclarations ne permet d’identifier de manière précise quels PDFs sur leurs sites ne sont pas accessibles.

La majorité des organismes responsables de ces sites ont donc connaissance du problème mais ne sont pas nécessairement en mesure de le résoudre de manière simple.

Comment rendre les documents PDF accessibles ?

Comme nous l’avons vu ci-dessus, les trois premiers producteurs de PDF non balisés sont un logiciel de PAO, les scanners et la fonction d’impression en PDF. Il nous semble donc important de sensibiliser et former les équipes en charge de la production de brochures. Si celle-ci est externalisée, il doit être possible d’inclure dans la demande la prise en compte de l’accessibilité (voir notre page relative aux cahiers des charges).

Il serait aussi pertinent de mettre en place des processus permettant de gérer l’accessibilité des documents numérisés (étapes d’OCR et de balisage ou fourniture d’une alternative accessible comme le document source avant impression et numérisation) et enfin de sensibiliser les administrations pour éviter le plus possible le recours à la fonction d’impression en PDF et de privilégier l’export en PDF qui, lui, produit des documents balisés.

Pour aller plus loin et travailler sur l’accessibilité des PDF produits, le SIP met à disposition le référentiel RAPDF, qui présente l’ensemble des critères à respecter, et propose pour le secteur public une formation intitulée « Accessibilité des documents PDF par la pratique ». Si vous êtes concernés, n’hésitez pas à vous y inscrire.