La mise en valeur du patrimoine culturel passe aujourd’hui entre autres par le numérique. Dans cette démarche a été lancé le projet de valorisation de photographies d’archéologie classique conservées par l’Université de Strasbourg.
En intĂ©grant ces images dans la mĂ©diathèque libre Wikimedia Commons, l’objectif est double : offrir un accès Ă ces ressources sur l’encyclopĂ©die WikipĂ©dia et faire le lien vers la bibliothèque Numistral et valoriser les mĂ©tadonnĂ©es associĂ©es en prĂ©sentant des fiches d’une grande richesse.
Numistral et fond d’archĂ©ologie classique
Numistral est « la bibliothèque numérique patrimoniale du site universitaire alsacien et de ses partenaires ».

Ouvert en octobre 2013 comme bibliothèque numĂ©rique patrimoniale de la Bibliothèque nationale et universitaire de Strasbourg (Bnu), il a Ă©voluĂ© pour devenir, dans le cadre du contrat de site alsacien 2013-2017, le portail d’accès aux collections documentaires numĂ©risĂ©es des Ă©tablissements d’enseignement supĂ©rieur et de recherche alsaciens (Bnu, UniversitĂ© de Haute Alsace et UniversitĂ© de Strasbourg), ainsi que de leurs partenaires. Depuis 2022, il s’Ă©largit Ă de nouveaux partenaires relevant de collectivitĂ©s territoriales, parmi lesquels la Bibliothèque municipale classĂ©e de Mulhouse.
La collection de photographies anciennes d’archéologie classique de l’Université de Strasbourg comprend plus de 12 500 tirages papiers dont 1800 environ proviennent de la collection personnelle du fondateur et premier directeur de l’Institut d’Archéologie classique (Kunstarchäologisches Institut) Adolf Michaelis (1835-1910) qui fut acquise par l’université au lendemain de sa mort.
– Extrait de la page « Histoire » du site internet de Numistral.
Impulsion
L’initiative de valorisation a Ă©tĂ© prise par le service de la bibliothèque numĂ©rique patrimoniale de Strasbourg. L’idĂ©e est d’intĂ©grer ces photographies – qui sont maintenant dans le domaine public – sur Wikimedia Commons, afin de les rendre accessibles Ă un large public et de pouvoir les ajouter sur WikipĂ©dia.
Le projet a nécessité un choix méthodologique afin de le rendre viable dans le temps. L’outil retenu pour l’importation des fichiers en masse est Pattypan, une application open source conçue pour faciliter le transfert d’images vers Wikimedia Commons.
Une fois les fichiers récupérés auprès du service, il a fallu compléter et structurer les métadonnées en amont de l’importation, sous forme de tableurs. Pour garantir une qualité optimale, l’ensemble du processus s’est déroulé par vagues successives, permettant des ajustements en cours de route.
Concrètement ?
Concrètement, les Ă©tapes semblent simples. Il suffit de gĂ©nĂ©rer avec Pattypan les tables d’import Ă partir des fichiers. Ensuite, il faut complĂ©ter toutes les colonnes de mĂ©tadonnĂ©es : auteur·e ; date ; technique ; catĂ©gories Commons…
Les catégories Commons
Oui, il faut Ă©galement complĂ©ter les catĂ©gories Commons pour que les fichiers ne soient pas perdus dans la mĂ©diathèque. Le fameux F du principe FAIR : findable. Pour celles et ceux qui ne connaissent pas Wikimedia Commons, disons que les catĂ©gories sont comme des poupĂ©es russes. Une catĂ©gorie peut elle-mĂŞme ĂŞtre rangĂ©e dans une autre, et ainsi de suite, pour former des arborescences de rangement, Ă l’instar de dossiers sur un ordinateur.
Prenons un exemple, avec cette image d’un forum romain.

Cette image est placĂ©e dans deux catĂ©gories, « Rome dans le fond Adolf Michaelis sur Numistral » et « Historical images of Tabularium (Rome) ». Mais ces catĂ©gories sont placĂ©es dans d’autres catĂ©gories. On se retrouve rapidement avec un arbre de ce type :

Concentrons-nous rapidement sur les catĂ©gories en gras pour constater que, pour chaque branche, c’est un enchainement de dizaines, voire de centaines de catĂ©gories. Voici le schĂ©ma d’une branche de catĂ©gories Commons, allant de « Works of art » à « Historical images of Tabularium (Rome) ».

La règle pour rendre les fichiers trouvables est d’ajouter toujours la catĂ©gorie la plus prĂ©cise Ă l’image. En effet, on ne va pas catĂ©goriser cette image avec « Architecture », concept qui est bien trop large.
Il apparaĂ®t donc la première difficultĂ© de ce projet : trouver les catĂ©gories optimales pour les 500 images concernĂ©es, sans passer manuellement sur chacune d’entre elles.
Complétion des catégories
Ainsi, j’ai utilisĂ© les mĂ©tadonnĂ©es existantes pour en extraire des “sujets”. Pour cette image par exemple, voici un extrait des donnĂ©es dont je disposais :
Titre en français | Sujet | Subject |
Forum Romain : vue gĂ©nĂ©rale depuis le Palatin | Rome (Italie) — Foro romano | Roman Forum (Rome, Italy) |
L’idĂ©e Ă©tait alors d’utiliser le logiciel OpenRefine pour rĂ©concilier les sujets avec Wikidata. Ici, « Foro romano » est rĂ©conciliĂ©. Et depuis Wikidata, il est possible de rĂ©cupĂ©rer les catĂ©gories Wikimedia Commons correspondantes.
Il faut tout de mĂŞme garder Ă l’esprit que cette technique n’est pas infaillible et que la prĂ©cision peut ĂŞtre inexacte.  Ainsi, un passage manuel sera probablement nĂ©cessaire, mais ce travail peut ĂŞtre laissĂ© Ă la communautĂ© bĂ©nĂ©vole Wikimedia Commons.
Import des images
Les tableaux Ă©tant maintenant complets, l’import peut commencer ! Pour cela, rien de plus simple, il suffit de donner Ă Pattypan les chemins d’accès aux fichiers et le tableau, et il s’occupe de tout.
Une fois les premières images importĂ©es, une nouvelle rĂ©union a eu lieu pour faire le point. Une chose Ă©tait manquante : les liens directs vers les images dans la bibliothèque numĂ©rique Numistral. Un autre dĂ©fi, puisque les liens ne font aucune correspondance avec le numĂ©ro d’inventaire de l’image.
Pour rester sur le même exemple, notre image de forum romain est accessible au lien http://cdm21057.contentdm.oclc.org/cdm/ref/collection/coll4/id/493. La structure du lien est toujours la même, mais le nombre de fin, ici « 493 », change et ne peut pas être deviné à partir des métadonnées. Un vrai casse-tête !
Récupération des liens et alignement
Alors pour rĂ©soudre ce problème, j’ai tentĂ© un petit coup de magie. Après avoir listĂ© les liens « probables », c’est Ă dire tous les liens avec des numĂ©ros qui se suivent, j’ai rĂ©cupĂ©rĂ© les pages web associĂ©es, en faisant un moissonnage informatique Ă l’aide de OpenRefine.
Une fois tous les codes sources rĂ©cupĂ©rĂ©s depuis les liens, j’ai isolĂ© la partie qui comporte le numĂ©ro d’inventaire. Dans le code, on retrouve le numĂ©ro d’inventaire (en gras ci-dessous) comme ceci :
{\"key\":\"titlea\",\"label\":\"Num\u00E9ros d'inventaire\",\"controlledVocab\":false,\"searchable\":true,\"value\":\"It.I.A.a.3\",\"controlledVocabList\":null}
Avec un coup de baguette magique (toujours grâce Ă OpenRefine) pour isoler les numĂ©ros, il a ensuite Ă©tĂ© possible de mettre en parallèle les liens directs avec les numĂ©ros d’inventaire.
Comme on aime le dire dans la communauté wikimédienne : « OpenRefine is magic » !

Ne reste ensuite plus qu’Ă ajouter ces liens sur les fiches dĂ©jĂ importĂ©es grâce Ă Pattypan et les intĂ©grer aux imports suivants.
Finalité et accueil de la communauté
Au final, ce sont plus de 500 photographies d’archĂ©ologie classique qui ont Ă©tĂ© importĂ©es sur Wikimedia Commons, pour un projet ayant durĂ© plus de 6 mois, entre toutes les rĂ©unions, le traitement des donnĂ©es et la vĂ©rification manuelle des liens directs.
La communautĂ© wikimĂ©dienne a Ă©tĂ© informĂ©e par une publication sur Le Bistro de WikipĂ©dia le 10 mars 2025, les invitant Ă s’approprier le fond pour illustrer l’encyclopĂ©die.
L’accueil de ce projet par les bĂ©nĂ©voles fait du bien !
