Nouvelles méthodes de transcription, de visualisation, de publication et d'accès aux données sur les épidémies et les maladies contagieuses
En ligne, le 18 juin 2025
Cet atelier interdisciplinaire « New Ways of Transcribing, Visualizing, Publishing, and Providing Access to Data on Epidemics and Contagious Diseases » s'est tenu en ligne le 18 juin 2025, organisé par l'Institute of Evolutionary Medicine de l'Université de Zurich et le professeur Kaspar Staub, au nom du Comité scientifique de l'UIESP sur « Épidémies et maladies contagieuses : l'héritage du passé ».
L'atelier a réuni un groupe international de 48 chercheur·es des domaines des données, de l’histoire et de la santé publique pour explorer les méthodes de pointe en matière de numérisation, de visualisation et de partage de données historiques sur les épidémies. L'événement visait à favoriser les collaborations et à partager les innovations dans la gestion, l'interprétation et la mise à disposition de données structurées et non structurées issues de sources historiques manuscrites et imprimées.
Visionnez la vidéo complète de l'atelier :
Description de l’atelier :
Allocution d'ouverture
Kaspar Staub a souhaité la bienvenue aux participants et a rappelé l’objectif de l'atelier, qui est de promouvoir les échanges méthodologiques et le développement d'une communauté de chercheurs travaillant sur les données épidémiques historiques et contemporaines.
Séance I : Innovations en matière de transcription et de visualisation
Vijay Kumar (Inde) a ouvert la séance par un aperçu des innovations numériques permettant une transcription et une visualisation géospatiales plus précises des données épidémiques. Il a souligné l'intérêt des plateformes de données ouvertes et des outils d'IA pour la planification et la recherche en santé publique, notamment dans le contexte des archives administratives indiennes.
Moana Rarere (Nouvelle-Zélande) a présenté une nouvelle perspective démographique pour les populations maories du XIXe siècle. Ses travaux remettent en question les hypothèses de l'époque coloniale et intègrent les récits oraux aux documents écrits pour remodeler notre compréhension de l’histoire démographique.
Gaurav Raj (Inde) a démontré comment les approches basées sur Python peuvent révéler des modèles à partir des archives épidémiques historiques, notamment en automatisant l'extraction de données à partir de sources numérisées et en intégrant divers ensembles de données pour la modélisation analytique.
Séance II : Standardisation, surveillance et intégration en santé publique
Gabi Wuethrich (Suisse) a présenté l’application des lignes directrices de la Text Encoding Initiative (TEI) aux statistiques historiques numérisées. Son exposé a porté sur les défis liés à la conversion de données tabulaires en formats « FAIR » (données "Faciles à trouver, accessibles, interopérables et réutilisables"), notamment à partir de sources manuscrites ou numérisées.
Grace Kim (États-Unis) a partagé des informations issues de projets reliant les données climatiques et sanitaires pour améliorer les systèmes d’alerte précoce. S’appuyant sur des initiatives de surveillance du paludisme et du climat, elle a souligné le rôle de l’intégration interdisciplinaire pour une réponse de santé publique en temps réel.
Pamela R. Chacon Uscamaita (États-Unis) a présenté une plateforme de surveillance du paludisme dans le bassin amazonien. Les travaux de son équipe combinent modélisation prédictive, télédétection et tableaux de bord interactifs pour suivre la propagation de la maladie et éclairer les interventions.
Séance III : Transcription à grande échelle et rôle de l’automatisation
Tobias Hodel et Jan Blarer (Suisse) ont détaillé les meilleures pratiques pour le traitement à grande échelle des registres de décès manuscrits. Leur exposé a mis l’accent sur les flux de travail impliquant l’intervention humaine, qui combinent l’apprentissage automatique et l’expertise archivistique pour le contrôle qualité.
Mads Perner (Danemark) a exploré la transition épidémiologique de Copenhague à travers l'analyse spatiale des causes de décès et des déclarations de maladies du XIXe au début du XXe siècle, soulignant l'intérêt des systèmes intégrés de cartographie et de registres.
Joana Maria Pujadas Mora et Adrià Molina (Espagne) ont présenté des outils de transcription automatisée pour le traitement des données démographiques. Ils ont mis l'accent sur l'accessibilité et la reproductibilité, montrant comment l'apprentissage automatique peut démocratiser le traitement des données démographiques historiques.
Christian Møller Dahl (Danemark) et Rick Mourits (Pays-Bas) ont conclu la séance par un résumé d'un récent atelier sur la transcription automatique. Ils ont examiné de manière critique les atouts et les limites de l'automatisation pour le traitement de vastes données individuelles de mortalité, appelant à l'amélioration des indicateurs d'évaluation et à une analyse comparative collaborative.
Remarques finales
Kaspar Staub a conclu l'atelier en encourageant les participants à poursuivre leur collaboration et a appelé à des réunions de suivi et des projets communs.
Cet atelier a mis en lumière l'évolution de notre façon de traiter les données épidémiques: de la transcription manuelle aux pipelines automatisés, et des archives isolées aux écosystèmes de données ouvertes et interopérables. Les contributions ont mis en lumière à la fois les promesses et la complexité de l'intégration des données de santé historiques à l'ère numérique.