Groupe de travail UIESP-CODATA sur les vocabulaires FAIR

  

Le Conseil de l'UIESP a approuvé la création d'un comité scientifique sur les vocabulaires FAIR pour la recherche démographique, initiative conjointe avec CODATA, le Comité de données pour la science et la technologie du Conseil international pour la science.  Le comité est coprésidé par George Alter (University of Michigan, UIESP) avec Arofan Gregory (DDI Alliance) et Steven McEachern (Australian National University et DDI Alliance) pour CODATA. 

 

Ce comité répond au mouvement de plus en plus large visant à rendre les données « faciles à trouver, accessibles, interopérables et réutilisables » (FAIR).  La recherche démographique repose sur une base empirique avec une longue tradition de collecte de données largement partagées et facilement accessibles.  Selon les principes FAIR, cette tradition peut être renforcée en s’appuyant sur les normes et technologies émergentes. Ce comité se consacrera au développement de vocabulaires FAIR pour les données de population, une étape essentielle pour rendre les données réutilisables et interopérables.  

 

Les vocabulaires FAIR permettent de combiner des données provenant de sources différentes. Prenons l'exemple de la variable la plus fondamentale de l'analyse démographique : l'âge.  L'OCDE dispose d'une liste de 643 catégories d'âges, tandis que la Division de la population des Nations unies gère plus de 1 100 groupes d'âges.  Si la signification des variables d'un ensemble de données n'est disponible qu'à travers une documentation lisible par l'homme, comme un pdf, l'harmonisation des données provenant de deux sources reste un processus manuel fastidieux. Mais, si les catégories d'âges sont liées à des identifiants permanents dans des métadonnées exploitables par une machine, un logiciel peut permettre d’harmoniser les groupes d'âges.  Si ces opérations sont effectuées sur des dizaines de variables dans des centaines de sources de données, d'énormes quantités de temps humain seront économisées.

 

En coopération avec CODATA, ce nouveau comité de l'UIESP s'appuiera sur le travail du groupe FAIR Vocabularies, qui a récemment publié Ten Simple Rules for making a vocabulary FAIR”.  La plupart des conseils sont simples, comme « Déterminer les dispositifs de gouvernance et l’entité garante du vocabulaire d’origine ». Mais certaines étapes nécessitent une expertise spécialisée dans les normes telles que le système simple d'organisation des connaissances (SKOS) ou le langage d'ontologie Web (OWL).  Les termes FAIR devront également être maintenus dans le temps, ce qui demande des institutions durables pouvant assurer les technologies nécessaires.  Le comité prendra conseil auprès des membres du FAIR Vocabularies Group, présidé par Simon Cox (CSIRO Australie), et auprès d’experts d'autres domaines scientifiques qui seront invités à évaluer les stratégies alternatives (par exemple, centralisé contre fédéré) et les logiciels. 

 

L'objectif est de travailler avec trois à cinq partenaires dans des organisations internationales et des universités pour convertir les vocabulaires existants aux principes FAIR.  Le groupe accordera une attention particulière à la coordination avec les initiatives existantes, comme le référentiel terminologique soutenu par Statistical Data and Metadata eXchange (SDMX).

 

Le but final de cette initiative est de rendre les données démographiques plus interopérables en publiant des vocabulaires contrôlés qui peuvent être trouvés et utilisés par les logiciels.  Cela pourrait réduire considérablement les coûts de fusion des données provenant de sources multiples pour les chercheurs qui cherchent à utiliser des données démographiques.  Le Comité déterminera s’il faut un développement technique supplémentaire et dans quels cas l'implication de la communauté des démographes à travers l'UIESP ou d'autres organisations peut être utile.  Un plan de travail sur deux ans sera proposé.

 

Les membres désireux d'en savoir plus sur cette nouvelle initiative ou de participer aux travaux de ce Comité scientifique sont invités à contacter George Alter (FAIRvocab@iussp.org).