Rapport sur la conférence CODATA 2019

Vers une nouvelle génération de la science des données: politiques, pratiques et plateformes

 

Pékin, 19-20 septembre 2019

Tom Emery – NIDI

 

Dans le cadre des activités de l'UIESP sur la Révolution des données, Tom Emery, membre de l'UIESP, a représenté l'Union à la conférence CODATA* 2019 qui s'est tenue à Pékin les 19 et 20 septembre. Il était l'un des rares représentants des sciences sociales parmi les 200 délégués participant à la réunion, dont la plupart étaient issus de la géologie et de la santé ainsi que de la chimie et de la physique. Il a présenté le travail d'ODISSEI (Open Data Infrastructure for Social Science and Economic Innovations) et a expliqué aux participants les étapes nécessaires pour rendre les données démographiques plus conformes aux normes FAIR (Findable, Accessible, Interoperable, and Reusable). La conférence était fortement axée sur la mise en œuvre des normes FAIR dans diverses disciplines et sur la façon dont ces normes pourraient véritablement soutenir la recherche interdisciplinaire.

 

La démographie est en retard dans la définition de taxonomies et de normes 

Il ressort de la conférence et d’autres travaux que l’élaboration et l’adoption de normes universelles en démographie sont en retard sur celles d’autres domaines. La démographie a des définitions précises et standardisées de concepts primaires tels que l'ISF, l'espérance de vie, les flux d'immigrants permanents, etc., mais celles-ci ne sont pas lisibles par des machines comme le sont les définitions standards ISO pour l'éducation (CITE) ou la professions (CITP). C’est un problème car cela entrave sérieusement  l'interopérabilité des systèmes de données démographiques au sein de la démographie mais aussi en interaction avec les infrastructures de recherche d'autres domaines.

 

Un bon exemple de ce problème d'interopérabilité est la série chronologique des Nations Unies sur l'indice synthétique de fécondité (ISF) pour tous les pays du monde dans les World Population Prospects 2012, comme décrit à l'adresse https://rdrr.io/cran/wpp2012/man/tfr.html. Le pays et la région sont définis à l'aide des normes ISO, ce qui rend l'interopérabilité facile et il est aisé d’accéder aux données et de les récupérer. Cependant, l’ISF ne suit pas une norme pour laquelle la définition et le calcul de l’indicateur sont bien décrits et associés à un identifiant permanent qui les rattache à une norme accréditée. En comparaison, la génétique, la biologie et l'astrophysique ont des normes clairement convenues, approuvées et vérifiables.

 

Les démographes se sont assez bien entendus sur les définitions, en particulier en collaboration avec les bureaux de statistique, mais l'interopérabilité pourrait être améliorée avec une certaine formalisation. La Classification internationale type des professions (CITP) et la Classification internationale type de l'éducation (CITE) sont de bons exemples de concepts en sciences sociales bien définis.

 

Toutes les disciplines représentées à la conférence ont présenté des systèmes de données utilisant et exploitant des bases standardisées. Sans une telle standardisation, la démographie aura du mal à tirer parti de l'Open Science Agenda et des principes FAIR.

 

Les Objectifs de développement durable et l'Unesco

L'influence de l'Unesco sur CODATA est évidente dans les volets de la conférence portant sur la nutrition et la gestion des catastrophes. Dans ces volets, les contributions en sciences sociales étaient peu nombreuses. Les orateurs ont mis en avant les données nécessaires pour suivre les Objectifs de développement durable (ODD), mais les objectifs considérés concernaient essentiellement les sciences physiques (comme le changement climatique, la prévention des maladies, la malnutrition). Les objectifs à dimension sociale (ODD 3, 4, 5, 8, 10, 16) ont été largement ignorés. Jusqu'à présent, La fusion entre le Conseil international des unions scientifiques (CIUS) et le Conseil international des sciences sociales (CISS) n'a, semble-t-il, pas donné aux sciences sociales une place plus importante dans l'agenda de l'Unesco. La Commission européenne, la National Science Foundation (NSF) et de nombreuses autres sources de financement étaient largement représentées à la conférence et il est clair que l’Unesco a une grande influence dans l’orientation des investissements pour la science ouverte.

 

Initiative Belt and Road, recherche scientifique et données

La conférence ayant lieu à Pékin, les contributions chinoises au programme et à l'ordre du jour ont été importantes, avec des références fréquentes à l’Initiative Belt and Road (BRI). Celle-ci est un programme d'investissement coordonné par le gouvernement chinois et visant à développer les infrastructures commerciales dans la région « Asie de l'Est » et au-delà. Une proportion importante des investissements dans Belt and Road se fera dans des domaines liés à la recherche. Par exemple, plusieurs présentations en géologie ont fait référence au nouveau réseau satellitaire chinois financé par la BRI. Les représentants chinois ont indiqué que les collaborations dans la collecte et le traitement des données dans le cadre de la BRI relevaient de l'Open Science Agenda. Il était assez clair que le soutien à la collecte, au traitement et à la mise à disposition des données démographiques pourrait également être éligible au titre de la BRI.

 

*La mission de CODATA

CODATA est le Comité sur les données du Conseil international des sciences (CIS) dont l'UIESP est membre (à la suite d'une fusion entre le Conseil international des sciences sociales (CISS) et le Conseil international pour la science (CIUS) en 2018). CODATA a pour but de développer la collaboration internationale pour promouvoir la science ouverte et pour améliorer la disponibilité et l'utilisation des données dans tous les domaines de recherche. CODATA soutient le principe selon lequel les données produites par la recherche et susceptibles d'être utilisées pour la recherche doivent être aussi ouvertes que possible et aussi protégées que nécessaire. CODATA travaille également à faire progresser l'interopérabilité et l'utilisation de ces données : les données de recherche doivent être FAIR (Findable, Accessible, Interoperable and Reusable). En promouvant les changements politiques, technologiques et culturels qui sont essentiels pour développer la science ouverte, CODATA contribue à la mission du CIS qui est de faire avancer la science en tant que bien public mondial.