Atelier de formation sur Web, données des médias sociaux et recherche démographique

Mayence, Allemagne, 31 août 2016 

 

Le Comité scientifique de l’UIESP sur Big data et processus démographiques a organisé un atelier de formation sur « Web, données des médias sociaux et recherche démographique » lors de la Conférence européenne de population de 2016. L’atelier était financé par une subvention de la Fondation William et Flora Hewlett à l’UIESP et à la Population Association of America (PAA) pour encourager la participation des démographes à la Révolution des données.

 

L’atelier, qui s’est tenu dans l’après-midi du 31 août à Mayence (Allemagne), était consacré à la construction d’une suite de procédures intégrées pour accéder aux données des médias sociaux, les analyser en utilisant des méthodes démographiques et créer des visualisations de données interactives. Après une introduction à des outils tels que les interfaces de programmation applicatives (API pour Application Programming Interfaces) qui permettent de recueillir des données issues des médias sociaux (comme Twitter) et à des programmes de visualisation de données, l’atelier a porté sur des exemples de méthodes démographiques qui peuvent servir à explorer les données des médias sociaux.


Dans la première partie de l’atelier, Emilio Zagheni a proposé une introduction aux outils permettant de recueillir les données des médias sociaux et d’extraire les carac-téristiques démographiques à partir des photos des profils (comme Face++ API).


Kivan Polimis et Monica Alexander ont ensuite présenté une série de tutoriels pratiques sur le recueil des données avec Twitter Streaming API et sur la visualisation des données avec R. Les participants ont suivi pas à pas sur leurs propres ordinateurs, utilisant eux-mêmes les codes R et des ensembles de données distribués à l’avance, ainsi que des données recueillies en temps réel pendant l’atelier. Après avoir montré comment accéder aux APIs et récupérer des données, les animateurs ont donné quelques exemples simples du type d’analyses qui pouvaient être faites. Kivan a présenté l’utilisation d’éléments obtenus à partir de Face++ API et de API. Les participants ont utilisé une analyse de sentiments sur les tweets pour estimer les différences démographiques en fonction des comportements en matière d’activité physique (par exemple, les tweets mentionnant #running ou #jogging).

 

 

Monica a ensuite montré comment visualiser les données avec R Shiny. Avec cette application, les participants ont pu de façon interactive comparer visuellement les opinions vis-à-vis de l’activité physique selon des caractéristiques démographiques, comme l’âge ou le sexe. Emilio a conclu en présentant une application des méthodes de démographie formelle (par exemple l’estimation d’un taux de croissance à partir de la structure par âge d’une population) aux plates-formes de médias sociaux pour comprendre les variations au cours du temps des « objets en ligne ».

 

Une trentaine de participants ont assisté à l’atelier (malheureusement certains participants inscrits n’ont pu être là à temps du fait de retards importants à l’aéroport de Francfort). À la suite d’un précédent atelier organisé à la réunion annuelle de la PAA de 2016, une liste de distribution a été créée pour faciliter les communications entre les chercheurs intéressés dans les données du web, les médias sociaux et la démographie. Toute personne intéressée à s’inscrire sur cette liste peut le faire en suivant les instructions disponibles à l’adresse suivante : https://mailman1.u.washington.edu/mailman/listinfo/digital-demog.

 

Voir aussi : 

 

Un atelier de formation similaire sera organisé au prochain Congrès ALAP/ABEP à Foz de Iguaçu (Brésil) en octobre 2016.