GTBDML – Groupe de Travail Big Data et Machine Learning
Axe Thématique : Sciences, Technologies et SHS
Ce projet a reçu un financement de l'appel à projets « Amorçage » en 2019.
Retour AAP « Amorçage » - Lauréats des appels à projets
Coordinatrice
- Sylvie BLASCO, GAINS, Université du Mans
Objectifs
L’émergence du Big Data porte en elle des enjeux économiques, juridiques, démocratiques, sociétaux ou encore environnementaux. Elle peut se traduire par un bouleversement profond des activités et des modes de fonctionnement dans différents secteurs (banque-assurance, santé…). Elle devrait également profondément affecter le marché du travail en modifiant les métiers et compétences requises. Ces changements et leurs effets restent encore largement à comprendre et à évaluer.
L’émergence du Big Data offre aussi de nouvelles possibilités et perspectives de recherche aux chercheurs en statistique, économétrie et économie appliquée. En effet, ces nouvelles sources de données accessibles et exploitables demandent un traitement statistique particulier pour en tirer tout le potentiel. Les méthodes statistiques – que l’on appelle apprentissage statistique, machine learning, apprentissage approfondi (deep learning), … – consistent à développer des algorithmes pour faire de la prédiction, de la classification ou du regroupement (clustering). Elles peuvent donc être particulièrement utiles dans une étape préliminaire ou intermédiaire du travail d’économie appliquée pour l’extraction, le traitement et la structuration d’information et donc la création de variables à expliquer ou explicatives. Elles peuvent également être mobilisées pour la sélection de modèles et parvenir à des analyses empiriques, et notamment des prédictions, de meilleure qualité. Les propriétés statistiques et performances de ces outils font l’objet d’une recherche actuelle active en statistique et économétrie théorique, et des applications de ces nouveaux outils commencent à se développer en économie appliquée, notamment en matière d’évaluation des politiques publiques, d’économie du personnel, de justice ou de santé.
Le groupe de travail « Big Data et Machine Learning » vise prioritairement à aborder ces aspects techniques sur les outils du Big Data et à envisager leur application à des questions économiques et sociales.