TRAVERSEES

Porteure : Marlène VILLANOVA

Participants pour STORIES : Camille BERNARD, Paule-Annick DAVOINE, Jérôme GENSEL

Partenaires : UR 12 (Institut National des Études Démographiques, INED), UMR Espaces et Sociétés (CNRS, Université Rennes 2), Laboratoire TIMC (Université Grenoble Alpes)

Durée : 48 mois (janvier 2026 – décembre 2029)

Financé par : ANR, Appel à projets générique 2025 CE38 – Interfaces : mathématiques, sciences du numérique – sciences humaines et sociales, PRC

Objectif : Les enquêtes biographiques, qui s’appuient sur le recueil par questionnaire des évènements qui jalonnent les parcours de vie des individus, se sont progressivement imposées en SHS comme une approche méthodologique pour expliquer, à partir des données biographiques individuelles collectées, des comportements au sein de populations. Pour autant, concilier analyse quantitative et compréhension qualitative des histoires de vie reste un défi. Le projet TRAVERSÉES ambitionne, par une approche coconstruite entre SHS et Sciences Numériques, de revisiter l’analyse des enquêtes biographiques en exploitant les apports combinés d’approches récentes de l’Intelligence Artificielle (IA) : le Web Sémantique, le Deep Learning, les Grands Modèles de Langue (LLM) et l’IA générative. Un objectif initial du projet est de concevoir et d’implémenter un objet numérique robuste et flexible, appelé Trajectoire de Vie Sémantisée (TVS), permettant de capturer toute la complexité intrinsèque aux parcours de vie individuels. Les données d’une enquête biographique seront intégrées dans un Graphe de Connaissances (KG) structuré par une ontologie dédiée à la représentation des TVS et de leurs différents éléments constitutifs (trajectoires thématiques, épisodes, événements, …). Intégrant toute connaissance sous la forme d’un triplet RDF élémentaire (sujet, prédicat, objet), les KG sont connectables entre eux. Ce principe est à la base de l’avènement du Linked Open Data (LOD) Cloud qui relie entre eux des centaines de KG, jeux de données ouvertes et liées, accessibles, référençables, et interrogeables. Ainsi, une fois construit, le KG d’une enquête biographique pourra être étendu et complété par des données contextuelles pertinentes et disponibles dans le LOD Cloud. Cette phase d’enrichissement sera opérée de manière interactive à l’aide d’un chabot, agent conversationnel relié à un LLM, qui sera sollicité pour ses capacités à transformer des requêtes, formulées en langue naturelle par un chercheur SHS, en SPARQL, le langage d’interrogation des KG. Ces mêmes capacités seront exploitées, non seulement pour l’interrogation en langue naturelle des données biographiques collectées et/ou enrichies d’un KG d’enquête, mais également pour l’invocation des méthodes d’analyse statistique développées par le projet TRAVERSÉES. Notamment, pour répondre aux spécificités des données de TVS, des approches existantes d’analyse de séquences et à base de réseaux de neurones (Deep Learning) seront adaptées. Une analyse multi-niveau permettra d’étudier si les données d’enrichissement permettent d’observer certains effets contextuels sur les parcours de vie. Également, des composants de visualisation dédiés aux données des TVS et aux résultats des méthodes d’analyse statistique seront développés. Pour valider l’ensemble des propositions et réalisations du projet, le jeu de données de l’enquête nationale biographique 3B, qui fait référence dans le domaine, sera utilisé.

Le projet TRAVERSEES contribuera sur le plan méthodologique et sur le plan opérationnel à la compréhension des dynamiques sociales à partir des histoires de vie individuelles. Au travers de l’approche proposée, les chercheurs SHS seront guidés dans la mise en œuvre de chacune des étapes constitutives d’une chaîne de traitement entièrement outillée, assurant la modélisation, la représentation, et l’exploitation (à travers l’enrichissement, l’interrogation, l’analyse statistique et la visualisation) des données d’une enquête biographique, réunies et structurées au sein d’un graphes de connaissances de TVS. Le consortium pluridisciplinaire réuni par le projet TRAVERSÉES est constitué du Laboratoire d’Informatique de Grenoble qui porte le projet, du laboratoire Espaces et Sociétés (Sociologie et Démographie, Rennes), du laboratoire TIMC (Statistique, Grenoble) et des unités 12 et SMS de l’Institut National d’Études Démographiques (Paris).

Site web : https://anr.fr/fileadmin/aap/2025/selection/aapg-2025-selection-vague1.pdf