Le défi consiste ici à modéliser et analyser des trajectoires de vie. Le concept de trajectoire de vie (ou parcours biographique ou encore parcours de vie) est largement utilisé dans les sciences humaines et sociales par les démographes, les sociologues, les urbanistes, etc., qui cherchent à mettre en perspective les informations sur les individus pour mieux comprendre ce qui détermine leurs choix tout au long de leur existence.
Les données de trajectoires de vie sont collectées lors d’enquêtes biographiques. Depuis les années 1980, les enquêtes biographiques se sont développées dans le panorama des méthodes de collecte des données socio-démographiques. Fondées sur le recueil par questionnaire de parcours individuels, ces enquêtes, notamment celles lancées sous l’égide de l’Ined – Enquêtes Triple biographies 3B en 1981, Biographies et Entourage en 2000, Histoires de vie en 2003 – ont ouvert de nouveaux champs d’analyse pour la compréhension des dynamiques sociales, démographiques et géographiques des populations. Pour autant, depuis quatre décennies, l’élaboration et le traitement de telles enquêtes posent des défis en matière de collecte et d’analyse, auxquels les chercheurs en sciences sociales sont confrontés encore aujourd’hui.
Dans ce contexte, l’équipe STORIES œuvre, en partenariat avec des chercheurs en SHS et en statistique, à concevoir et développer une suite logicielle opérationnelle permettant la modélisation, la représentation, l’acquisition, l’enrichissement sémantique, le raisonnement et l’inférence, l’interrogation, l’analyse, et la visualisation de données biographiques.
Les travaux de l’équipe STORIES sur les trajectoires de vie ont débuté en 2015. Parmi les principaux résultats, on peut citer :
- une architecture intégrant un patron de conception qui permet de construire une ontologie de trajectoire de vie, ainsi qu’un modèle de facteur explicatif des événements de vie. Une trajectoire de vie est ici appréhendée comme une composition de trajectoires thématiques (familiale, résidentielle, professionnelle, etc.), chacune caractérisée par un ensemble d’attributs (statut marital, adresse, salaire, etc.). Une trajectoire thématique est elle-même une suite chronologique d’épisodes et d’événements, où un épisode correspond à une période de relative stabilité (pour les valeurs des attributs considérés), et où un événement marque une rupture et le début d’un nouvel épisode de vie. Reposant sur les technologies et langages du Web Sémantique, les trajectoires de vie sont des graphes RDF spatio-temporels et thématiques, qu’il est alors possible d’interroger au moyen de requêtes SPARQL dédiées, et d’enrichir par d’autres données ouvertes et liées accessibles et connectables sur le Web des Données et le LOD Cloud. [Noël, 2019], [Gensel et al., 2020].
- la conception et le développement d’un composant graphique dédié à la visualisation d’une trajectoire de vie individuelle, ainsi que d’une interface graphique animée et interactive rendant compte du déroulement dans le temps et l’espace d’une trajectoire de vie et des trajectoires thématiques associées [Sage, 2022]
- une étude des outils et méthodes d’analyse de séquence existants et de leur aptitude à traiter des séquences multidimensionnelles de données trajectoires de vie (projet MIAI MultiVitaMine, [Soufflet, 2023]).
- La formalisation d’un méta-modèle étendu pour la représentation des trajectoires de vie et l’étude de mesures de similarité adaptées aux trajectoires de vie (projet MIAI MultiVitaMine, [Chevaux, 2023]).
- la classification non supervisée de données de trajectoires de vie [Rochas, 2024].

Figure : représentation d’une trajectoire de vie où sont considérées 4 trajectoires thématiques : familiale, professionnelle, de loisirs et résidentielle.
Aujourd’hui, nos recherches sur ce thème sont focalisées sur la conception, la définition et la formalisation d’un méta-modèle de trajectoires de vie capable d’appréhender à la fois les concepts communs à toutes les enquêtes biographiques et à permettre la prise en compte des éléments distinctifs propres à chacune de ces enquêtes [Gensel et al., 2025].
Nos efforts se portent également sur la phase amont de collecte des données. Dans ce contexte, la thèse de Benjamin Fontaine, débutée en 2024 (contrat CNRS 80 PRIME), vise à dépasser les limites des modes et outils de recueil de données biographiques actuels en concevant et développant des solutions innovantes et opérationnelles, issues de notre savoir-faire combiné à l’expérience des chercheurs en sciences humaines sur les enquêtes biographiques. L’enjeu est de proposer des interfaces modulaires et flexibles capables de supporter la complexité des trajectoires de vie et de faciliter le processus de remémoration chez l’enquêté.
Enfin, en aval, nous abordons les problématiques liées à l’exploitation des données de trajectoires de vie collectées. Nous investiguons actuellement plus particulièrement : 1) l’enrichissement sémantique des graphes de connaissances spatio-temporelles décrivant des données de trajectoires de vie issues d’enquêtes biographiques ; 2) l’interrogation en langue naturelle de ces graphes de connaissances de trajectoires de vie au moyen d’une IA générative ; 3) l’analyse de données de trajectoires de vie (méthodes de similarité, classification, recherche de motifs fréquents, prédiction, …) en adaptant des méthodes statistiques d’analyse de séquences (classification non supervisée) ou en exploitant directement les graphes de connaissances de trajectoires de vie au moyen de réseaux de neurones (approches Deep Learning à base de Réseaux de Neurones sur Graphes) ; la visualisation et la navigation au moyen de composants graphiques interactifs à la fois des données de trajectoire de vie et des résultats des requêtes, mécanismes de raisonnement et méthodes d’analyse activés sur ces données.
Références bibliographiques
- Chevaux A. : Classification non supervisée de trajectoires de vie : formalisation du modèle SaLTo et étude de mesures de dissimilarité, mémoire de Master en statistique et sciences des données, Université Grenoble Alpes, 2023.
- Gensel J., Villanova-Oliver M., Le Quéau P., Noël D : Un modèle multi points de vue pour représenter les trajectoires de vie, 5ème colloque international du Collège International des Sciences du Territoire, Paris, 18-20 novembre 2020.
- Gensel J, Villanova M., Bernard C.: SaLTo : Enhancing the exploitation of spatial data collected by biographical surveys, en cours de soumission à ISPRS IJGI (International Journal Geo-Information), 2025.
- Noël D.: Une approche basée sur le web sémantique pour l’étude de trajectoires de vie. (A semantic web based approach to study life trajectories). Grenoble Alpes University, France, 2019.
- Rochas M. : Classification non supervisée de données SaLTo simplifiées : Étude de simulation, mémoire de Master en statistique et sciences des données, Université Grenoble Alpes, 2024.
- Sage M.: Développement d’une interface graphique pour des données de l’enquête biiographique 3B, mémoire de Master en informatique, Université Grenoble Alpes, 2022.
- Soufflet J. : Classification non supervisée de séquences de données de trajectoires de vie multidimensionnelles avec TraMiner, mémoire de Master en statistique et sciences des données, Université Grenoble Alpes, 2023.