Recherche
Objectifs
Axes de recherche et Projets scientifiques
Le laboratoire se concentre sur l’analyse de données massives (Big Data Analytics – BDA) appliquées aux problématiques territoriales, en intégrant une dimension cruciale : l’efficacité énergétique.
Elle s’articule autour de 4 axes :
Le DataLake Éco-Responsable
(Green Data Factory)
Nous développons un Lac de Données Éco-Responsable visant la Collecte, le Stockage et l’Analyse écoresponsables de données massives.
• Objectif : Valoriser les données pour Modéliser, Suivre et Prédire des trajectoires de vie.
• Données Territoriales : Nous travaillons sur des données massives, hétérogènes et anonymisées du territoire. Ceci inclut des données sur le Bien Vieillir (issues notamment de Téléalarme et CIAS MACS) et le Bien Vivre (issues notamment de XLHabitat).
• Infrastructure : Le laboratoire dispose de matériel de développement dédié à cette analyse : un serveur HP Z6 G4 pour le Data Lake (24 cœurs/48 vcores, 256GB RAM) et une Lenovo ThinkStation P520 pour l’IA et l’écoresponsabilité.
ECOFLOC : Mesure et Sobriété Numérique
ECOFLOC est un Wattmètre logiciel multi-composants développé par le laboratoire. Il est essentiel pour créer des Data Lakes plus écoresponsables en mesurant l’empreinte énergétique des logiciels.
• Fonctionnalité : C’est le seul outil sur le marché capable d’estimer la consommation énergétique (en Joules) multi-composants (RAM, CPU, HD, NET) pour un ou un ensemble de logiciels/processus, permettant ainsi d’établir un profil énergétique complet.
• Intérêt : Il est un support fondamental pour la R&D (thèses, formations) et permet d’évaluer la consommation en fonction du gain de qualité.
• Statut : ECOFLOC est un outil open-source. Des travaux d’amélioration des mesures, de l’installation et de l’interface sont prévus pour 2025.
Analyse des Trajectoires Territoriales (Analyse Multi-Perspective)
Nos travaux portent sur l’analyse multi-perspective des données spatio-temporelles relatives au « Bien-être ».
• Problématique : Les décideurs locaux ont besoin d’une perspective large intégrant diverses dimensions du cadre de vie (démographie, transport, services sociaux, etc.).
• Approche : Nous avons développé un cadre de modélisation (on-read schema modelling framework) pour l’intégration croisée et l’accessibilité des données multi-perspectives. Ce modèle permet d’intégrer des datasets hétérogènes (structurés, semi-structurés) avec différentes granularités (spatial et temporel) uniquement à la demande de l’utilisateur (logique ELT).
• Finalité : Le but est de représenter et d’explorer dynamiquement les trajectoires territoriales du Bien Vivre et du Bien Vieillir sur le territoire, afin de soutenir la prise de décision.
Résolution d’Entités pour les Flux de Données (IA)
Ce projet se concentre sur la résolution d’entités (Entity Resolution, ER) dans les flux de données continus.
• Enjeu : Intégrer les données de flux en temps réel avec les données historiques pour fournir une vue complète et uniforme de sources de données hétérogènes.
• Innovation : Nous proposons un cadre basé sur l’embedding dynamique de graphes adapté au traitement des données en temps réel. Cette approche incrémentale permet de mettre à jour les correspondances efficacement tout en réduisant les coûts de calcul, comparé aux méthodes traditionnelles en mode batch
