DAWAK 2025 – 27th International Conference on Big Data Analytics and Knowledge Discovery

du 25 au 27 août, 2025 à Bangkok, Thaïlande

DAWAK est une conférence internationale qui constitue un forum de haute qualité pour les chercheurs, praticiens et développeurs dans le domaine du Big Data Analytics, au sens large. L’objectif principal de cet événement est d’explorer, de diffuser et d’échanger des connaissances dans ce domaine, à travers des présentations scientifiques et industrielles.

La plupart des systèmes de traitement de flux de données recueillent des données provenant de différentes sources en temps réel et les consomment immédiatement. Cependant, de nombreuses analyses décisionnelles nécessitent des données en temps réel et des données historiques (par exemple, un dataset local ou des enregistrements antérieurs) en même temps pour comprendre la situation actuelle et avoir une vue globale. La résolution d’entités permet de déterminer si deux enregistrements différents font référence à la même entité en l’absence d’un identifiant unifié dans le cas multi-sources. Il est donc essentiel d’intégrer les données en temps réel aux données stockées en appliquant la résolution d’entités et de garantir l’accessibilité et la facilité d’utilisation des données multi-sources. Les méthodes existantes pour la résolution d’entités sont souvent incapables de prendre en charge ces dernières de manière continue tout en fournissant des méthodes générales et efficaces pour l’analyse de données complexes telles que le texte. Étant donné la bonne capacité de l’embedding dans la capture des informations sémantiques et syntaxiques, nous visons à appliquer cette technique au traitement de flux de données dans le but d’intégrer les données entrants en temps réel aux données historiques. En outre, la plupart des approches privilégient aujourd’hui la précision et la scalabilité tout en ignorant l’augmentation de la consommation d’énergie que nécessite l’amélioration de cette précision. Nous proposons donc ici une approche d’embedding de graphe dynamique adaptée au traitement des données en temps réel pour effectuer la résolution d’entités dans des tables relationnelles tout en évaluant la consommation d’énergie de ce traitement.

Retour en haut