Marwan Ghanem
Rencontres jeunes chercheurs en RI, 2019
De nos jours, nous nous intĂ©ressons Ă la dĂ©tection d’entitĂ©s importantes, ceci peut ĂȘtre des mots-clĂ©s importants dans un document ou Twitter, ou des individus importants dans un rĂ©seau de mouvement. Nous pouvons modĂ©liser ces donnĂ©es sous la forme d’un graphe dynamique et utiliser des mĂ©triques de centralitĂ© telle que la centralitĂ© de proximitĂ© temporelle. Malheureusement, cela peut ĂȘtre coĂ»teux. Dans ce travail, nous comparons la prĂ©cision de plusieurs mĂ©thodes de classification supervisĂ©e, les unes par rapport aux autres, Ă la dĂ©tection de ces nĆuds importants. Sur seize jeux de donnĂ©es de natures diffĂ©rentes, nous montrons que ces mĂ©thodes rĂ©ussissent Ă diffĂ©rencier les nĆuds importants de nĆuds insignifiants. Nous montrons Ă©galement que prendre en compte la nature des donnĂ©es diminue la qualitĂ© de rĂ©sultats. Enfin, nous examinons le temps du calcul de chacune de ces mĂ©thodes contre le temps du calcul de mĂ©thodes exact.
