In-Core Computation of Geometric Centralities with HyperBall: A Hundred Billion Nodes and Beyond

Sebastiano Vigna

Mercredi 28 mai 2014 Ă  11h, salle 25-26/101

Slides

We approach the problem of computing geometric centralities, such as closeness and harmonic centrality, on very large graphs; traditionally this task requires an all-pairs shortest-path computation in the exact case, or a number of breadth-first traversals for approximated computations, but these techniques yield very weak statistical guarantees on highly disconnected graphs. We rather assume that the graph is accessed in a semi-streaming fashion, that is, that adjacency lists are scanned almost sequentially, and that a very small amount of memory (in the order of a dozen bytes) per node is available in core memory. We leverage the newly discovered algorithms based on HyperLogLog counters, making it possible to approximate a number of geometric centralities at a very high speed and with high accuracy. While the application of similar algorithms for the approximation of closeness was attempted in the MapReduce framework, our exploitation of HyperLogLog counters reduces exponentially the memory footprint, paving the way for in-core processing of networks with a hundred billion nodes using “just” 2TiB of RAM. Moreover, the computations we describe are inherently parallelizable, and scale linearly with the number of available cores.

L’invention des concepts en informatique

Baptiste Mélès

Jeudi 12 juin 2014 Ă  11h, salle 25-26/101

Comment les informaticiens inventent-ils des concepts ? L’informaticien a parfois l’image d’un bricoleur d’une nouvelle gĂ©nĂ©ration, dont les concepts, en compromission permanente avec les contingences de la matière, n’auraient pas la puretĂ© de sciences plus nobles que seraient la logique ou les mathĂ©matiques. Telle est la conception que nous remettrons en cause. Le philosophe et rĂ©sistant Jean Cavaillès (1903-1944) a proposĂ© dans son ouvrage posthume Sur la Logique et la thĂ©orie de la science (1947) ce que l’on peut voir comme une grammaire de l’invention des concepts mathĂ©matiques, dont les deux procĂ©dĂ©s principaux s’appellent paradigme et thĂ©matisation. En nous appuyant sur l’histoire des concepts de fichier et de processus de CTSS Ă  Unix, nous montrerons que l’on retrouve ces deux procĂ©dĂ©s, et peut-ĂŞtre plus encore, dans l’invention des concepts informatiques. L’invention de concepts informatiques serait dès lors aussi pure, d’un point de vue rationnel, que l’invention des concepts mathĂ©matiques. Ceci nous conduira Ă  caractĂ©riser l’informatique comme une science a priori — c’est-Ă -dire indĂ©pendante de toute expĂ©rience — Ă  part entière, et dont l’apport est irrĂ©ductible Ă  la logique et aux mathĂ©matiques : bien plutĂ´t qu’une science a posteriori des ordinateurs, elle peut ĂŞtre vue comme la science a priori de l’inscription des processus rationnels dans la matière. Nous conclurons en montrant sur quelques exemples en quoi l’informatique dĂ©borde largement la science des ordinateurs.  

Les réseaux dynamiques : des données aux modèles

Anh-Dung Nguyen

Vendredi 09 mai 2014 Ă  14h, salle 25-26/101

Slides

La science des rĂ©seaux dynamiques est un domaine de recherche très rĂ©cent mais couvre un large champ d’applications, allant des rĂ©seaux biologiques aux rĂ©seaux sociaux, en passant par les rĂ©seaux informatiques tel que les rĂ©seaux mobiles ad hoc et les DTNs. Ces rĂ©seaux sont caractĂ©risĂ©s par leur Ă©volution spatio-temporelle : les noeuds et liens apparaissent et disparaissent au cours du temps, contrairement aux rĂ©seaux statiques dans lesquels les noeuds et liens sont fixes. En consĂ©quence, les modèles classiques pour les rĂ©seaux statiques ne sont pas adaptĂ©s ou ne parviennent pas Ă  expliquer les phĂ©nomènes, propriĂ©tĂ©s ou processus comme la diffusion d’information dans ces rĂ©seaux. Ce sĂ©minaire abordera des nouveaux modèles permettant de capturer fidèlement deux caractĂ©ristiques spatio-temporelles des rĂ©seaux dynamiques : le phĂ©nomène « petit-monde » et le niveau de dĂ©sordre dans les contacts. Nous confronterons ces modèles avec des analyses intensives de traces rĂ©elles. Nous montrerons ensuite l’impact de ces caractĂ©ristiques sur la capacitĂ© de diffusion d’informations de ces rĂ©seaux. Enfin, une application sur le routage efficace dans les rĂ©seaux mobiles opportunistes sera prĂ©sentĂ©e.

Deepening Our Understanding of Social Media via Data Mining

Huan Liu

Vendredi 30 mai 2014 Ă  11h, salle 25-26/101

Slides

Social media mining differs from traditional data mining in many ways, offering unique opportunities to advance data mining. It consists of massive amounts of user-generated content and extensive networked data. As detailed in our latest textbook “Social Media Mining: An Introduction”, we face novel challenges such as “the evaluation dilemma” and “the noise removal fallacy”. We will introduce these challenges and present some recent research issues we encounter – a big-data paradox unique to social media where many social networking sites are present but only minimum information is available, and whether distrust is relevant and useful in social media mining.  We will exemplify the intricacies of social media data, and show how to exploit unique characteristics of social media data in developing novel algorithms and tools for social media mining. The textbook’s pdf free download is at http://dmml.asu.edu/smm/   Dr. Huan Liu is a professor of Computer Science and Engineering at Arizona State University. He obtained his Ph.D. in Computer Science at University of Southern California and B.Eng. in CSEE at Shanghai JiaoTong University. At Arizona State University, he was recognized for excellence in teaching and research in Computer Science and Engineering and received the 2014 President’s Award for Innovation. His research interests are in data mining, machine learning, social computing, and artificial intelligence, investigating interdisciplinary problems that arise in many real-world, data-intensive applications with high-dimensional data of disparate forms such as social media. His well-cited publications include books, book chapters, encyclopedia entries as well as conference and journal papers. He is a co-author of Social Media Mining: An Introduction by Cambridge University Press. He serves on journal editorial boards and numerous conference program committees, is an IEEE Fellow and a member of several professional societies. http://www.public.asu.edu/~huanliu  

Dynamic Contact Network of an Hospital

Christophe Crespelle

Vendredi 09 mai 2014 Ă  11h, salle 25-26/101

Slides

We analyse a fine-grain trace of contact data collected during 6 months on the entire population of a rehabilitation hospital. We investigate both the graph structure of the average daily contact network and the temporal structure of the evolution of contacts in the hospital. Our main results are to unveil striking properties of these two structures in the considered hospital, and to present a methodology that can be used for analysing any dynamic complex network where nodes are classified into groups.

Information Diffusion in Complex Networks: Measurement-Based Analysis Applied to Modelling

Daniel Bernardes

Vendredi 21 mars 2014 Ă  14h, salle 25-26/105

Understanding information diffusion on complex networks is a key issue from a theoretical and applied perspective. Epidemiology-inspired SIR models have been proposed to model information diffusion. Recent papers have analyzed this question from a data-driven perspective, using on-line diffusion data. We follow this approach, investigating if epidemic models, calibrated with a systematic procedure, are capable of reproducing key structural properties of spreading cascades. We first identified a large-scale, rich dataset from which we can reconstruct the diffusion trail and the underlying network. Secondly, we examine the simple SIR model as a baseline model and conclude that it was unable to generate structurally realistic spreading cascades. We extend this result examining model extensions which take into account heterogeneities observed in the data. In contrast, similar models which take into account temporal patterns (which can be estimated with the interaction data) generate more similar cascades qualitatively. Although one key property was not reproduced in any model, this result highlights the importance of temporal patterns to model diffusion phenomena. We have also analyzed the impact of the underlying network topology on synthetic spreading cascade structure. We have simulated spreading cascades in similar conditions as the real cascades observed in our dataset, namely, with the same time constraints and with the same « seeds ». Using a sequence of uniformly random graphs derived from the real graph and with increasing structure complexity, we have examined the impact of key topological properties for the models presented previously. We show that in our setting, the distribution of the number of neighbors of seed nodes is the most impacting property among the investigated ones.

« Going Viral » and the Structure of Online Diffusion

Sharad Goel

Jeudi 20 mars 2014 Ă  14h, salle 25-26/101

New products, ideas, norms and behaviors are often thought to propagate through a person-to-person diffusion process analogous to the spread of an infectious disease. Until recently, however, it has been prohibitively difficult to directly observe this process, and thus to rigorously quantify or characterize the structure of information cascades. In one of the largest studies to date, we describe the diffusion structure of billions of events across several domains. We find that the vast majority of cascades are small, and are characterized by a handful of simple tree structures that terminate within one degree of an initial adopting « seed. » While large cascades are extremely rare, the scale of our data allows us to investigate even the one-in-a-million events. To study these rare, large cascades, we develop a formal measure of what we label « structural virality » that interpolates between two extremes: content that gains its popularity through a single, large broadcast, and that which grows via a multi-generational cascade where any one individual is directly responsible for only a fraction of the total adoption. We find that the very largest observed events nearly always exhibit high structural virality, providing some of the first direct evidence that many of the most popular products and ideas grow through person-to-person diffusion. However, medium-sized events — having thousands of adopters — exhibit surprising structural diversity, and are seen to grow both through broadcast and viral means. Finally, we show that our empirical results are largely consistent with an SIR model of contagion on a scale-free network, reminiscent of previous work on the long-term persistence of computer viruses.

Impact de la dynamique du rĂ©seau sur quelques problèmes d’algorithmique distribuĂ©e et classification de graphes dynamiques

Arnaud Casteigts

Vendredi 02 mai 2014 Ă  11h, salle 25-26/101

Slides

En partant de quelques problèmes de base en algorithmique distribuĂ©e (diffusion, Ă©lection, comptage, arbres couvrants), je discuterai de l’impact que peut avoir la dynamique du rĂ©seau sur ces problèmes en termes de redĂ©finition, conditions nĂ©cessaires, conditions suffisantes, etc. Cela nous permettra de passer en revue quelques classes de graphes dynamiques, qui seront ensuite resituĂ©es dans un contexte plus vaste comprenant une vingtaine de classes. La discussion sortira alors du cadre de l’algorithmique distribuĂ©e pour Ă©voquer la dynamique des graphes en gĂ©nĂ©ral.

RankMerging : une mĂ©thode d’apprentissage supervisĂ© pour prĂ©dire les liens dans un rĂ©seau social

Lionel Tabourier

Vendredi 11 avril 2014 Ă  11h, salle 25-26/101

Au cours de cet exposĂ©, je prĂ©senterai une mĂ©thode d’apprentissage supervisĂ© pour la prĂ©diction de liens dans les rĂ©seaux sociaux, et plus prĂ©cisĂ©ment pour dĂ©tecter des liens qui n’ont pas Ă©tĂ© collectĂ©s lors de l’acquisition des donnĂ©es. Pour illustrer l’utilisation de la mĂ©thode, nous utilisons un CDR (Call Detail Record) portant sur environ 1 million d’utilisateurs de tĂ©lĂ©phone portable et simulons la situation dans laquelle se trouve un opĂ©rateur tĂ©lĂ©phonique: celui-ci a connaissance des appels entre ses clients, et entre ses clients et des clients de concurrents. Mais avoir accès aux interactions existant entre les clients de ses concurrents serait aussi avantageux, car le taux d’attrition est Ă©troitement liĂ© Ă  la structure du rĂ©seau social d’un utilisateur. Cependant, cette tâche est difficile: il s’agit de prĂ©dire des relations non-observĂ©es, dans un contexte oĂą les classes de prĂ©diction sont fortement asymĂ©triques: alors que beaucoup de liens sont possibles, peu existent. C’est pourquoi les mĂ©thodes non-supervisĂ©es classiques, qui utilisent diffĂ©rentes caractĂ©ristiques structurelles du rĂ©seau pour classer les paires de noeuds, sont peu performantes dans ce contexte. Je dĂ©crirai RankMerging, une mĂ©thode d’apprentissage supervisĂ©e simple et peu coĂ»teuse computationnellement, qui agrège les classements issus de diffĂ©rentes sources d’information pour amĂ©liorer les performances de prĂ©diction. L’opĂ©rateur apprend les paramètres en utilisant les donnĂ©es de ses propres clients et les utilise ensuite sur les clients de ses concurrents. La mĂ©thode est adaptĂ©e Ă  la situation dans laquelle nous nous trouvons: nous ne cherchons pas Ă  obtenir une très bonne prĂ©cision sur un petit nombre de prĂ©dictions, mais plutĂ´t un bon compromis sur une bonne partie de l’espace Precision-Recall, permettant Ă  l’opĂ©rateur d’ajuster sa stratĂ©gie. Ensuite, je discuterai du cas des rĂ©seaux ego-centrĂ©s, pour lesquels l’utilisation de cet outil est pertinente. En effet, dans le cas oĂą l’on n’a accès qu’aux interactions d’un noeud avec ses voisins immĂ©diats, l’information structurelle est très pauvre et nous devrons donc chercher d’autres sources d’information puis les agrĂ©ger. Ici, nous discuterons comment la temporalitĂ© des interactions peut ĂŞtre exploitĂ©e comme source d’information pour amĂ©liorer les performances de la prĂ©diction.

Applications collaboratives dans les réseaux dynamiques : applications aux réseaux de véhicules

Bertrand Ducourthial

Jeudi 17 avril 2014 Ă  11h, salle 25-26/101

Slides

Dans cet exposĂ©, nous prĂ©sentons des travaux rĂ©cents portant sur la conception d’algorithmes rĂ©partis dans les rĂ©seaux dynamiques. Ces rĂ©seaux prĂ©sentent des connexions Ă©phĂ©mères et des voisinages instables. Les rĂ©seaux vĂ©hiculaires en sont un exemple emblĂ©matique. Dans ces rĂ©seaux, les algorithmes et protocoles classiques sont gĂ©nĂ©ralement inadaptĂ©s. Notre travail porte sur la conception d’applications rĂ©parties embarquĂ©es. Nous aborderons les Ă©tudes de cas suivantes : communication entre deux noeuds mobiles, entre un mobile et l’infrastructure, collecte de donnĂ©es, fusion distribuĂ©e de donnĂ©es. Nous prĂ©senterons les algorithmes, les expĂ©riences rĂ©alisĂ©es avec des vĂ©hicules sur route ainsi que des dĂ©monstrations.

Influence de la structure du réseau des mouvements de commuting sur la diffusion de la grippe

Ségolène Charaudeau

Jeudi 20 mars 2014 Ă  11h, salle 25-26/101

Slides

Au cours de ce sĂ©minaire, je vous prĂ©senterai le travail que j’ai rĂ©alisĂ© durant ma thèse Ă  l’UMRS 707 de l’INSERM sur l’influence de la structure du rĂ©seau complexe formĂ© par les mouvements de commuting entre les villes française sur la propagation d’une maladie infectieuse, en utilisant l’exemple de la grippe. Les phĂ©nomènes de diffusion dans un groupe social, entre communautĂ©s ou individus, d’une maladie ou d’une information par exemple, sont influencĂ©s par la structure des contacts individuels entre ces entitĂ©s: pour analyser ces phĂ©nomènes, des modèles basĂ©s sur des rĂ©seaux reproduisant la structure des contacts sont frĂ©quemment utilisĂ©s. Dans le cas de la propagation de maladies infectieuses, plusieurs types de rĂ©seaux entrent en jeu: les mouvements de population quotidiens crĂ©ent notamment un rĂ©seau complexe de contacts entre villes, dont la structure impacte la diffusion de maladies transmissibles par contact, telle que la grippe. Si cette influence a Ă©tĂ© abondamment Ă©tudiĂ©e pour les rĂ©seaux internationaux, notamment par l’Ă©tude des dĂ©placements aĂ©riens, elle n’a que peu Ă©tĂ© analysĂ©e Ă  l’Ă©chelle nationale et rĂ©gionale. Durant mon travail de thèse, je me suis attachĂ©e Ă  l’Ă©tude de la diffusion de la grippe sur le rĂ©seau formĂ© par les mouvements de commuting en France et de ses propriĂ©tĂ©s, en lien avec la structure du rĂ©seau: pour cela, j’ai dĂ©veloppĂ© un modèle simulant la propagation de la grippe sur un rĂ©seau de contacts. Afin de lier les propriĂ©tĂ©s observĂ©es pour la diffusion Ă  la structure du rĂ©seau, j’ ai mis en place des outils permettant de comparer la propagation obtenue sur le rĂ©seau de commuting et sur des rĂ©seaux randomisĂ©s. Cette analyse a permis de mettre en Ă©vidence l’existence de communautĂ©s de villes ayant un comportement de propagation similaire et de chemins de propagation prĂ©fĂ©rentiels entre ces communautĂ©s. Elle a Ă©galement permis d’analyser la structure de ces communautĂ©s, pour la plupart centralisĂ©es autour d’un groupe de nĹ“uds qui assurent la communication avec les communautĂ©s environnantes.

Coala : Co-evolution Assessment by a Likelihood-free Approach

Catherine Matias

Jeudi 22 mai 2014 Ă  11h, salle 25-26/101

Dans cet exposĂ©, je prĂ©senterai tout d’abord les problĂ©matiques de co-Ă©volution et de co-phylogĂ©nie qui portent sur la modĂ©lisation de l’Ă©volution conjointe de deux systèmes biologiquement liĂ©s (hĂ´tes-parasites ou gènes-espèces). La rĂ©conciliation cherche Ă  fournir un scĂ©nario explicatif de la co-Ă©volution entre deux phylogĂ©nies (arbres) liĂ©s, en prenant en compte un certain nombre d’Ă©vènements Ă©volutifs comme la co-spĂ©ciation, la duplication, la perte et le transfert. Des algorithmes de rĂ©conciliation parcimonieuse existent pour une fonction de coĂ»t (de chacun des Ă©vènements ci-dessus) fixĂ©e, mais le rĂ©sultat est Ă©videmment très dĂ©pendant du choix de cette fonction. Une approche naturelle est de choisir pour ces coĂ»ts des fonctions inversement proportionnelles Ă  la probabilitĂ© de chaque Ă©vènement sous un modèle co-Ă©volutif. Je prĂ©senterai une mĂ©thode statistique qui permet d’estimer les paramètres d’un modèle de co-Ă©volution entre deux arbres et donc des fonctions de coĂ»t associĂ©es. Il s’agit d’une mĂ©thode de type ABC (approximate Bayesian computation) qui n’utilise pas le calcul de la vraisemblance du modèle (likelihood-free method). J’illustrerai les rĂ©sultats de la mĂ©thode sur donnĂ©es simulĂ©es et rĂ©elles.    

Social Networks as a Trade-Off Between Efficient Information Transmission and Reduced Disease Transmission

Cédric Sueur

Jeudi 27 mars 2014 Ă  11h, salle 25-26/101

Slides

Network optimality has been described in genes, proteins and human communicative networks. In the latter, optimality leads to the efficient transmission of information with a minimum number of connections. Whilst studies show that differences in centrality exist in animal networks with central individuals having higher fitness; network efficiency has never been studied in animal groups. Living in groups has many advantages but it also involves certain disadvantages such as increased disease transmission and the need to make collective decisions. In theory, the social network properties optimizing decision accuracy and the spreading of information should also increase the disease transmission rate, creating a trade-off between decision-making efficiency and infection risk. We aim to explore this trade-off by examining social network properties and investigating how they might interact to maximize decision accuracy and minimize infection risk. We studied several groups of primates and found that group size and neocortex ratio were correlated with network efficiency. Centralisation (whether several individuals are central in the group) and modularity (how a group is clustered) had opposing effects on network efficiency, showing that tolerant species have more efficient networks. Such network properties affecting individual fitness could be shaped by natural selection affecting bot information and disease transmission. The main question of interest is how social network properties and individual attributes within this network effect separately and at the same time the diffusion of transmission (tested through opening of a fruit box as a proxy for information and social learning) and of disease (tested through pseudoectoparasites). Two parallel diffusion experiments, tracking the two different flows at the same time through the same individuals, will be carried out on Japanese macaques at the Koshima field site of Kyoto University, Japan. Ultimately, through an innovative experimental approach, this study aims at understanding the relative influence of different factors inherent in social-living, both cultural (innovation) and ecological (infectious disease), on human sociality.

Deep Tags: Toward a Quantitative Analysis of Online Pornography

Antoine Mazières

Jeudi 13 mars 2014 Ă  11h, salle 25-26/101

Lors de ce sĂ©minaire, je vous prĂ©senterai le projet Sexualitics.org, ainsi que le papier associĂ© publiĂ© dans le premier numĂ©ro de Porn Studies (Ă  paraĂ®tre en mars 2014). La pornographie en ligne et ce qu’elle reprĂ©sente de la sexualitĂ© n’a que très rarement fait l’objet d’approche quantitative. En effet, la pornographieest Ă©tudiĂ©e Ă  travers des questions de genre, du fĂ©minisme, de l’identitĂ© sexuelle et de sa mise en scène, par le biais d’interviews, de questionnaires, etc. Notre approche visait Ă  prendre avantage des donnĂ©es disponibles sur les plateformes hĂ©bergeant les vidĂ©os – principalement les mots-clĂ©s de 2 millions de vidĂ©os – et reconstruire rĂ©seaux, communautĂ©s et indices divers Ă  plus grande Ă©chelle. Parmi les rĂ©alisations de cette recherche, on peut trouver un rĂ©seau sĂ©mantique des « catĂ©gories » dont les communautĂ©s rassemblent des Ă©lĂ©ments de mise en scène, de pratique, de nationalitĂ©, raciaux, etc. La capacitĂ© descriptive de certaines de ces catĂ©gories est remise en question et un « nicheness score » est Ă©laborĂ© pour mettre en avant les catĂ©gories qui discriminent un contenu spĂ©cifique. Aussi, un outil en ligne – Porngram – permet Ă  chacun de reprĂ©senter la frĂ©quence des mots de leur choix sur 5 annĂ©es. Les datasets et code source des outils sont disponible en ligne. Aucune image Ă  caractère pornographique n’est montrĂ©e lors de la prĂ©sentation ou le papier. NĂ©anmoins, des mots-clĂ©s explicites apparaissent frĂ©quemment sur les visualisations et lors des explications. Site du projet : http://sexualitics.org Pre-print du papier : http://hal.archives-ouvertes.fr/hal-00937745 Datasets : http://sexualitics.github.io/ Porngram : http://porngram.sexualitics.org

Motifs Distribution in Exchangeable Random Networks

Pierre-André Maugis

Vendredi 28 février 2014 à 11h, salle 25-26/101

In this talk I will show how the relationship between the local and global characteristics of random graphs can be used for statistical inference. There exists a long history of research on graphs/networks as mathematical objects. However, the need for methods allowing for statistical inference based on network data is but recent, and was prompted by the current boom in available network datasets along with their relevance to research in the social and biological sciences. The problem we face, set in the classical statistical paradigm, consists in seeing the networks as issuing from a random process, and in trying to infer from the observed network some characteristics of the said random process. The difficulty is both theoretical and practical: we only observe one realisation of the network (where statisticians usually assume they have a large number of repeated measurements), and networks are large objects, easily involving millions of connections, which raises computational issues. Studying networks through the local characteristics that are motifs (e.g. triangles, squares, cliques, …) offers a solution to both problems at once. Motifs are small (and hence computationally amenable), and occur multiple times throughout the network. Moreover, as we will show, under the assumption of exchangeability one can relate the random process from which the network ensued and the distribution of realised motifs. Using these results we will describe how one can use motifs to produce sound statistical inference on network data. This is a joint Work with Sofia Olhede and Patrick Wolfe.

Reconstruction des dynamiques multi-échelles de la morphogenèse animale

Emmanuel Faure

Jeudi 20 février 2014 à 11h, salle 25-26/101

La reconstruction des dynamiques multi-Ă©chelles de la morphogenèse des organismes vivants est devenue un enjeu majeur pour la bio-mĂ©decine. Le dĂ©veloppement dun organisme multi-cellulaire est le rĂ©sultat de phĂ©nomènes biomĂ©caniques multi-Ă©chelles complexes. LĂ©chelle cellulaire est un niveau dintĂ©gration fondamental aussi bien pour lĂ©tude de la biomĂ©canique que pour les processus de rĂ©actions-diffusions. La plateforme BioEmergences vise Ă  reconstruire les dynamiques multi-Ă©chelles de la morphogenèse des organismes et Ă  mesurer les diffĂ©rences et les similitudes entre les individus, aux diffĂ©rentes Ă©chelles, tout au long de leurs individuations. Depuis les donnĂ©es dimagerie obtenues par acquisition en microscopie multi-photons jusquĂ  la modĂ©lisation des comportements cellulaires par lapproche des systèmes complexes, nos travaux se situent dans un cadre intrinsèque dinterdisciplinaritĂ©. Mon approche thĂ©orique propose la thèse que la reconstruction du lignage cellulaire vue comme un processus de branchement spatio-temporel fournit l’ensemble des morphodynamiques cellulaires. Jaborderai notamment lors de cette prĂ©sentation une stratĂ©gie de reconstruction phĂ©nomĂ©nologique du lignage cellulaire fondĂ©e sur des mĂ©thodes probabilistes. De plus, Ă  partir de diffĂ©rentes analyses de comportements cellulaires, je montrerai un modèle computationnel du dĂ©veloppement du poisson zèbre au cours des phases prĂ©coces de lembryogenèse, fondĂ© sur lensemble des caractĂ©ristiques mesurĂ©es.

Analyse et modélisation des dynamiques socio-épistémiques des communautés scientifiques

Elisa Omodei

Jeudi 06 février 2014 à 14h30, salle 26-00/101

Comment les structures sociales et épistémiques dune communauté scientifique contraignent-elles les dynamiques de recherche à venir ? Nous avons analysé deux grands corpus de publications scientifiques décrivant plus de 20 ans de recherche dans deux domaines très différents : la physique et la linguistique computationnelle. Nous avons pu extraire un réseau social de collaborations entre auteurs et un réseau épistémique de co-occurrences entre les concepts abordés dans les articles (donnés par les codes PACS pour ce qui concerne la physique, et par des mots-clés extraits à travers des méthodes automatiques pour la linguistique computationnelle). Nous mettons notamment en évidence que le réseau épistémique a une structure modulaire et une distribution des degrés hétérogène. La structure en communautés peut sans doute être expliquée par des processus de sélection locaux. Un examen empirique montre que les dynamiques épistémiques locales dépendent aussi bien des structures sociales et épistémiques passées. De plus, nous montrons que lévolution du réseau social dépend également de facteur épistémiques, ce qui semble indiquer que les deux réseaux évoluent lun avec lautre.

ModĂ©lisation et analyse Ă  base de graphes de citations de textes de loi : histoire d’une collaboration entre mathĂ©maticiens et juristes

Romain Boulet

Jeudi 23 Janvier 2014 Ă  11h30, salle 25-26/105

Slides

La complexitĂ© juridique est de plus en plus prĂ©sente et dĂ©battue ; cette complexitĂ© possède plusieurs aspects dont celui induit par les (très nombreuses) citations croisĂ©es de textes : c’est l’aspect que nous modĂ©liserons et analyserons dans cet exposĂ© grâce Ă  la thĂ©orie des graphes et l’analyse des rĂ©seaux. L’exposĂ© commencera par une rapide introduction sur les graphes et rĂ©seaux et la prĂ©sentation des problĂ©matiques liĂ©es aux sciences juridiques que nous aborderons. En particulier, le texte de loi sera vu Ă  deux niveaux de granularitĂ© : le code et l’article. Dans un premier temps, nous analyserons donc le rĂ©seau des codes juridiques. Chaque code constitue alors un nĹ“ud du rĂ©seau et les liens sont les liens de citations de textes entre les diffĂ©rents codes. Bien que ce rĂ©seau possède un petit nombre de sommets, il n’en demeure pas moins difficile Ă  apprĂ©hender de par son fort nombre d’arĂŞtes (et donc sa forte densitĂ©). En considĂ©rant chaque code comme un grand domaine juridique et en parvenant Ă  extraire une structure de ce rĂ©seau, nous pouvons exhiber une cartographie des grands domaines juridiques. Dans un deuxième temps, nous changerons d’Ă©chelle et de granularitĂ© : le texte de loi considĂ©rĂ© (et donc le nĹ“ud du nouveau rĂ©seau) sera l’article au sein du code de l’environnement. Nous comparerons la structure du rĂ©seau de citations des articles du code de l’environnement avec la structure choisie par la commission supĂ©rieure de codification (dĂ©coupage du code de l’environnement en sept livres). Romain Boulet est actuellement MaĂ®tre de ConfĂ©rences en mathĂ©matiques Ă  l’UniversitĂ© Lyon 3 ; les travaux prĂ©sentĂ©s ont Ă©tĂ© faits en collaboration avec Pierre Mazzega (Directeur de Recherche Ă  l’IRD) et Danièle Bourcier (Directrice de Recherche au CNRS) de 2009 Ă  2012.

Le contrĂ´le de la forme des rĂ©seaux par leurs membres : le fils de discussion comme rĂ©seau d’interaction

Bernard Conein (1) & Alexandre Delanoë (2)

Jeudi 09 janvier 2014 Ă  11h, salle 25-26/101

Slides

En proposant d’explorer comment, en envoyant un message sur une liste de discussion, un contributeur peut contrĂ´ler la forme du rĂ©seau dans lequel il intervient, on montrera quun fil de discussion peut se dĂ©crire comme un rĂ©seau de rĂ©pliques dont lextension (nombre de messages, nombre de contributeurs) est gouvernĂ©e par des dynamiques de contrĂ´le propre Ă  certaines sĂ©quences d’interactions. Slides disponibles Ă  l’adresse suivante : B. Conein :http://www.complexnetworks.fr/?p=1750 A. DelanoĂ« : http://alexandre.delanoe.org/academie/docs/2014-01_DelanoeConein.svg

Détection de communautés recouvrantes dans des réseaux de terrain dynamiques

Qinna Wang

Jeudi 12 Décembre 2013 à 14h,salle 25-26/101

Slides

Dans le contexte des rĂ©seaux complexes, la structure communautaire du rĂ©seau devient un sujet important pour plusieurs domaines de recherche. Les communautĂ©s sont en gĂ©nĂ©ral vues comme des groupes intĂ©rieurement denses. La dĂ©tection de tels groupes offre un Ă©clairage intĂ©ressant sur la structure du rĂ©seau. Par exemple, une communautĂ© de pages web regroupe des pages traitant du mĂŞme sujet. La dĂ©finition de communautĂ©s est en gĂ©nĂ©ral limitĂ©e Ă  une partition de lensemble des nĹ“uds. Cela exclut par dĂ©finition quun nĹ“ud puisse appartenir Ă  plusieurs communautĂ©s, ce qui pourtant est naturel dans de nombreux (cas des rĂ©seaux sociaux par exemple). Une autre question importante et sans rĂ©ponse est lĂ©tude des rĂ©seaux et de leur structure communautaire en tenant compte de leur dynamique. Cettethèseporte sur lĂ©tude de rĂ©seaux dynamiques et la dĂ©tection de communautĂ©s recouvrantes. Nous proposons deux mĂ©thodes diffĂ©rentes pour la dĂ©tection de communautĂ©s recouvrantes. La première mĂ©thode est appelĂ©e optimisationde clique. L’optimisation de clique vise Ă  dĂ©tecter les nĹ“uds recouvrants granulaires. La mĂ©thode de l’optimisation de clique est une approche Ă  grain fin. La seconde mĂ©thode est nommĂ©e dĂ©tection floue (fuzzy detection). Cette mĂ©thode est Ă  grain plus grossier et vise Ă  identifier les groupes recouvrants. Nous appliquons ces deux mĂ©thodes Ă  des rĂ©seaux synthĂ©tiques et rĂ©els. Les rĂ©sultats obtenus indiquent que les deux mĂ©thodes peuvent ĂŞtre utilisĂ©es pour caractĂ©riser les nĹ“uds recouvrants. Les deux approches apportent des points de vue distincts et complĂ©mentaires. Dans le cas des graphes dynamiques, nous donnons une dĂ©finition sur la relation entre les communautĂ©s Ă  deux pas de temps consĂ©cutif. Cette technique permet de reprĂ©senter le changement de la structure en fonction du temps. Pour mettre en Ă©vidence cette relation, nous proposons des diagrammes de lignage pour la visualisation de la dynamique des communautĂ©s. Ces diagrammes qui connectent des communautĂ©s Ă  des pas de temps successifs montrent lĂ©volution de la structure et l’Ă©volution des groupes recouvrantes., Nous avons Ă©galement appliquer ces outils Ă  des cas concrets.