Voir les réseaux. Petite introduction à l’analyse visuelle des réseaux

Résultats scientifiques Humanités numériques

Il est courant en sciences naturelles et en sciences sociales de s'appuyer sur des visualisations de réseaux pour explorer des ensembles de données relationnelles et illustrer les résultats. L'omniprésence de ces pratiques témoigne de leur utilité. Pourtant, ce type d'exploration reste fondée sur l'intuition, et ses fondements et limites sont encore largement implicites. Pour combler ce manque de formalisation, les chercheurs Tommaso Venturini, Mathieu Jacomy et Pablo Jensen1 proposent une documentation explicite sur l'analyse visuelle de réseaux et les algorithmes de visualisation des réseaux basée sur des forces d’attraction et répulsion entre les nœuds. À travers l'exemple d'un réseau de musiciens, groupes et labels de jazz, ils fournissent des conseils sur la façon de rendre les réseaux lisibles et d'interpréter leur forme.  Les résultats de leurs travaux viennent d’être publiés dans la prestigieuse revue internationale Big Data & Society.

 

  • 1Tommaso Venturini est chercheur CNRS au Centre Internet et Société (CIS, UPR2000, CNRS). Mathieu Jacomy est membre du Techno-Anthropological Laboratory, à l’Université d’Aalborg (Danemark). Pablo Jensen est chercheur CNRS au Laboratoire de Physique (LPENSL, UMR5672, CNRS / ENS Lyon).

Les réseaux ne sont pas seulement des objets mathématiques mais aussi des entités visuelles. Si les mathématiques des graphes sont largement exploitées en ingénierie et en sciences naturelles depuis le XVIIIe siècle, la visualisation des réseaux est devenue de plus en plus populaire au cours des deux dernières décennies. Cette renaissance visuelle est particulièrement perceptible dans les humanités et sciences sociales numériques, où la disponibilité croissante de données relationnelles a alimenté un regain d'intérêt pour les diagrammes de réseaux, mais elle a également touché d'autres disciplines telles que l'écologie, les neurosciences et la génétique. En général, il est courant dans la littérature scientifique d'illustrer les relations sociales, les flux économiques, les cooccurrences linguistiques, les interactions entre protéines, les connexions neuronales et de nombreux autres phénomènes relationnels sous forme de graphiques en « points et lignes ».

La fonction scientifique de telles cartes est toutefois rarement questionnée et souvent équivoque. Alors que les visualisations de réseaux sont généralement exclues des démonstrations (qui reposent plutôt sur des calculs et des mesures), elles sont régulièrement exposées pour fournir une compréhension plus tangible et intuitive des résultats.

Cette ambivalence ne doit pas être niée, mais explicitement abordée et exploitée pour une utilisation plus consciente des visualisations en réseaux. Comme le montrent les chercheurs dans leur étude, l'ambiguïté même qui rend les dessins graphiques impropres à la confirmation d'hypothèses les rend extrêmement utiles pour l'analyse exploratoire des données (EDA). Cela est particulièrement vrai pour le type de réseaux de taille moyenne que l'on trouve souvent dans les phénomènes sociaux et biologiques. Les réseaux couvrant des centaines à des milliers de nœuds sont trop grands pour être dessinés à la main, mais trop petits pour utiliser les métriques et les modèles. Avant de procéder à l'agrégation et aux tests statistiques, l'analyse visuelle offre un outil pour explorer la richesse des données relationnelles — un outil qui est de plus en plus répandu et pourtant étonnamment peu documenté. Pour pallier ce manque de documentation, cet article propose une petite introduction à la technique de l'analyse visuelle de réseaux (visual network analysis - VNA) et tente d'expliciter ses fondements.

L’article décrit en particulier comment utiliser trois variables visuelles (la position des nœuds, leur taille et leur couleur) pour représenter graphiquement des caractéristiques structurelles des réseaux telles que les communautés relationnelles (clusters), la centralité, l'intermédiarité. Cette traduction visuelle n’est cependant ni évidente ni sans écueils et l’article retrace l’histoire des algorithmes de spatialisation dits force-directed (basés sur des forces d’attraction et répulsion) pour mettre en évidence non seulement les avantages, mais aussi les faiblesses de cette approche.

Le « réseau jazz » avec (a) les étiquettes des nœuds les plus saillants pour chaque type (gris pour les musiciens, vert pour les groupes, bleu pour les sous-genres et rouge pour les labels) et (b) l'identification de la structure du réseau en termes d'évolution du langage musical du jazz

Référence

Contact

Tommaso Venturini
Chargé de recherche CNRS, Centre Internet et Société