Visualisation et analyse de la structure de la communauté à l'aide de graphiques

Les graphiques sont un outil génial pour visualiser de grandes quantités de données et les relations entre les éléments individuels. Nous l'avons utilisé pour évaluer la connectivité de nos communautés et comprendre l'interaction entre différents groupes et domaines thématiques.

En conséquence, nous avons trouvé des superconnecteurs, découvert comment les communautés diffèrent dans les différentes villes de Russie, et nous avons également découvert qu'il y a deux fois et demie plus d'entrepreneurs parmi les plus de 50 ans que la moyenne de tous les participants dans nos communautés.



Qui nous sommes et ce que nous faisons


Comme il s'agit de notre premier article sur Habré, je dois dire quelques mots sur nous-mêmes. En fait, nous exploitons un réseau gratuit et à croissance rapide d'espaces de présentations et de travail d'équipe, où tout le monde peut organiser des séminaires, des formations, des réunions ou tout simplement travailler comme dans le coworking. Dans notre terminologie, nous les appelons points d'ébullition.


Ouais, c'est gratuit

De plus, nous développons et soutenons la plate-forme numérique Leader-ID , qui aide à établir des relations entre tous les participants au système, à partager des connaissances, à rechercher des personnes et des partenaires partageant les mêmes idées et à créer leurs propres communautés.

À l'heure actuelle, nous avons enregistré plus de 800 000 personnes.

Tout a commencé il y a trois ans, lorsque le réseau n'avait qu'un seul espace - à Moscou, sur Mayakovskaya.


Point d'ébullition à Maly Konyushkovsky Lane à Moscou

Un mois plus tard, en novembre 2016, le second est apparu à Saint-Pétersbourg. Et aujourd'hui, nous avons 82 points d'ébullition dans 54 villes de Russie.

Comment ça marche


Notre principe est très simple: nous créons un lieu où peuvent venir des personnes actives et attentionnées, celles qui ont leurs propres idées, développements, projets. Dans nos espaces, ils peuvent rencontrer des partenaires ou des investisseurs, obtenir des idées ou des conseils sur la façon de changer leur projet pour le mieux ou de mettre en œuvre une idée.

Comment ça marche? En théorie, lorsque vous venez à l'un de nos événements ou simplement au coworking, vous rencontrez de nouvelles personnes prêtes et ouvertes à la communication. Plus vous venez souvent, plus vous rencontrez de personnes et plus vous commencez à discuter de quelque chose. Et plus les raisons de la réflexion et de nouvelles idées apparaissent. Nouvelles idées - nouveaux contacts - nouveaux projets.

Pour tester cette théorie, nous avons décidé d'utiliser l'analyse de réseau et de voir comment la densité de communication entre les participants à nos événements change.

Que voulons-nous savoir exactement à l'aide de graphiques


Premièrement , nous voulions savoir si une véritable communauté s'était formée à l'intérieur de chacun des Points et à quel point elle était fragmentée.

Deuxièmement , comment cette communauté est divisée en thèmes et directions, comment les gens de différentes sphères interagissent et s'il y a des superconnecteurs là-bas - des gens qui suivent des directions distinctes, ou tout se passe-t-il au hasard.

Troisièmement , combien se recoupent (et se recoupent-ils du tout) dans les affaires, l'éducation et le pouvoir. En théorie, il y a des contacts partout, mais nous étions intéressés par la pratique.

De plus, nous étions intéressés par la différence entre les points dans les différentes villes de Russie.

Paramètres généraux


Ce que nous avons fait pour améliorer les résultats et obtenir une image plus réaliste:

  1. Les émissions ont été supprimées - données d'événements où le nombre de participants était anormalement différent de la moyenne.
  2. Ils ont établi les règles de connectivité - ils ont accepté que les gens soient connectés les uns aux autres s'ils participaient à des événements communs. Plus ils ont participé à des événements ensemble, plus la connexion est forte.

Alors allons-y.

À quoi ressemble la communauté sur le graphique et ce qui se passe dans des directions distinctes


À ce stade, nous voulions visualiser la connectivité des membres de la communauté locale les uns avec les autres, ainsi qu'évaluer l'impact de la taille des événements et des sujets sur l'établissement de connexions. Par communauté, nous entendons ceux qui sont inscrits sur Leader-ID et qui ont assisté ou organisé au moins une fois des événements dans leur région.

Comme base, nous avons pris 85 événements de Petrozavodsk, auxquels ont participé de 2 à 20 personnes (le nombre total de participants à ces événements est de 414 personnes). Ils ont fait l'hypothèse que plus il y avait de personnes lors de l'événement, moins il y avait de pouvoir de communication entre elles: après tout, lors d'un grand événement, la chance de parler avec chaque personne était moindre que lors d'un petit où tout le monde se connaissait ou se connaissait facilement.

En conséquence, nous avons divisé nos 85 événements en deux catégories: un petit événement (2 à 8 participants) et un événement moyen (9 à 20 participants).

Plusieurs événements trop importants ont été exclus de l'échantillon selon notre postulat sur la normalisation des données et le rejet de l'analyse des émissions.

Méthodes d'analyse utilisées

  • Graphique à 2 modes pour créer un réseau d'affiliation.
  • L'algorithme Kamada-Kawai pour la prise en compte de la densité et de la quantité des liaisons (les composants à couplage étroit et un grand nombre de liaisons internes sont visuellement plus proches sur la figure).
  • Normalisation des centralités dans un graphe social et dans un graphe social équilibré.
  • Analyse statistique pour la préparation et la purification des données.
  • Visualisation dans Pajek.

Ainsi, le réseau d'événements secondaires s'est avéré comme ceci:



On voit clairement ici que le cœur du réseau est plus puissant que sa partie périphérique (éléments individuels non connectés au graphe principal). Nous avons donc affaire à une communauté pleinement formée.

En analysant le réseau de participants de petits événements seulement (108 personnes), nous avons vu que plusieurs composants séparés sont apparus à l'intérieur - isolés de la structure générale de l'entreprise de 2 à 5 personnes:



Le réseau s'est avéré plus petit en puissance, mais la connectivité reste élevée.

Voyons maintenant la visualisation des zones thématiques.

Pour ce faire, nous avons divisé toutes les activités en trois groupes:

  • événements sur des projets sociaux (44 événements);
  • événements sur le développement de la région (18 événements);
  • événements sur l'éducation et la technologie (10 événements).

Avec ces paramètres, les réseaux construits différaient visuellement les uns des autres. Commençons par les projets sociaux, événements auxquels 176 personnes ont assisté.



Ici, nous voyons un grand noyau. Peut-être du fait que les thèmes des projets sociaux se recoupent.

Dans le développement de la région (93 personnes), le tableau est différent:



Il y a une cohérence sur les sujets: il y a des tendances phares qui génèrent de nouveaux sujets qui attirent de nouveaux participants. Pour cette raison, des nœuds apparaissent sur le graphique qui connectent des groupes distincts de participants hautement connectés.

Regardons maintenant la direction de l'éducation et de la technologie (129 participants):



On peut voir que les gens ici sont unis en petits groupes sur des sujets. La cohésion de l'ensemble de la communauté est assurée grâce à des participants à forte centralité d'interdépendance, c'est-à-dire à ceux qui s'intéressent simultanément à plusieurs sous-thèmes. Et en général, la connectivité globale de la communauté éducative est plus faible que dans les deux cas précédents.

Qu'avez-vous trouvé utile

  • Avec l'aide de Degree Centrality, les 10 premiers participants ont été identifiés comme ayant le plus grand nombre d'événements organisés conjointement avec des hommes.
  • Avec l'aide de Betweenness Centrality, ils ont révélé les 10 principaux participants à travers lesquels la plus grande quantité d'informations passe par le réseau.
  • A révélé le nœud par lequel le réseau principal est connecté aux clusters.
  • Les paires de connexions les plus solides ont été révélées - les personnes les plus connues (top 10 et top 50).
  • Zones désignées pour la poursuite des recherches.

Par conséquent, nous savons à qui nous adresser s'il est nécessaire de développer certains domaines, de diffuser certaines informations ou de présenter une idée. Les personnes qui sont au cœur du graphique pourront le faire plus rapidement que les autres.

Le pouvoir se confond-il avec les affaires et la science


Pour répondre à cette question, nous avons spécifiquement recherché un point régional où tous ces groupes sont également actifs, et nous en avons trouvé un à Tomsk.

En construisant le graphique pour Tomsk, nous avons adhéré à l'hypothèse que notre espace (Point) dans cette ville favorise le mélange de personnes de différentes sphères institutionnelles et augmente leur connectivité. Nous parlons de représentants de l'éducation et des sciences, des entreprises et du gouvernement.

Méthodes d'analyse de Tomsk

L'une des principales fonctions du point d'ébullition est de connecter les personnes, les idées et les solutions. Pour étudier dans quelle mesure cette fonction est implémentée, nous utilisons l'orientation de puissance du réseau, basée sur une combinaison de principes simples:

  • les nœuds se repoussent et ont tendance à fuir vers la périphérie;
  • les connexions entre les nœuds les rapprochent.

Pour obtenir un aspect plus réaliste, nous utilisons la méthode en plusieurs étapes (OpenOrd), car bon nombre de ses étapes correspondent au cycle de vie du développement communautaire: «liquide», «expansion», «refroidissement», «crunching and boiling» (ce cycle est répété en continu avec divers paramètres).

La base d'analyse comprenait 650 événements auxquels plus de 23 000 participants ont pris part. Nous avons construit un graphique, grâce auquel il a été possible d'identifier plusieurs faits et phénomènes, ainsi que de construire un modèle d'interaction par paires entre les trois catégories.

Le premier. Dans 80% des événements, des liens trilatéraux se sont noués entre des représentants de la communauté scientifique, des entreprises et de l'État. Parmi ceux-ci, 20% sont des événements hautement spécialisés, dont le sujet est important pour les représentants d'un domaine particulier, par exemple l'enseignement professionnel.



Pour simplifier, nous avons visualisé l'affiliation institutionnelle en utilisant la couleur. Nous avons donc vu que la communauté universitaire est la plus fermée à elle-même (il y a des zones violettes prononcées sur le graphique).

Le deuxième. Sur la base de nos données, deux clusters dominants peuvent être distingués:

  • les communications auxquelles participent les trois acteurs - universités, entreprises et gouvernement;
  • communications auxquelles seules les universités et les entreprises participent.


Deux groupes d'événements dominants dans la composition des participants

Parmi les groupes distingués (universités, entreprises et gouvernement), les universités et les entreprises affichent la plus grande activité de communication. Le graphique montre les domaines pour lesquels l'activité des représentants des deux clusters est caractéristique.

Le troisième. Au cours de l'année écoulée, un noyau de participants a été formé dans la région, impliqué dans des communications intensives et significatives, qui, en règle générale, sont unies par des thèmes scientifiques et technologiques - technologies de bout en bout, marchés de demain, mise en œuvre de la stratégie de développement scientifique et technologique. Cette interaction est visible sur le graphique bleu.



Ici, la visualisation est présentée de manière à montrer comment les différentes connexions partent du centre du réseau (cœur).

Quatrièmement. Grâce au graphique, il a été possible de manifester le phénomène des soi-disant superconnecteurs - des individus qui connectent les participants dans un ou plusieurs domaines thématiques à la fois.

Selon nos estimations, il y a environ 600 candidats pour les super connecteurs: environ 1 utilisateur unique sur 23 ou 1 participant sur 38 aux événements.



Nous recherchons des superconnecteurs pour les engager dans la co-création et le travail d'équipe, car c'est à travers eux que passe le plus grand nombre de communications.

Quelle analyse nous a donné

  • Les superconnexions sont identifiées - des personnes qui ont assisté à de nombreux événements et, éventuellement, agissent en tant que communicateurs dans la communauté ou entre les communautés.
  • Les thèmes des événements qui attirent le pouvoir, les affaires et la science sont identifiés: il s'agit des technologies numériques transversales, des marchés d'avenir et d'une stratégie de développement scientifique et technologique.

En utilisant la visualisation, nous avons également identifié et étudié de nombreux modèles, dont certains sont décrits ci-dessous.

Résistance structurelle : notre réseau est toujours en évolution, mais nous tenons néanmoins à assurer sa force et à cet égard, nous avons considéré sa structure générale. Le noyau central se compose de plusieurs clusters interconnectés, ce qui évite un seul «point de destruction» (un réseau avec un cluster central peut facilement se désintégrer si le cluster principal est «compromis»).

Proximité (distance) : Nous pensons qu'en réduisant la distance entre les personnes, nous pouvons stimuler le flux d'idées. Plusieurs caractéristiques contribuent à cet objectif. Par exemple, si une idée a de nombreux moyens et astuces potentiels à partir desquels elle peut être élaborée, la probabilité de sa réalisation augmente. Sur le graphique, nous avons eu l'occasion de voir des participants qui ont réussi à combiner des fonctionnalités. Certains dans la connexion intercluster; d'autres au sein du cluster, ce qui en combinaison donne une amélioration significative.

Entropie : Le mélange des choses est crucial pour garantir le développement de nouvelles idées (ce processus résiste à la stagnation). Nous regardons l'entropie à la fois au niveau macro (cluster) et micro (individuel) et prenons en compte la variété des classifications (thème de l'événement, affiliation des participants avec la sphère institutionnelle, etc.). Nous pensons qu'avoir de nombreuses configurations différentes est critique en soi. L'entropie élevée est importante pour mélanger les idées et leur permet de circuler librement et rapidement dans de nombreuses directions. Une faible entropie est importante pour une concentration plus profonde et le développement d'idées.

Nous espérons que nous pourrons stimuler le développement du réseau avec l'avènement de nouvelles propriétés qui ne sont pas planifiées d'en haut, mais qui apparaissent comme si elles étaient au cours de l'évolution naturelle et du développement des communautés.

Évaluation des différences par ville


Tous les points d'ébullition sont créés selon un modèle unique, mais se développent de différentes manières. Par conséquent, nous avons décidé d'évaluer la structure et la connectivité des communautés, en mettant en évidence les sujets fondamentaux pour chaque lieu.

Par exemple, nous avons extrait des données sur des points à Ivanovo et Vladivostok. Mais ici, il convient d'identifier certaines différences d'approche par rapport à la recherche de Points à Tomsk ou Petrozavodsk:

  • nous avons prêté attention aux types de communautés (communautés d'affaires, communautés éducatives, etc.), et pas seulement aux groupes individuels. Cela a permis d'analyser la densité des liens non seulement à l'intérieur, mais aussi entre eux: les communautés sont-elles fermées à elles-mêmes ou traînent-elles avec des entreprises similaires ou idéologiquement différentes;
  • nous avons comparé les résultats de l'analyse du réseau avec l'agenda des points d'ébullition, c'est-à-dire avec les sujets dominants des événements qui s'y trouvent.

Les méthodes

Dans le graphique social, nous avons fait la différence entre deux participants s'ils ont participé à des événements ou des projets communs. Plus les participants ont assisté à des événements généraux, plus la nervure entre eux est courte. Après cela, nous avons regroupé les participants en communautés en utilisant le déploiement rapide des communautés dans les grands réseaux . Habituellement, les participants qui ont assisté à de nombreux événements communs se sont regroupés en grappes communes. Nous avons sélectionné de grands clusters et essayé de les caractériser clairement.

Point d'ébullition d'Ivanovo






Ainsi, dans l'actif du point d'ébullition, nous avons identifié les personnes qui, plus souvent que d'autres, viennent à des événements, les organisent ou viennent au coworking. Ils, avec des super connecteurs, assurent la connectivité.

La focalisation thématique à Ivanovo a un parti pris humanitaire prononcé. La connectivité s'est avérée assez élevée, mais en même temps, les directions ont un isolement prononcé, qui est clairement visible dans la coloration de la couleur du noyau. Le graphique montre également que les communautés d'affaires sont plus susceptibles d'être fermées, tandis que les bénévoles et FashionNet sont des communautés ouvertes (en termes de possibilité d'adhésion).

Point d'ébullition Vladivostok






Ici, nous adoptons une approche différente, en supposant que les communautés se réunissent autour d'un sujet. Avec l'aide d'une telle typologisation, nous avons séparé le noyau des communautés (qui se sont unies autour de celles-ci) de l'agenda (sujets des événements les plus populaires).

Selon le rapport, les composantes thématiques sont exprimées plus clairement à Vladivostok qu'à Ivanovo. Plus de la moitié des événements sont en quelque sorte liés à l'éducation, plus l'informatique a pris une part importante. Et le graphique du noyau parle de peu de connectivité dans les domaines thématiques. Il est possible que le noyau commence à peine à s'y former, c'est pourquoi il semble multipolaire.

Point d'ébullition - Moscou


Au point d'ébullition - Moscou, dans la rue Maly Konyushkovsky, nous étions les plus intéressés par le noyau.



Le graphique montre qu'à Moscou, il n'y a pas d'actif. Au lieu de cela, un rôle de connexion est joué par les communautés méthodologiques - celles qui s'unissent autour des écoles méthodologiques.

Soit dit en passant, sur les structures de Moscou et d'Ivanovo, il y a une différence dans les approches des directeurs de programme: une communauté s'est réunie à Ivanovo, qui, dans différentes compositions, participe à différents événements, assurant la cohérence (nous appelons ces personnes «les actifs du point»). À «Moscou», au contraire, les événements se déroulent en règle générale sans ces personnes, mais d'un autre côté, cela génère plus de trafic dans le Point et, par conséquent, plus de personnes apprennent ce que nous faisons.

Ce que nous avons

  • Chaque Point régional fournit un agenda spécifique et devient une plateforme de communication et de développement de personnes spécifiques. Le regroupement nous a aidés à identifier les points où l'ordre du jour s'affaisse.
  • Nous avons appris à compresser un tas de données mixtes sur les communautés du Point en une seule image. Les directeurs de programme responsables des communautés de nos sites peuvent désormais évaluer rapidement la structure du Point avec lequel ils travaillent.

Analyse générale pour toutes les régions


Voyons ce qui peut être intéressant à l'intérieur de l'ensemble du système Leader-ID. Au moment de ces études, nous avions un demi-million de participants. En général, nous avons effectué un certain nombre d'analyses, mais pour l'instant, nous en parlerons deux:

  1. Nous avons déterminé comment la communauté éducative peut être différenciée et quels sujets sont liés par divers groupes participant à des événements sous la rubrique générale «Éducation».
  2. Identification de tendances communes pour des groupes sociaux individuels à l'aide de méthodes d'analyse de réseau (par exemple, des personnes de plus de 50 ans sont-elles impliquées dans le réseautage)

Mais tout d'abord.

Principaux sujets en éducation


Pour commencer, nous devions savoir si les responsables de projets éducatifs étaient liés les uns aux autres. Pour cela, nous avons fait les hypothèses suivantes:

  1. Les leaders se rendent à des événements intéressants pour eux ou les organisent, afin que nous puissions à nouveau nous tourner vers l'approche décrite ci-dessus et analyser la connectivité des participants aux événements.
  2. Étant donné que le domaine de l'éducation est très large, nous devons faire une hypothèse sur des sujets qui unissent tellement les gens que nous pouvons les appeler des communautés. : , , , , .

, :

  1. ( , , ), , ;
  2. ( , , ), , , ;
  3. ( , ), , .

:



— «» : , , . , .

, - Gephi, NetworkX.

, 50+


, , 50+ . , — 60 , .

50+. :



, -. .

, , . ( ) :

  1. Leader-ID 50 2,5 . 45 Leader-ID 50 , «», «Founder» 8% 3%.
  2. Leader-ID 50 , : , , , , .
  3. Leader-ID 50 , : , — .


— . , , . , , , .

-, .

Source: https://habr.com/ru/post/fr477976/


All Articles