Modèles statistiques pour les graphes aléatoires hétérogènes, application aux réseaux biologiques et sociaux
Résumé
Les données qui sont sous la forme de mesures de relations entre items sont de plus en plus disponibles, comme en témoigne l'extraordinaire développement des réseaux sociaux et des réseaux biologiques. Ce type de données oblige le statisticien à abandonner la structure usuelle d'un jeu de données de type individus-variables pour une structure de type individu-individu. Ces données "relationnelles" sont très souvent présentées sous la forme d'un graphe, même si cette représentation a ses limites, notamment quand le nombre d'individus dépasse la centaine. Le modèle probabiliste de graphe uniforme étudié par Erdos est trop simple pour représenter correctement les réseaux réels. Il faut donc développer des modèles pour des graphes hétérogµenes. Dans des travaux précédents nous avions développé un modèle de mèlange basé sur des variables latentes discrètes, appelé MIXNET, pour lequel nous avions utilisé une méthode d'estimation variationnelle. Dans cet exposé, nous proposons un nouveau modèle, appelé "Ideal-Type model", dans lequel les variables latentes discrètes sont remplacées par des paramètres continus caractérisant chaque individu. Nous analysons l'identifiabilité de ce modèle et proposons un algorithme pour obtenir les estimateurs du maximum de vraisemblance. Pour illustrer la méthode, un réseau social et un réseau biologique sont analysés.
Origine : Fichiers produits par l'(les) auteur(s)