Contenu
- La loi de Zipf expliquée
- Expérience de base
- Loi de Zipf sur les marchés à la vapeur
- Que pouvons-nous apprendre sur Steam?
- Conclusions
Il y a quelques instants, un de mes amis m'a suggéré de regarder une vidéo de Vsauces sur la loi de Zipf, le principe de Pareto et leurs apparitions mystérieuses tout autour de nous. Voici un petit aperçu pour attirer votre attention: 80% de la population vit dans 20% des villes les plus populaires; 80% des terres appartiennent à 20% des propriétaires les plus riches; Comme le prédisent la loi de Zipf et le principe de Paretos, 80% des ordures se trouvent dans les 20% des rues les plus achalandées.
Pas assez? Eh bien, comme je l’ai découvert hier, le terrier du lapin ne s’arrête pas là ... Plein de scepticisme, j’ai décidé de regarder combien de temps les gens passent à jouer à des jeux Steam ... Bien. 80% du temps des gens est consacré à 20% des jeux les plus populaires ... Intéressant? Eh bien, lisez la suite, il y a plus dans cette histoire.
Arrivé à plus de 20 minutes, Vsauces est génial et explique beaucoup de choses sur Zipf, mais il est très timide pour nous montrer le mécanisme fondamental qui contribuerait à expliquer pourquoi Zipf fonctionne. Avant de poursuivre, j'aimerais expliquer cela brièvement.
La loi de Zipf expliquée
Il existe plusieurs façons conceptuelles d'expliquer l'intuition du principe 20/80. Le meilleur exemple, à mon avis, est celui sur les cratères de la lune.
Expérience de base
Alors, imaginez si vous voulez qu'il y ait une Lune intacte - une surface parfaitement lisse. Maintenant, supposons que certains astéroïdes de taille aléatoire frappent la Lune bon gré mal gré. Lorsque le premier astéroïde atterrit, il laisse un cratère. Maintenant, un autre frappe, laissant un cratère ailleurs. Chaque cratère fait partie de la surface totale. Par conséquent, il est possible que le prochain astéroïde aléatoire frappe près d'un cratère existant et le rejoigne, formant ainsi un groupe. Le risque qu'un nouvel astéroïde heurte un cratère donné est alors proportionnel à la taille existante des cratères et des astéroïdes. Cela signifie que le prochain astéroïde aléatoire est plus susceptible de rejoindre le groupe existant le plus large, le rendant encore plus grand. Une sorte de processus cumulatif, qui crée ensuite un mécanisme riche-pauvre pauvre-solitaire.
Gardez cela à l’esprit, car c’est là l’explication générale de "pourquoi" la loi Zipfs fonctionne avec une universalité aussi mystérieuse. L'exemple de l'astéroïde est assez simple, mais la question est de savoir ce qui va se passer après de nombreuses répétitions.
Un peu déroutant?
Eh bien, je me suis fait un plaisir de ramener ce premier point à la maison. NB! le graphique sera discuté plus tard, essayez juste et imaginez l'expérience.
Si nous observons la Lune réelle, il s'avère que, lorsque la quantité d’astéroïdes augmente considérablement, les diamètres de cratère observés s’accroissent de telle sorte que les 20% supérieurs des plus grands cratères s’approchent de 80% de toute la surface.
Donc, alors que nous allons vers plus d’astéroïdes, la distribution des groupes les plus populaires aux moins populaires s’apparente à une sorte de "distribution idéale" avec cette propriété 20/80 - une distribution de Pareto. Si vous faites le calcul, il s'avère que (en général), si le groupe le plus grand a la taille N, le deuxième groupe le plus grand est autour de la taille N / 2, le troisième N / 3 et ainsi de suite. Ceci s'appelle la loi de Zipf. Ce qui est étrange, c’est la loi de Zipf et la distribution de Pareto fonctionne pour une quantité déconcertante d’éléments (astéroïdes) et de groupes (amas de cratères). Bien sûr, il y a des biais et des perturbations aléatoires, mais la tendance générale est indéniable.
J'espère que vous pourrez voir comment les astéroïdes sont plus susceptibles de frapper de grands cratères sur la Lune et que les villes sont plus attrayantes s'il y a déjà plus de gens qui y vivent. Cependant, il faut bien se rendre compte que les villes sont loin d’être les seuls "groupes" qui se comportent selon Zipf.
Voici quelques exemples de recherches de Mark Newmans sur les distributions de Pareto. NB! Les graphiques sont en échelle log-log qui adoucit la forme hyperbolique des courbes, présentant une relation presque linéaire.
Initiale y = aX ^ (- b)
Journaux des deux côtés => log y = log a - b log X
Il est intéressant de noter que les cultes religieux affichent également la même tendance ... La plupart des phénomènes qui la caractérisent sont tout simplement cette tendance "grand-groupe-grandir". La loi de Zipf est donc persistante dans les mécanismes, où les préférences des éléments sont positivement liées à la taille du groupe (ce qui signifie que plus le groupe est grand, plus il est susceptible de grandir). C'est pourquoi j'aime penser à des groupes en tant que clusters et à des éléments en tant que clusters.
Loi de Zipf sur les marchés à la vapeur
Méfiant de ce dernier? Voici le temps que les gens passent sur les jeux les plus populaires sur Steam. Données de SteamSpy.
Si vous faites le calcul, il s'avère que 20% des jeux Steam les plus populaires représentent 80% du total des jeux. C'est pourquoi le mystère Pareto 20/80 fonctionne ici comme un charme ... Il faut remarquer cependant Zipf pour être vrai, CS: GO doit représenter 37,5% / 2 = 18,8% du temps total au lieu de 30%. Mais mis à part cette valeur aberrante (ARRÊTEZ DE JOUER CS: GO), la distribution Zipf-like est clairement là.
Voici le nombre de copies vendues pour les jeux les plus populaires.
Ça a l'air beaucoup plus gentil hein? Les copies vendues n'ont pas de grandes valeurs aberrantes, ce qui en fait un très bon modèle, ce qui constitue une différence notable. Cependant, il y a quelque chose de plus intéressant à conclure des différences entre les deux derniers graphiques.
Avez-vous remarqué à quel point la "queue" qui se trouve à droite est assez grosse dans le deuxième graphique? Eh bien, en termes simples, cela nous indique que les jeux "relativement impopulaires" sont en réalité beaucoup plus populaires que dans l'intrigue précédente.
En fait, il s'avère que 20% des jeux les plus populaires ne représentent que 60% des ventes, contre 80% des jeux. Intéressant? Vous pariez que votre cul est.
Que pouvons-nous apprendre sur Steam?
Eh bien, le fait que la popularité des jeux suive la distribution de Pareto nous indique qu’il existe effectivement un effet réseau positif qui incite les joueurs à choisir des jeux auxquels plusieurs personnes jouent déjà. La différence en matière de densité de queues nous indique que les utilisateurs de Steam sont beaucoup plus «aveugles du groupe», lorsqu’ils achètent des jeux qu’ils ne le font quand ils en jouent.
Pensez-y. Plus les gens achèteront des jeux indépendamment de "l'opinion populaire actuelle", plus la distribution de Pareto sera aplatie, car il est moins probable que les grands jeux se développent davantage. Si personne ne se soucie du nombre de personnes qui jouent déjà à un jeu et que la disponibilité de tous les jeux est la même, on peut s’attendre à ce que 20% des jeux les plus populaires représentent environ 50% des ventes et du temps de jeu (par exemple, en tenant pour normalement distribué).
Conclusions
Il y a donc deux facteurs qui contribuent à la distribution de Pareto sur les marchés Steam: le degré d'innovation des développeurs (combien de nouveaux cratères de la Lune sont formés) et la valeur attribuée par les joueurs (astéroïdes) à la taille actuelle du groupe, lors du choix du groupe. . Il s’avère que les joueurs sont très aveugles face à la taille d’un groupe lorsqu’ils achètent des jeux, mais au contraire quand ils les jouent. Cool hein?
Si vous souhaitez en savoir plus sur les distributions Zipf Law and Power Law, voici une conférence intéressante. De plus, assurez-vous de jeter un coup d'œil au papier de Newman!
Si vous voulez lire davantage de ce genre de choses, je vais rapidement essayer de joindre cette observation à un modèle, ce qui montre que les jeux multijoueurs plus populaires ont des prix plus élevés (ce qui indique que les joueurs préfèrent rejoindre des groupes de plus grande taille). Voir l'article ici. L'article de Piece De Resistance tentera de relier ces théories en expliquant comment les jeux multijoueurs, les réseaux sociaux et les villes sont en réalité des produits anticoncurrentiels ayant des effets de réseau (plus les consommateurs consomment un bien, plus les avantages pour chaque consommateur individuel) sont importants. les a intitulés avec cette brume mystérieuse de Zipfian ...
Jusque-là, amusez-vous!
P.S. Ajoutez un commentaire avec une idée amusante de relation 20/80 qui, à votre avis, pourrait être vraie.
Les miens sont:
80% de la nostalgie des gens est causée par 20% de leurs souvenirs les plus heureux (en réalité prouvé par le taux d'oubli d'informations à)
80% de la masse est concentrée dans 20% des objets spatiaux les plus grands (ce qui est effectivement prouvé pour la distribution de la force gravitationnelle)
Et bien sur
80% des dégâts dans les toilettes proviennent de 20% de ce que vous mangez (aucune recherche universitaire à proprement parler)