27 novembre 2006

La naissance du web d'après les moteurs de recherche

J'avais examiné il y a quelque temps les nombres d'occurences sur internet, d'après Yahoo, des nombres correspondant à des années (en excluant les années divisibles par 10 qui parasitent...), et un événement étrange apparaissait : on retrouvait bien approximativement une droite "à la Zipf", mais en y regardant de plus près on voyait plutôt deux segments de droite. Après vérifications sur les autres moteurs de recherche, le phénomène apparaît à chaque fois (l'échelle pour le nombre de résultats dans le moteur de recherche, en ordonnées, est arbitraire et a été choisie pour faire coller au mieux, à l'oeil, les diverses courbes, remarquons tout de même le comportement bizarre de MSN pour "2005" et "2006") :

La moyenne nous permet de constater que le point de rupture entre les deux parties de la courbe est 1995 : il y a donc plus de pages qui mentionnent 1996, 1997, 1998, etc, qu'on pourrait s'y attendre. D'où viennent ces pages supplémentaires ?

L'explication la plus probable est que les pages créées à l'année n sont plus susceptibles de citer l'année n. On peut le vérifier en utilisant le Chronologue sur les différents chiffres correspondant aux années récentes :

Ainsi, c'est à partir de 1995 à peu près que la création de pages web a explosé ! Toutefois on peut voir que cette tendance semble s'amenuiser, puisque le segment de courbe 1996-2006 n'est pas parallèle et décalé avec le segment 1980-1995, il est juste décalé au début, mais revient maintenant "à la normale". Il reste à attendre encore quelques années pour voir comment évolue la tendance, et interpréter avec plus de précisions les phénomènes observés, ou la fin de l'année pour voir la progression de "2007" dans le Chronologue...

1 commentaire:

Dado a dit…

Finalement, on aura réussi à voir le big bang. ;)