12 novembre 2006

Approximations et information

Je suis tombé sur un graphique intéressant dans un Figaro trouvé dans le train en rentrant d'Orléans : l'évolution des réponses des sympathisants socialistes à la question "Qui souhaiteriez-vous voir désigné(e) candidat(e) du PS à la présidentielle". Il accompagnait un article en première page intitulé "Royal s'effrite encore mais reste en tête devant DSK et Fabius". Sur le graphique en effet, on constate cet effritement, mais ce qui choque surtout c'est la remontée de popularité de Dominique Strauss-Kahn. Un examen des pourcentages montre que cette seconde impression est fausse : les trois courbes n'ont pas été mises sur la même échelle, mais dilatées (beaucoup pour Fabius, un peu moins pour DSK) et translatées, comme on peut le voir en comparant avec le vrai graphique pour ces valeurs :


On remarque aussi que le vrai graphique montrait bien la tendance d'effritement, et la remontée, visible mais toujours pas inquiétante pour les ségolistes, de DSK : ainsi il était tout à fait possible d'utiliser la visualisation des vraies valeurs plutôt que celle qui semble un peu truquée. Pourquoi le Figaro ne l'a pas fait et a préféré effectuer des changements qui donnent de fausses impressions ? Mystère.

Un autre exemple d'approximations qui m'amusent, celles qui font qu'un total arrive au dessus de 100%, c'est le cas par exemple de ce délicieux sandwich Poulet Tandoori de marque Leader Price avec 101% d'ingrédients, sans compter le soja, les crustacés et les poissons !


Dans ces cas-là il est vrai que ces bizarreries d'approximation sont tout à fait compréhensibles, j'arrive moins à m'expliquer en revanche pourquoi les gens en général et des journalistes en particulier prétendent qu'ils citent des phrases de façon exacte, en les déformant.

J'avais déjà évoqué les méfaits des copier-coller de dépêches d'agences de presse, eh bien là c'est un effet inverse. Notre exemple : une petite phrase de Ségolène Royal extraite de son intervention de janvier qui a agité la blogosphère cette semaine. Je m'étonne d'ailleurs que cette phrase n'ait pas fait plus réagir que le contenu général du discours. En effet, on a eu droit à un débat sur les 35h de présence des enseignants, sur le soutien gratuit, sur le fait que les propos avaient été coupés pour nuire à Ségolène Royale (la partie finale où justement elle explique que le soutien gratuit pour les élèves donnerait lieu à des compensations pour les professeurs). Bref, tout cela peut être débattu, on peut être pour ou contre. En revanche, si l'on prononce la question suivante "Donc comment se fait-il que des enseignants du secteur public aient le temps d'aller faire du soutien individualisé payant et ils n'ont pas le temps de faire du soutien individualisé gratuit dans les établissements scolaires ?", on émet incontestablement des suspicions sur le sérieux et la rigueur morale des enseignants. Travailler 35 heures par semaine laisse bien évidemment le temps d'effectuer d'autres activités rémunérées, sous les conditions fixées par la loi.

Des doutes formulés aussi clairement devraient être cités de façon exacte, mais ce n'est pas toujours le cas. Sur les blogs, on s'en doute, mais dans Le Monde non plus, qui négligemment remplace "des enseignants" par "les profs". On peut visualiser les différentes formes qui apparaissent sur le net grâce aux logiciels de bioinformatique qui font de l'alignement de séquences multiples, notamment GeneDoc qui est facile à installer sous Windows et à prendre en main pour obtenir le résultat suivant :


Les 7 versions de la phrase proviennent des sites suivants :
1 - Vidéo originale, Reuters, Nouvel Obs.
2 - Article du Monde
3 - Site de LCI
4 - Un blog
5 - Site Neteco
6 - ZeScoop
7 - Un forumeur sur le forum France 2

On peut alors donner à chaque mot de la phrase originale une taille proportionnelle à sa fréquence parmi les 6 variantes :


Et ceci nous permet de chercher toutes les variantes possibles sur les moteurs de recherche, en remarquant en particulier que les groupes de mots "le temps" et "faire du soutien" sont toujours conservés.

Aucun commentaire: