lundi 23 avril 2012

Les infographies pour le résultat des élections : des résultats peu lisibles

Aujourd'hui, après un dimanche des plus électoral, on voit maintenant fleurir des infographies pour nous montrer le résultat des élections en fonction des zones géographiques. On peut donc en profiter pour voir que tous les journalistes ne savent toujours pas retranscrire une donnée chiffrée de manière lisible et rigoureuse.

Une légende, s'il vous plaît ?


Ici, aucune légende associée à la teinte de couleur, rien ne nous dis que la couleur la plus pale foncé correspond au vote le plus élevé.


Pour Le nouvel observateur, on peut noter un grave point négatif : le vote par candidat oublie carrément de nous donner une échelle pour nous indiquer à quelle teinte correspond un certain pourcentage des voix !! Nous sommes donc complètement plongés dans l'arbitraire.

Les valeurs absolues, ça compte


Résultats de François Bayroux. On peut remarquer que l'on a l'impression qu'il est bien placé en Pyrénées-Atlantique et en Mayenne alors qu'il est au mieux 3ème.


Pour Le figaro (comme le nouvel obs), on donne une échelle de teinte entre le score le plus faible et le plus fort. Le tout sans donner une indication sur la valeur absolue. On peut ainsi croire que Bayrou a fait un excellent score dans les Pyrénées-Atlantique alors qu'il n'est arrivé que troisième dans ce département avec « seulement » 15,67% des voix. (Et en Mayenne, il est même quatrième.) De plus, l'échelle de teinte n'a pas la même étendue, le score le plus faible n'étant pas toujours du blanc pur.


De la couleur, oui, mais pas à tout prix


On remarque ainsi que tout le monde cherche à représenter des données avec une couleur pour que le résultat soit associé à un parti politique, or le simple fait que l'œil ne soit pas toujours aussi sensible pour toutes les teintes fausse le résultat. On va ainsi pouvoir croire qu'il y a de fortes variations alors qu'en fait c'est simplement notre œil qui est le plus sensible.

Carte des résultats pour Jacques Cheminade, on peut voir des couleurs aberrantes puisque l'on passe du rose (typiquement associé à la gauche) au violet (qui étant une couleur froide est plutôt associé à la droite)


On voit que cela suscite quelques surprises pour les candidats de gauche où le rouge est la couleur dominante et où on se retrouve avec Philippe Poutou dans la même gamme de couleur que François Hollande alors que son score maximal est de 4% à ... Saint Pierre et Miquelon. Et pour finir, on se retrouve avec Nicolas-Dupont Aignant en violet, jaune ou bleu en fonction des journaux.

Le nombre total de votants, une donnée importante


Résultats par commune à gauche pour Sarkozy, à droite pour Hollande (on notera l'inversion par rapport au mouvement représenté).


Enfin, le quotidien Le monde nous gratifie d'une carte par commune, qui mélange des données géographique, plus il y a de communes au km², plus il y a de points et des données relatives : le score étant marqué d'un point plus ou moins coloré. On plonge alors dans un flou complet où une donnée essentielle est oubliée : le nombre de votant.

En effet, toutes les cartes oublient de représenter une donnée essentielle pour les résultats : ce qu'un pour cent d'un département représente en nombre de votants. Une carte par anamorphose donnerait ainsi une image relativement différente du scrutin : François Hollande arrive en tête en Corrèze et de loin, certes, mais cela veut-il dire que ce département est important pour l'élection ? Non !! Par exemple, les voix qu'il récolte dans le Val de Marne représente plus que le nombre total de votants en Corrèze. Pour une élection locale, peu importe, mais pour une élection nationale, ça compte.

Un peu d'ordre dans tout ça


Une autre donnée importante : la position. Avec plus de 20% certains arrivent en seconde position .. où peuvent être troisièmes. Dans une élection ou seuls les deux premiers sont retenus, ce facteur est également important. Une carte additionnelle où l'on indiquerait les positions serait également intéressante, surtout pour le Front National qui s'il est rarement en tête (sauf dans le Gard) est pourtant souvent second, mais alternativement devant Nicolas Sarkozy ou François Hollande.

Et si on compare ?


Le monde a l'avantage de présenter des comparaisons entre différents candidats etc.. Cependant, on manque encore d'une vision claire des résultats. Pourquoi ne pas pouvoir comparer les résultats de Nicolas Sarkozy à ceux de Marine Le Pen ? C'est également une donnée importante que très peu de sites fournissent.


 Conclusion

Il semblerait que l'ère du numérique n'a pas encore apporté toutes les améliorations que l'on pouvait attendre en terme de représentation du vote. Pour l'instant, cette représentation est encore biaisée de manière significative : couleurs arbitraires, manque de légende, variations représentées différemment, manque des valeurs absolues, ignorance du nombre total de votants, etc. Ces données, pourtant purement numériques devraient être représentées de manière beaucoup plus complètes.

Voilà une liste non exhaustive des données que l'on pourrait donner de manière à donner une vision plus claire de ces données chiffrées.
  • Score absolu
  • Score relatif
  • Position
  • Évolution par rapport à l'élection précédente.
  • Carte par anamorphose (ou plus, simple, poids de chaque département en nombre total de vote)
  • Écart à la moyenne nationale
Étant donné que le gouvernement met maintenant publiquement en ligne les données électorales, il ne reste plus qu'à espérer que certains géographes ou historiens puissent exploiter ces données pour nous donner un vision plus claire et objective du résultat. Cela semble d'autant plus « facile » que des cartes au format SVG sont maintenant disponibles gratuitement sur Internet. En attendant, je vous recommande la lecture des excellents livres d'Edward Tufte :

Ces quatre livres sont la bible, et je pèse mes mots de la mise en image des données.

mardi 3 avril 2012

La publication des corrigés de concours

Aujourd'hui, plusieurs modes de communication des corrigés sont disponibles et se concurrencent : publication dans une revue comme le BUP, publication en format directement lisible sur internet (type chimix, ou MathML), publication dans un livre (comme nous l'avons fait récemment pour les corrigés de l'agrégation) ou publication en format imprimable.

Ayant déjà utilisé la plupart de ces modes de diffusion, j'y vois différents avantages et inconvénients qui dépendent du type d'épreuve concerné.

 

Dans le BUP

La publication dans le BUP est conditionnée à l'acceptation de leur format de proposition d'article. Or pour les épreuves de chimie-physique ou de physique, la typographie sous Word est plutôt pénible et sous-entend être en mesure d'acquérir et faire tourner ce programme propriétaire. Ce qui est évidemment impossible sous Linux.

De plus, s'il y a une correction typographique, elle n'est pas forcément complète sur le plan scientifique (on peut le comprendre).
Ce genre de publication est très bénéfique sur le plan personnel (on peut la présenter comme publication pédagogique) et est directement attribuable. L'auteur restant propriétaire de son article, il peut le rééditer sous une autre forme ce qui peut être intéressant dans le cadre de la publication ultérieure d'un livre.

Cependant, on peut également se retrouvé non publié s'il n'y a pas suffisamment de corrections proposées pour éditer un tome. Ce qui semble être le cas ces dernières années pour les épreuves de l'agrégation de chimie. Le jury de physique publie de manière autonome les corrigés des épreuves. Ce qui est très appréciable pour les gens préparant ce concours car cela permet d'avoir une idée très précise de ce qui est attendu par le jury.

Pour résumer :
Les + : Publication officielle, propriété de l'article, notoriété.
Les - : Risque de non édition, format de soumission propriétaire, non revu par des pairs, difficulté de correction des erreurs, diffusion restreinte.

 

Dans un livre

La publication dans un livre, c'est sûrement ce qu'il y a de plus rigoureux et exigeant. Une relecture est souvent effectuée par un relecteur externe. La typographie y est cohérente sur plusieurs centaines de pages et l'effort de mise en page est plus important. Si la rédaction devient alors rémunératrice, elle se réduit à 12% sur le prix HT du livres pour l'ensemble des auteurs, soit pas grand chose.

Pour résumer :
Les + : Publication officielle, notoriété, rémunérateur, relecture par des personnes tierces, cohérence au sein de l'ouvrage.
Les - : Temps de rédaction plus long, nécessité de retaper les énoncés, exigences de l'éditeur, rapport argent/temps négligeable, difficulté de correction des erreurs.

 

Directement imprimable

La publication en pdf a l'avantage d'être universelle, et en fonction du logiciel utilisé peut permettre d'être très cohérent sur plusieurs sujets. C'est ainsi que j'ai crée un template pour les corrigés publiés sur mon site de manière à garder une cohérence tout en ayant des correcteurs variés.

Ce mode de diffusion peut permettre de cibler un public très large à moindre frais. Avec très peu de moyens, on touche une audience quasiment maximale du moment que le référencement se fait correctement. Le temps de publication peut ainsi être extrêmement court : la correction d'un sujet du CAPES peut être bouclée en une semaine tout compris en s'y mettant à temps presque plein.

Cela peut également permettre de rendre public une correction qui n'aurait pas sa place dans un livre car isolée dans le temps (une épreuve datant de plusieurs années par exemple). Le format est très simple à mettre en œuvre car non soumise à des exigences éditoriales.

Pour résumer :
Les + : Facilité de mise en œuvre, rapidité, adaptabilité, cohérence, facilité des corrections, public visé maximal.
Les - : Non revu par des pairs, concurrence, non rémunérateur, non officiel.

 

Lisible sur internet

La publication en format directement lisible sur internet est sujette à caution, en général, la lecture ne peut être que factuelle et le format n'est pas forcément adapté à l'impression. De plus, si avec MathML le rendu peut être très proche d'un fichier imprimable, l'étape de conversion peut être technique et pénible. Par exemple, même si j'ai crée un script pour cette étape à partir de mes sources Latex, cela ne reste pas généralisable.

Pour résumer :
Les + : Référencement, accès direct à une portion d'épreuve, document cherchable, facilité de correction
Les - : Conversion technique, impression difficile, non revu par des pairs, peu lisible, concurrence.

Le cas Chimix : sans vouloir faire du dénigrement, le site chimix est pour moi un site qui n'est pas voué à avoir une haute valeur ajoutée sur la correction pour différentes raisons.
  •  Le fait de mélanger les énoncés directement avec le corrigé empêché l'étudiant de pouvoir chercher la réponse. 
  • Il manque la numérotation des questions qui pourrait permettre de s'y retrouver facilement. 
  • Les corrigés sont fragmentés pour augmenter des statistiques de visite sans aucune cohérence. 
  • De plus, certaines questions peuvent être absentes, ou leur énoncé est modifié par rapport à l'original. 
  • La publicité également omniprésente rend compliquée la lecture de la correction. 
  • J'ai également relevé de nombreuses erreurs dans différents sujets. 
  • Les notations utilisées sont très approximatives (lettres grecques par exemple, qui sont pourtant accessibles en HTML) et peuvent rendre difficile la lecture du corrigé. 
  • La navigation est également relativement erratique, pour trouver le bon énoncé, il faut souvent jongler pas mal pour arriver au corrigé désiré. Il manque un classement par type de sujet, puis matière puis année. Cela prendrait certes plus de clics mais serait beaucoup plus limpide.
  • La qualité des différents graphiques est généralement relativement  faible.

Cependant, il faut rendre à César ce qui est à César : le site est tout bonnement hallucinant de contenu, la quantité de sujet est clairement énorme et les gens qui tapent les corrigés doivent être de vraies machines. De plus, j'avoue consulter régulièrement leur site lorsque je tape mes corrections de CAPES pour comparer mes résultats aux leurs. C'est seulement s'il y a une différence que je me préoccupe de voir qui a tord.

Conclusion

Aujourd'hui, pour moi, malgré des avantages divers, la publication des corrigés à l'aide d'un livre me parait être le plus gratifiant en terme de publication officielle alors que la publication en pdf s'avère être un des moyens les plus simples de mettre cette correction à disposition d'un public vaste. C'est pourquoi je publie de nombreux corrigés sous forme  uniquement numériques. Les corrigés de sujet d'agrégation, en raison du travail qu'ils demandent sont eux plus sujets à publication dans des livres pour rendre un minimum attractif la rédaction de corrigés très exigeants sur le plan scientifique.

Pour moi, le livre se place sur le domaine de l'exigence et la robustesse du propos tenu alors que la publication libre se place dans le domaine de la rapidité et de la notoriété rapide à moindre coût. Le livre que nous avons édité répond plutôt à un objectif professionnel alors que les nombreux corrigés annexes rédigés correspondent plus à un désir d'aide gratuite et sont pour moi un moyen de donner de la notoriété au site à moindre frais. Je suis quasiment sûr que les sujets de CAPES peuvent représenter une grosse source de trafic alors qu'ils sont bien moins exigeants que les sujets corrigés pour l'agrégation de chimie.

Edit du 23/6/2016 : Je suis maintenant passé intégralement aux corrections librement accessibles. En effet, la publication sous forme de livre restreint trop l'accès aux corrections alors qu'elles peuvent intéresser un public beaucoup plus large. De plus, j'accueille depuis plusieurs années des corrections rédigées par d'autres personnes. Cela permet de diversifier les auteurs de correction tout en centralisant leur publication. Et comme je n'ai plus trop le temps pour taper des corrigés intégraux, c'est très pratique  ! De plus, je garantie un accès libre et gratuit aussi bien aux correcteurs qu'aux personnes consultant mon site.