mercredi 2 mai 2012

Les infographies pour le résultat des élections : des résultats peu lisibles (2)

Suite à mon dernier billet, je me suis dit qu'il était sûrement possible de réaliser des cartes qui sont plus parlantes. Pour cela, j'ai pris les données du ministère de l'intérieur sur le site data.gouv. J'ai également utilisé un fond de carte libre sur wikipédia.

J'ai ensuite crée un petit fichier pour traiter l'ensemble des données. Afin que l'ensemble soit facilement utilisable, j'ai rendu le tout légèrement animé pour que l'ensemble soit interactif.

Premier essai : l'abstention

La carte complète est disponible en cliquant sur le lien.
Ce premier essai donne déjà une bonne idée de ce qu'il se passe :
L'abstention est relativement élevé en Corse, en île de france et dans le Nord-Est. Les valeurs les plus élevées étant dans les DOM. (Je n'ai pas trouvé de carte qui donne les COM ou ex TOM). Cependant, je tombe dans le défaut des valeurs absolues non indiquées.

J'ai également fait un essai en traçant les frontières en noir.  Mais les contours détournent le regard et nous rendent moins sensibles aux variation de luminosité. Ce qui au final nous fait perdre de l'information : il est ainsi difficile de voir que les départements s'étant le moins abstenus sont le Lot, le Gers, la Vendée et les Côtes d'Armor.

Deuxième essai : Une légende améliorée pour analyser le vote pour quelques candidats

 Pour corriger le problème des valeurs absolues, j'ai un peu changé les choses pour améliorer la légende. J'ai donc ajouté la valeur moyenne, le maximum et le minimum, le tout étant ensuite replacé dans une contexte de pourcentage.

Une légende plus parlante pour les cartes : à gauche on donne le minimum,le maximum et la moyenne du pourcentage obtenu par le candidat, au centre on indique l'échelle de teinte. à droite, on donne la distribution du vote avec les différents quartiles afin de voir si le vote est très dispersé. Ici les données concernent Marine Le Pen.


Pour Jacques Cheminade, l'ajout de la légende permet de donner du contexte aux données : il a un score très faible et partout, la carte donnant sa position (voir plus bas dans l'article) dans chaque département est également révélatrice : il est tout le temps dernier. Dans la carte de droite, seule la lecture des valeurs permet de voir ce très faible écart et le résultat très faible, il faut comprendre et analyser la légende pour voir ce que nous dit la carte. À gauche, la légende résume l'ensemble du vote et permet de comprendre tout de suite que ce candidat est un « outsider ».


À l'inverse, pour Marine le Pen, on peut voir que la dispersion de ses résultats reste modérée avec de fortes exception pour les départements d'outre-mer et Paris. On voit également que le vote front national est surtout ancré dans les départements qui forment le pourtour de la méditerranée et le Nord-Est du pays.
L'ajout de la distribution du vote permet de voir que le premier quartile (en vert) est est relativement étendu et que le reste des résultats est relativement proche de la moyenne nationale.



Le vote pour François Hollande est quasiment l'exact opposé de celui pour le Front National avec une moitié est ou ses résultats sont beaucoup plus faibles. On note que la Corrèze est très attachée à son candidat avec plus de 40% des voix ainsi qu'un vote massif pour le candidat de gauche dans les DOM. On remarque également une plus forte dispersion que pour le vote Front National et le fait que pour le candidat de gauche, c'est le dernier quartile qui est très étendu.


Pour Nicolas Sarkozy on remarque que les zones où le Front National a un vote élevé sont relativement distinctes de celles où l'UMP a un fort pourcentage. Même si il y a quelques département (Bas-Rhin, Haut Rhin, Alpes-Maritimes) où les deux récoltent beaucoup d'électeurs. Il domine plutôt sur l'axe Strasbourg-Brest. On note également que les DOM sont divisés : pour Mayotte, il y a un très fort pourcentage pour le président sortant alors qu'il réalise son plus faible score à La Réunion. Comme pour François Hollande, on voit que c'est le dernier quartile qui est le plus étendu.

Le nombre de votants



Le cas le plus frappant est celui de  François Hollande, malgré « l'anomalie » Corrèze ou son score était très élevé, on voit que le nombre de votants pour François Hollande reflète plus la répartition géographique des français : on voit quasiment pour tous les candidats quelques départements se détacher : Le nord, Rhône-Alpes, les bouches du Rhône, la Gironde, La Loire-Atlantique et la région Parisienne. En effet, tous ces département avoisinent ou dépassent le million d'inscrit sur les listes électorales alors que la Lozère par exemple, représente seulement 60 000 inscrits! On a ainsi une vision qui complète la précédente avec cette deuxième carte : on peut pondérer le pourcentage par le nombre total de votants.

 La position

Le cas le plus intéressant est celui de Marine le Pen :
Tout le monde a pu voir que Marine le Pen était arrivée en tête dans le Gard, on sait également qu'elle est troisième au plan National. Mais ici, on peut voir simplement qu'elle est tout de même deuxième dans une quinzaine de départements, ce qui n'est pas du tout négligeable.


Pour François Hollande, on voit maintenant que les zones où il n'arrive pas premier sont situées sur deux axes distincts : l'un est-ouest qui correspond aux département où Nicolas Sarkozy a un pourcentage élevé et la frontière est qui est l'axe fort de Marine le Pen. On voit également qu'il arrive tout de même plusieurs fois en troisième position (environ 12 départements)

La somme de ses sous-ensembles ?

En juxtaposant ces différentes données, on cumule ainsi les indications et les indicateurs sur le vote pour un candidat. Sur une surface de 700×500 pixels, je réussis à combiner environ 400 données chiffrées de manière quantitative. On retrouve l'idée de petits multiples chère à Edward Tufte : il faut mieux une somme de petite représentation avec un angle de vue différent qu'une seule représentation détaillée. Toutes ces cartes indiquent des grandeurs différentes et pourtant elles reflètent toutes le vote. Comme quoi, une élection ne se réduit pas à une carte. Et encore, il manque de nombreuses données intéressantes. (l'écart à la moyenne nationale et l'évolution par rapport à l'élection précédente, par exemple)

Ces cartes sont réunies ici :
http://eolindel.free.fr/images/elections/
Le vote pour chaque candidat est donné dans la carte portant le nom du candidat avec le suffixe «.svg».
Les données sont également interactives : on peut cliquer sur un département et obtenir encore quelques informations supplémentaire. Même si elles ne sont pas complètes.

Conclusion

Les résultats sont ici donnés à une échelle que l'on peut caractériser de mésoscopique : les données sont moyennées à l'échelle des départements, ce qui lisse par exemple les différences qu'il peut y avoir entre les zones rurales et les zones urbaine.


Je suis en train de traiter les données pour les communes, cependant, leur nombre rend les choses un peu plus difficile ainsi que leur représentation spatiale : la carte, sans les données fait déjà 15 Mo et l'ensemble des données fait également 5 Mo, ce qui commence à faire beaucoup pour traiter l'ensemble sur un ordinateur de bureau classique.

Pour simplifier le problème, je me suis intéressé à la distribution des votes par candidat et par taille de commune. Les résultats sont assez frappants mais également assez prévisibles : le vote pour Marine Le Pen décroit très fortement avec la taille de la commune alors que c'est l'inverse pour François Hollande. Pour Jean-Luc Mélanchon et Nicolas Sarkozy, la taille de la ville influe peu sur la distribution du vote.

Il manque également des données comparatives entre candidats, cependant, cela demande alors d'autres données à fournir pour donner une vue plus réaliste. Car par exemple, le Monde compare les communes et les candidats mais en n'ayant pas la même échelle de couleur pour les deux candidats, ce qui encore une fois biaise le résultat. J'essaierai peut être de faire un carte comparative des deux candidats principaux pour les résultats du second tour.