Faux camembert ou camembert faux ?

Mea culpa

Il y a quelques semaines, je vous ai présenté le dernier numéro de la revue In/Off, éditée par le Club de la presse et de la Communication de Normandie, et notamment la double page d’infographie, que j’ai réalisée avec Adèle Pasquet, et qui traitait cette année des résultats d’un sondage auprès des journalistes et communicants normands sur leur utilisation des réseaux sociaux.
Vous pouvez lire le post (ici) ou feuilleter le numéro d’In/Off ().

Dans ce post, j’avais repris et commenté trois des quatre graphiques présentés dans cette double page. Et pour cause… le quatrième graphique, un camembert, est faux, et c’est entièrement de ma faute, seulement, je m’en suis aperçue tardivement, justement en voulant le commenter dans ce blog.

De la vertu pédagogique d’une faute

J’ai choisi aujourd’hui de revenir sur ce graphique et sur cette erreur, d’une part pour la corriger et vous donner une bonne lecture des résultats, d’autre part pour en profiter, et vous éviter de tomber vous-même dans ce piège grossier une prochaine fois.

Les résultats bruts

Partons du commencement : les résultats du sondage, repris dans le tableau ci-dessous.

 

247 personnes ont répondu à cette question, en cochant un ou plusieurs items, parmi les 8 proposés. La plupart des communicants ou journalistes ont donné plusieurs réponses, car leur attente est multiple : au total, on a ainsi recueilli 943 réponses pour cette question, soit en moyenne presque 4 réponses par personne (exactement 3,82 réponses en moyenne par personne, c’est ce qu’indique le total de 382%).

Le calcul des pourcentages

L’attente la plus mise en avant, c’est “faire de la veille” : 184 personnes ont répondu à cette question, soit 74% des répondants.
Pour calculer ce pourcentage, on prend le nombre de réponses à cet item (184), que l’on divise par le nombre total de répondants (247) : 184/247 = 0,72 (ou 72%).

On peut de même reprendre tous les items, et calculer le pourcentage correspondant de personnes ayant coché chacune des réponses. C’est ce qui est indiqué dans la dernière colonne, dans le tableau ci-dessus, en %. On voit ainsi que 4 items sont cités par plus de la moitié des personnes interrogées : Faire de la veille, gagner en notoriété, étendre son réseau professionnel et augmenter le trafic sur son site web.

Le graphique juste

On peut donc représenter graphiquement les résultats, par exemple par des barres, comme ci-dessous (bien moins belles que la mise en page d’Adèle Pasquet dans la revue).

 

 

 

 

 

 

Pourquoi le camembert est-il faux ?

J’en reviens à mon camembert. Il faudrait d’ailleurs se demander plutôt en quoi il est faux. En fait il est faux d’une part d’un point de vue conceptuel – parce que le camembert n’est pas adapté à ce type de résultats et qu’il aurait fallu choisir un autre type de graphique – d’autre part tout simplement parce que les pourcentages sont faux, ils ne correspondent pas à ce qui est indiqué dans le tableau.

En fait ces deux erreurs sont liées. Un camembert, par convention, indique qu’on partage un tout (le camembert entier), en tranches ou en parts distinctes, qui refont le tout si on les remet ensemble. Or, “ensemble” cela correspond à 100% de la population interrogée. Pour avoir le droit d’utiliser le camembert, il faut que chaque répondant ne se retrouve qu’une fois dans les réponses, c’est-à-dire qu’il n’y ait qu’une réponse possible. On peut alors faire une partition sur cette population. Par exemple une question du type “A quelle tranche d’âge appartenez-vous ?” se prête bien au camembert, qui montrer visuellement la répartition des personnes en fonction de leur réponse.

Les logiciels d’assistance à la composition de graphiques connaissant bien cette règle, les pourcentages ont été recalculés automatiquement, de manière à ce que le total fasse 100% : c’est pour cela que les pourcentages indiqués sur le camembert faux – publié dans In Off et reproduit tout en haut de la page – sont faux. Et cela m’a complètement échappé à la relecture (il est vrai réalisée un peu à la dernière minute).

Revenons sur la manière dont ont été recalculés ces pourcentages. 

Comme je l’ai dit plus haut, le camembert va permettre de répartir visuellement une population (population totale = 100%) en parts plus ou moins grandes selon le nombre de réponses reçues. Si on veut répartir l’ensemble des réponses (943 réponses), la population totale qui sera retenue sera non plus la population des personnes ayant répondu (247) mais la population des réponses elles-mêmes (943), et c’est par rapport à cette population totale de 943 que seront recalculés les pourcentages. Ainsi, pour calculer le pourcentage correspondant à l’item “faire de la veille”, on prend le nombre de réponses avec cet item (184) , et on le divise par le nombre total de réponses (943) : 184/943 = 0,195 (ou 19,5%). CQFD !
Avouez que l’on s’en fiche pas mal, de savoir que cela correspond à 20% des réponses. Par contre, de savoir que pour 74% des répondants c’est une attente importante, c’est intéressant !

La morale de l’histoire

Le choix d’un graphique en camembert n’est possible que si et seulement si (condition nécessaire et suffisante) la somme des pourcentages égale 100%.

Autrement dit, il faut que toutes les lignes se réfèrent à la même population et qu’il n’y ait qu’une seule réponse possible par personne.

La pédagogie de l’erreur

J’ai déjà évoqué (ici) la difficulté de bien lire un graphique, e la nécessité d’accepter le fait que, parfois, on s’aperçoit trop tard de notre faute (c’est vrai pour moi aujourd’hui). Cela montre que rien n’est évident, ni dans la manière de matérialiser une information, ni dans la lecture rapide d’un graphique.

Plutôt que d’essayer de masquer mon erreur (je me demande combien de lecteurs de In Off l’ont remarqué ?), j’ai choisi d’en parler, ce qui m’a donné l’occasion d’expliquer en détail comment on lit et comment on choisit tel ou tel type de graphique.

J’attends vos commentaires.

Nota : vous avez compris que je ne parle pas ici de faux camembert, mais bien de camembert faux !

 

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *