Arrêt sur statistiques

Vous connaissez mon intérêt pour les chiffres et mon plaisir de le transmettre. Il a été comblé cette semaine [le 25 avril] avec la venue au Club de la presse et de la communication de statisticiens de l’Insee Normandie. Je prends aujourd’hui le prétexte de ce « Campus-sandwich », mais aussi d’autres rencontres organisées par l’Insee Normandie, pour faire un « arrêt sur statistiques », comme on parle « d’arrêt sur image ». Mon propos aujourd’hui n’est pas de m’intéresser aux résultats ni à l’analyse des données, mais de m’arrêter sur quelques commentaires faits par les statisticiens afin de partager mes réflexions sur la méthode statistique.

À l’occasion du « Campus-sandwich » de ce 25 avril, Jean-Louis Reboul, et son équipe avaient 1h30 pour donner quelques pistes afin de mieux se retrouver dans la forêt de données disponibles sur le site insee.fr.

Ils ont souligné que ces données doivent servir à éclairer le débat public et rappeler que « pour faire de la statistique, il faut des conventions, des seuils, et il faut interpréter ». Ce sont ces conventions, ces règles d’interprétation et aussi leurs limites qui m’intéressent aujourd’hui.

C’est en fait lors des derniers « Rendez-vous de l’Insee » consacrés aux “QPV” (quartiers politique de la ville), dont j’ai déjà parlé, que l’idée de cet « arrêt sur statistiques » a germé.

N’étant pas, contrairement aux autres participants, directement concernée par le sujet, j’ai pris de la distance par rapport aux enseignements que l’on pouvait tirer des différents exposés et des échanges qui suivaient, pour en tirer chaque fois une leçon de statistique, et de ce point de vue, j’ai été nourrie, car en trois heures, beaucoup des questions qui se posent lorsqu’on analyse des données ont été abordées. Je reviens ci-dessous sur certaines d’entre elles, et je dois avouer le réel plaisir que je retire des mots et des expressions mêmes que j’ai glanés durant ces rencontres.

Le choix du seuil

Le mode de calcul du seuil de pauvreté (60 % du revenu médian) définit un pauvre en France comme un individu ayant un niveau de vie inférieur à 1026 € (salaire 2016, pour une personne vivant seule ou encore 2150 € pour un couple avec 2 enfants). Avec cette définition, on compte 8,8 millions de pauvres, soit 14 % de pauvres. Avec un seuil à 50 %, on en compterait 5 millions.
Question : comment choisir le seuil le plus pertinent (en gardant en tête que l’objectif est « d’éclairer le débat public »)  ?

Le droit de comparer

Je l’ai souvent répété, un chiffre seul n’apporte pas une information pertinente, c’est la comparaison qui permet d’analyser.
Encore faut-il avoir le droit de comparer deux données entre elles. Il faut pour cela veiller à ce qu’elles aient la même source, et que la population de référence et le périmètre soient définis de manière à ce que l’on puisse comparer.
Pour des comparaisons dans le temps, cela pose la question de la pérennité des zonages et des modes de calcul.

Le décalage de temps

Le temps du recueil des données n’est pas le temps des décisions politiques, ce décalage est apparu clairement lors des échanges des “Rendez-vous de l’Insee”. Pour de nombreuses données collectées sur le thème de la politique de la ville, il faut compter 3 ans pour les remontées de données définitives et comparables, leur analyses par les statisticiens, et la mise à disposition. Mais sur le terrain, la nécessité de faire des bilans à mi-parcours pour les contrats politique de la ville achoppe sur cette question de délais.

La robustesse des données

La robustesse d’une donnée ou d’un indicateur (par opposition à sa fragilité) est ce qui assure sa fiabilité. Par exemple si l’échantillon est trop petit, ou mal construit, les données seront fragiles.

Le secret statistique

L’Insee ne diffuse que des données anonymisées, en veillant à ce qu’aucune information sur un individu de l’échantillon (personne, entreprise, collectivité, etc.) ne puisse être déduite des résultats. Lorsqu’il y a trop peu de monde dans une catégorie, on parle de secret statistique, et l’information n’est pas diffusée à cette maille, on agrège les résultats à une autre catégorie. Cela rend bien sûr indisponibles certaines informations .

Eclairer sans répondre

Le rôle des statisticiens n’est pas de répondre aux questions que se posent élus, journalistes, chercheurs, acteurs du terrains, mais de donner des informations qui leur permettront de répondre.

Le prétexte des usages de l’eau

La rubrique “Data” de la Lettre EcoNormandie de cette semaine s’est inspirée de données proposées dans l’édition 2019 de La Normandie en chiffres et en cartes, proposé par CCI Normandie. Un prétexte pour revenir aujourd’hui à la fois sur la source de données exploitée dans cette “data”, sur les données très riches de ce Panorama économique 2019 et sur la visualisation graphique de données.

Une bonne source pour l’eau

Le site Eau de France met à disposition sa banque nationale des prélèvements quantitatifs en eau (BNPE), l’outil national dédié aux prélèvements sur la ressource en eau.

Les informations portent sur les volumes annuels prélevés sur la ressource en eau et sont déclinées par localisation et catégorie d’usage de l’eau, avec un accès par régions, départements, communes ou ouvrages.

Ainsi, lorsque l’on sélectionne “Normandie” et “2016” (la dernière année disponible, avec la date de mise à jour précisée : 23/11/2018), on voit s’afficher les données ci-contre.

Dans le panorama économique

Je le disais d’emblée, c’est en feuilletant le tout nouveau Panorama économique 2019 que j’ai découvert cette source (et bien d’autres d’ailleurs). 75 pages de chiffres, de graphiques et de cartes pour cerner tous les domaines de l’économie et découvrir de nombreuses sources. Autant dire que j’ai là une bonne source d’inspiration pour mes prochains “chiffre de la semaine”.

Visualiser les données

Outre la découverte de la base BNPE et la pertinence des données sur l’usage de l’eau, j’ai retenu du Panorama économique le choix esthéitique pour la visualisation des données, et j’ai transmis le graphique aux infographistes de Paris-Normandie qui, chaque semaine, composent les graphiques de la rubrique Data. Sandra Vain l’a ainsi adapté pour La Lettre. Je vous laisse comparer.

Qu’apprend-on ?

L’énergie d’abord

La première information qui saute aux yeux grâce à l’infographie, c’est la proportion utilisée pour l’énergie : 98 % en moyenne en France, et même 99 % en Normandie, comme le montre le graphique ci-contre.
(voir aussi ci-dessous, à quoi sert l’eau utilisée dans les centrales électriques dans “Conclusion 2”)

En Normandie, l’industrie avant l’irrigation

Deuxième information qui saute aux yeux également, c’est à quel point la Normandie se distingue de la moyenne des régions françaises : l’industrie y représente 49 % des usages (hors énergie) et l’agriculture / irrigation seulement 2 % (vs 23 % et 28 % en France).

Conclusion 1 :
rien ne vaut un graphique

Finalement, il m’a fallu sept paragraphes (voir ci-dessus) pour expliquer ce qui se trouvait sur le graphique (voir ci-dessous)

  • 1 La source de la BNPE figure en petit sous le graphique
  • 2 Le fait que cette information est publiée dans le Panorama de l’économie normande figure en bas du graphique
  • 3 La visualisation… parle d’elle même
  • 4 Le graphique de gauche met en évidence la prépondérance de l’énergie (99,1% de l’usage de l’eau en Normandie)
  • 5 Le graphique de droite met en évidence la différence d’usage entre la Normandie et la France (et le faible usage de l’irrigation en Normandie !)

Conclusion 2 :
Pour aller plus loin que le graphique

Un graphique met en évidence des différences, il ne les explique pas. Il peut éveiller l’intérêt. Ce que le graphique ne dit pas, par exemple, et qui pose question lorsqu’on constate la part prédominante de l’énergie, c’est ce que couvre exactement ce qui correspond à l’usage “énergie”.
On trouve la réponse sur le site Geoidd, service statistique du ministère du Développement durable :

L’eau est essentiellement utilisée pour le refroidissement des centrales nucléaires ou thermiques

On peut aussi trouver des informations sur l’utilisation de l’eau sur le site d’EDF :

Annuellement, en moyenne, le volume d’eau nécessaire au
fonctionnement du circuit de refroidissement d’un réacteur est
compris entre 50 millions de mètres cubes (si le refroidissement
est assuré par un aéroréfrigérant) et 1 milliard de mètres cubes
(si l’eau est rejetée directement dans le milieu naturel) soit
respectivement un besoin de 6 à 160 litres d’eau prélevés pour
produire 1 kWh
.”

Une erreur réparée

Dans la première version du graphique – avant de faire les recherches sur ce à quoi correspond l’usage “énergie” – j’avais repris le titre vu dans le Panorama économique de la CCI, en précisant “prélèvement en eau douce”. Mais en rajoutant par rapport au graphique du panorama les données sur l’énergie, j’aurais dû supprimer le mot “douce” du titre. En cherchant des données sur l’utilisation de l’eau dans les centrales, sur le site EDF et sur le site de la BNPE, j’ai constaté que l’eau utilisée pour le refroidissement des centrales nucléaire normandes est principalement une eau littorale (eau de mer).
J’ai donc corrigé le titre en supprimant “douce”

Retour sur les RDET

Jeudi 28 s’est déroulée la première édition des Rencontres du développement économique territorial, consacrée à la Normandie, et il y avait du beau monde sur la scène de l’amphithéâtre de la maison de la chimie : élus, chefs d’entreprise, financeurs, institutionnels… 

La Lettre EcoNormandie, partenaire des rencontres, a assisté à l’ensemble des débats, et Nathalie Jourdan, rédactrice en chef de La Lettre, a animé la table ronde intitulée “Normandie Région monde : attractivité et rayonnement“. Les échanges ont nourri plusieurs papiers de La Lettre de cette semaine, et j’ai souhaité partager mes impressions de la journée.

Du beau monde

L’image que je retiendrai de la journée, c’est celle qu’ont choisi de donner la vingtaine d’intervenants de la journée, celle d’une Normandie volontaire et unie pour la réussite économique. Les mots-clés de la journée : maillage, ambition collective, engagement, réseaux, solidarités régionales, ambassadeurs de la région… Et l’idée générale, c’est de savoir “chasser en meute”, pour reprendre les mots d’un des intervenants.

En écho aux RDET

Deux articles à lire dans La Lettre EcoNormandie cette semaine :

La Normandie industrielle ou « l’effet Intel »

L’analyse s’appuie en autres sur les témoignages de Cédric Turnaco, porte-parole du groupe germano-hispanique Siemens Gamesa en France et de Pierre-Jean Leduc, PDG du groupe Dedienne et président du Medef, tous présents à la table ronde citée plus haut. L’article évoque aussi Cotral Lab, qui vient de recevoir le label “Vitrine de l’industrie du futur”, et dont le président, Laurent Capellari, était présent aux RDET. 

Mon facteur réduit la fracture (numérique)

Une innovation menée avec les facteurs normands, dont Florence Pavageau, déléguée régionale du Groupe La Poste en Normandie, a rendu compte lors des rencontres du jeudi 28 mars.

Ils ont dit…

Quelques citations glanées au cours de la journée :

« Revendiquer qu’on est les meilleurs, en s’appuyant sur les points d’excellence. Là où on est moyen, on restera moyen, là où on est bon on doit être les meilleurs » 

Hervé Morin, président de la Région Normandie

« Ce qui compte : le projet + une bonne coordination avec élus et financiers »

Benoît Paget, président de la société Green Big

« LA RTE (Responsabilité territoriale des entreprises), c’est faire de la RSE sur un territoire). Elle apporte la fierté aux salariés, la reconnaissance pour les marques, et elle embarque les sous-traitants du territoire. La question est : comment on territorialise nos entreprises ? »

Marc Maouche, Directeur régional Orange Normandie

« Les nouvelles technologies, ça fait peur. Quand on veut innover, on risque de se planter. Et on se plante souvent. Je dis qu’on a le droit de se tromper 25% des fois. Sinon c’est qu’on n’invente pas assez. »

Laurent Capellari, président de la société Cotral Lab

« L’innovation ce n’est pas une option. »

Sophie Gaugain, 1ère vice-présidente de la Région Normandie, en charge du développement économique

« Je m’implique pour que Normandie soit reconnue comme terre d’industrie. C’est parce qu’on s’implique qu’on à un retour. Si nous ne nous impliquons pas dans la formation il ne faut pas s’étonner de ne pas trouver à embaucher les bons profils. Chacun peut contribuer au rayonnement. »

Pierre-Jean Leduc, PDG de Dedienne Multiplasturgy et président du MEDEF Normandie

« J’ai trouvé en Normandie une qualité de dialogue exceptionnel que je n’ai pas trouvé ailleurs. La volonté de travailler en réseau émerge et la Normandie a un temps d’avance. »

Emmanuèle Saura, Directrice territoriale Normandie de SNCF Réseau

« Nous assistons à un alignement des planètes favorable à la Normandie, avec une volonté de la puissance publique et des entreprises de travailler ensemble. Le risque d’échec, c’est de ne pas se comprendre ou de ne pas se faire confiance. »