Arrêt sur statistiques

Vous connaissez mon intérêt pour les chiffres et mon plaisir de le transmettre. Il a été comblé cette semaine [le 25 avril] avec la venue au Club de la presse et de la communication de statisticiens de l’Insee Normandie. Je prends aujourd’hui le prétexte de ce « Campus-sandwich », mais aussi d’autres rencontres organisées par l’Insee Normandie, pour faire un « arrêt sur statistiques », comme on parle « d’arrêt sur image ». Mon propos aujourd’hui n’est pas de m’intéresser aux résultats ni à l’analyse des données, mais de m’arrêter sur quelques commentaires faits par les statisticiens afin de partager mes réflexions sur la méthode statistique.

À l’occasion du « Campus-sandwich » de ce 25 avril, Jean-Louis Reboul, et son équipe avaient 1h30 pour donner quelques pistes afin de mieux se retrouver dans la forêt de données disponibles sur le site insee.fr.

Ils ont souligné que ces données doivent servir à éclairer le débat public et rappeler que « pour faire de la statistique, il faut des conventions, des seuils, et il faut interpréter ». Ce sont ces conventions, ces règles d’interprétation et aussi leurs limites qui m’intéressent aujourd’hui.

C’est en fait lors des derniers « Rendez-vous de l’Insee » consacrés aux “QPV” (quartiers politique de la ville), dont j’ai déjà parlé, que l’idée de cet « arrêt sur statistiques » a germé.

N’étant pas, contrairement aux autres participants, directement concernée par le sujet, j’ai pris de la distance par rapport aux enseignements que l’on pouvait tirer des différents exposés et des échanges qui suivaient, pour en tirer chaque fois une leçon de statistique, et de ce point de vue, j’ai été nourrie, car en trois heures, beaucoup des questions qui se posent lorsqu’on analyse des données ont été abordées. Je reviens ci-dessous sur certaines d’entre elles, et je dois avouer le réel plaisir que je retire des mots et des expressions mêmes que j’ai glanés durant ces rencontres.

Le choix du seuil

Le mode de calcul du seuil de pauvreté (60 % du revenu médian) définit un pauvre en France comme un individu ayant un niveau de vie inférieur à 1026 € (salaire 2016, pour une personne vivant seule ou encore 2150 € pour un couple avec 2 enfants). Avec cette définition, on compte 8,8 millions de pauvres, soit 14 % de pauvres. Avec un seuil à 50 %, on en compterait 5 millions.
Question : comment choisir le seuil le plus pertinent (en gardant en tête que l’objectif est « d’éclairer le débat public »)  ?

Le droit de comparer

Je l’ai souvent répété, un chiffre seul n’apporte pas une information pertinente, c’est la comparaison qui permet d’analyser.
Encore faut-il avoir le droit de comparer deux données entre elles. Il faut pour cela veiller à ce qu’elles aient la même source, et que la population de référence et le périmètre soient définis de manière à ce que l’on puisse comparer.
Pour des comparaisons dans le temps, cela pose la question de la pérennité des zonages et des modes de calcul.

Le décalage de temps

Le temps du recueil des données n’est pas le temps des décisions politiques, ce décalage est apparu clairement lors des échanges des “Rendez-vous de l’Insee”. Pour de nombreuses données collectées sur le thème de la politique de la ville, il faut compter 3 ans pour les remontées de données définitives et comparables, leur analyses par les statisticiens, et la mise à disposition. Mais sur le terrain, la nécessité de faire des bilans à mi-parcours pour les contrats politique de la ville achoppe sur cette question de délais.

La robustesse des données

La robustesse d’une donnée ou d’un indicateur (par opposition à sa fragilité) est ce qui assure sa fiabilité. Par exemple si l’échantillon est trop petit, ou mal construit, les données seront fragiles.

Le secret statistique

L’Insee ne diffuse que des données anonymisées, en veillant à ce qu’aucune information sur un individu de l’échantillon (personne, entreprise, collectivité, etc.) ne puisse être déduite des résultats. Lorsqu’il y a trop peu de monde dans une catégorie, on parle de secret statistique, et l’information n’est pas diffusée à cette maille, on agrège les résultats à une autre catégorie. Cela rend bien sûr indisponibles certaines informations .

Eclairer sans répondre

Le rôle des statisticiens n’est pas de répondre aux questions que se posent élus, journalistes, chercheurs, acteurs du terrains, mais de donner des informations qui leur permettront de répondre.

L’Open Data dans les collectivités normandes

Cette semaine, je vous invite à lire l’article paru sur le site paris-normandie.fr : “Les collectivités de Normandie ont-elles pris le train de l’open data ?” (ou accès direct à l’article complet ici). C’est un sujet que j’ai déjà évoqué (par exemple ici avec le fichier Sirene), car les données en libre accès bouleversent la manière de travailler dans les deux domaines auxquels s’intéresse ce blog : la gestion de bases de données et les infographies.
Amandine Briand, qui a mené l’enquête, nous propose ici un point très complet, avec des rappels sur ce qu’est l’open data ou un historique sur les étapes qui ont amené l’ouverture des données publiques depuis 2012. Mais le bonus, c’est la mise à disposition d’un outil de recherche interactif sur les collectivités et leurs “datas”.
Je vous laisse aller lire l’article, et si vous vous intéressez aux évolutions du site paris-normandie.fr, je vous donne quelques précisions ci-dessous.

À découvrir sur “PN Interactif”

Depuis quelques mois, l’univers numérique de Paris-Normandie évolue, avec une équipe dédiée, qui a vocation à produire du contenu interactif. Ainsi les articles ou reportages rassemblés sous l’onglet  “PN interactif” laissent s’exprimer pleinement toutes les possibilités du web, avec images, vidéos, animations ou infographies, et surtout une scénographie adaptée à la lecture à l’écran : “Grands formats” ou infographie.

Les “Grands formats”

Enquêtes illustrées, sur des sujets variés, dont voici quelques exemples :

Infographie
Des cartes interactives et quiz, dont voici quelques exemples :

A suivre de près

Ca me plait de relayer ici cet article sur l’open data, avec un sujet au cœur de mes préoccupations et un traitement exploitant les ressources et techniques du web. Et ça me plait de montrer que ça bouge à  Paris-Normandie, et que ça se voit déjà sur le site…

 

 

 

PIB régional : La Normandie, 1ère région industrielle

À l’occasion de la sortie du dernier numéro d’Insee Flash Normandie, traitant du produit intérieur brut (PIB) de la Normandie, j’ai choisi d’en tirer l’infographie à paraître dans La Lettre EcoNormandie de cette semaine. Vous voyez ci-dessus le graphique (réalisé par les infographistes de Paris-Normandie).

Ce que le graphique nous indique

  • Entre 1990 et 2015, la part de l’industrie a baissé en Normandie : elle comptait pour un quart de la valeur ajoutée en 1990 (25,6 %) contre un cinquième 25 ans plus tard (20,8 % soit -4,8 points).
  • L’industrie a mieux résisté en Normandie (-4,8 points) que sur l’ensemble des régions de province (-6 points).
  • En 2015, la Normandie reste une région industrielle comparée aux autres régions de province, la part de l’industrie y est de 4,2 points plus importante (20,8 % vs 16,6 %).
  • Le différentiel s’est même accentué en 25 ans : passant de 3,1 points (25,6 % vs 22,5 %) à 4,2 points (20,8 % vs 16,6 %).

On peut de même, sur les autres secteurs, comparer l’évolution sur 25 ans et observer les différences entre Normandie et France de province. On retiendra surtout que l’agriculture a également baissé partout en France, tandis que la construction restait stable. Du côté du tertiaire marchand, la Normandie est à la traîne, la part de ce secteur n’ayant augmenté en 25 ans que de 1,4 point en Normandie, contre 3,7 en Province.

Ce que le graphique n’indique pas

La lecture de l’Insee Flash est riche de nombreux autres enseignements, parmi lesquels on retiendra quelques points :

  • En 2015, le produit intérieur brut (PIB) de la Normandie est estimé à 91,7 milliards d’euros. La région contribue pour 4,2 % au PIB national et se situe au 9ᵉ rang des régions de province.
  • La part de l’industrie dans la valeur ajoutée régionale (20,8 %) positionne la Normandie comme la première région industrielle.
  • En 2015, la valeur ajoutée normande progresse de 1,7 % en valeur, soit 0,3 point de moins qu’en France métropolitaine (0,1 point de moins qu’en province). L’industrie est pourtant plus dynamique dans la région (+ 5,5 % contre + 3,8 % en province) et contribue fortement à la croissance : cette année, sur 1,7 point de croissance de la valeur ajoutée totale en Normandie, l’industrie en réalise les deux tiers.
À savoir : PIB et Valeur ajoutée

On lira avec intérêt sur le site de l’Insee (ici) la méthode de calcul des BIP et VA régionaux. Je rappelle ci-dessous les définitions que vous y trouverez également.

  • Le PIB est égal à la somme des valeurs ajoutées brutes des différentes branches d’activité, augmentée des impôts moins les subventions sur les produits.
  • La valeur ajoutée (VA) est le solde du compte de production. Elle est égale à la valeur de la production diminuée de la consommation intermédiaire.

Ce que j’ai envie d’en dire

Parmi les avantages d’un graphique, on retiendra son côté synthétique et la mise en évidence des comparaisons. J’en ai fait la démonstration ci-dessus. Même en me focalisant sur la part de l’industrie, il m’a fallu deux fois plus de place pour écrire mes commentaires, que l’espace pris par le graphique lui-même.

Je rappellerai aussi ce que j’ai déjà dit (par exemple ici) : une donnée seule n’a pas d’intérêt, c’est la comparaison qui permet de comprendre et d’analyser. Ici, je dois dire qu’on est gâté. Si on s’intéresse à la part de la valeur industrielle, on peut comparer la Normandie avec la France de province, on peut comparer l’année 2015 et l’année 1990, on peut comparer les évolutions en Normandie et en Province, on peut comparer l’évolution de l’industrie avec les autres secteurs…

À retrouver aussi dans le
Guide EcoNormandie

La dernière édition du Guide EcoNormandie, qui vient de sortir (j’en ai parlé ici et ), propose de nombreux indicateurs et points de repère, dont 2 pages « Normandie en chiffres » avec des données tirées du site de l’Insee. En page 11 les informations sur le PIB, et la Valeur ajoutée sont à jour.

 

 

 

 

 

Je vous donne ci-dessous le lien direct pour retrouver ces données sur le site de l’Insee :

Produits intérieurs bruts régionaux et valeurs ajoutées régionales de 1990 à 2015