Pandémie de Covid-19 : quelles statistiques ?

Les pouvoirs publics et les journaux nous livrent chaque jour leur lot de statistiques à l’échelle locale, nationale, européenne et mondiale, sur le nombre de contaminés, de morts, de guéris, d’hospitalisations… Ces courbes posent de nombreuses questions, et j’ai choisi d’en faire mon sujet du jour et, pour ne pas me perdre, je me concentre sur les statistiques régionales.
Comme d’habitude, mon but est multiple : vous faire connaître les sources, vous montrer comment l’infographie ou l’analyse que l’on en tire met en avant certains éléments (et seulement ceux-là) et soulever à certaines questions que cela peut poser.

Un chiffre seul ne veut rien dire : il faut comparer

Nous avons quotidiennement le nombre de morts liés au Coronavirus, à différentes échelles géographiques, mais savons-nous ce qu’il en est si on le compare au total des morts du mois ? Ou ceux d’autres années ? Ou si on le compare aux morts de la grippe ? Ou si on regarde l’évolution au fil du mois du nombre de morts quotidiens ? Je l’ai souvent dit ici, je le répète : un chiffre ne vaut qu’en le comparant à d’autres données.

Les chiffres normands au 2 avril

Au 2 avril 2020, on totalisait en Normandie 81 morts du Covid-19 à l’hôpital depuis le 1er mars 2020, dont 44 en Seine-Maritime, comme le montre la carte ci-contre.

Santé publique France met à disposition, via son observatoire cartographique GEODES (d’où nous avons tiré la carte ci-dessus) des indicateurs de suivi de l’épidémie de covid-19 par région, département, sexe et classe d’âge. Les données sont actualisées chaque jour et arrêtées à 14h.

L’ARS Normandie fait aussi un point journalier, avec le décompte du nombre d’hospitalisations (630 au 2 avril), de personnes en réanimation (185), de personnes guéries (224), ainsi que le nombre de morts du jour (12) et de décès cumulés depuis le début de l’épidémie (81 au 2/4/2020). Ces données sont évidemment concordantes avec celles de Santé publique France. Notons, comme le précise l’ARS, que les premiers transferts d’Île-de-France sont comptabilisés dans ce total.

Paris-Normandie publie sur son site, sous forme d’infographie, ces données remises à jour quotidiennement. J’ai repris en haut de l’article la courbe de progression du nombre de personnes contaminées en Normandie (1294 personnes le 2 avril), ci-dessous les graphiques du 2 avril, qui mettent en évidence le nombre d’hospitalisations et plus bas la courbe des décès.

L’INSEE diffuse exceptionnellement, pendant la pandémie du covid-19, le nombre de décès par jour et par département. Nous en avons tiré l’infographie de la semaine pour La Lettre EcoNormandie, ci-dessous.

Quelques questions…

62 morts au 31 mars, 81 au 2 avril, est-ce important ?

Les 62 décès dus au covid-19 constatés au 31/3/2020 dans les hôpitaux normands ne représentent que 2% de l’ensemble des décès enregistrés en Normandie durant les mois de mars 2018 ou 2019. On constate d’ailleurs qu’au 16 mars, la Normandie avait enregistré en 2020 moins de décès au total que les deux années précédentes (cf. graphique ci-dessus). On remarque aussi que la variation d’une année sur l’autre peut être importante : 551 décès en plus (+19%) en 2018 vs 2019.

Comment progresse le nombre de décès liés au Coronavirus ?

Cependant, la Normandie a été touchée plus tardivement que les autres régions par la vague épidémique. Peut-être n’en sommes-nous qu’au début ? Il faut donc étudier aussi la progression : le nombre de morts quotidiens augmente-t-il ? Et si oui à quel rythme? Le Monde publie et met à jour quotidiennement les courbes d’évolution du nombre de contaminations et du nombre de décès, dans les 8 principaux foyers mondiaux – dont la France. On peut afficher les données en rythme ou en total, et l’on voit des périodes où l’augmentation atteint + 25% par 24 heures.
En Normandie, selon les données de l’ARS (reprises ci-dessous sous forme d’infographie par Paris-Normandie), depuis le 10e décès (le 23 mars), on constate qu’à cinq reprises le nombre de décès du jour était au moins égal à 25% des décès cumulés de la veille. Cependant, la Normandie semble relativement épargnée, comme le rappelle cet article publié par La Lettre EcoNormandie. Selon toute vraisemblance, le confinement, intervenu alors que la région ne déplorait que quelques cas, a ralenti la dissémination du virus.

Et si on compare à la grippe saisonnière en France ?

Commençons par voir ce qui se passe au niveau national, sur le site de Santé publique France.

On apprend ainsi qu’en 10 à 11 semaines en moyenne, la grippe tue chaque année environ 10000 personnes et en infecte 2 à 6 millions. Pour la saison 2017-2018, le bilan des épidémies hivernales fait même état d’une surmortalité de 17900 décès en 16 semaines, dont 73% peuvent être attribués à la grippe (soit 12400 morts).

Ces données sont à comparer aussi au nombre total de décès. L‘Insee nous apprend qu’au total, au mois de mars 2018, la France a compté 60407 décès, et 53629 en mars 2019.

Et si on compare à la grippe saisonnière en Normandie ?

La grippe en Normandie. La saison hivernale 2017-2018 a été marquée par une épidémie de grippe précoce et longue, de mi-décembre 2017 à mi-mars 2018. La Normandie faisait partie des régions les plus concernées par un excès de mortalité : 1200 décès en Normandie. Si on attribue à la grippe la même part qu’au niveau national (73% des cas de surmortalité, voir ci-dessus), cela fait 870 décès dus à la grippe en 2017-2018. Soit 10 fois plus que le nombre de décès en Normandie dus au covid-19 au 2 avril 2020.
Pour la saison 2018-2019, l’estimation de la surmortalité toutes causes, extrapolée à l’échelle nationale pendant les 9 semaines de l’épidémie était de +11,8 %. La région Normandie (+15,7 %) faisait partie des régions les plus concernées par cet excès de mortalité.

Grippe vs covid-19 : faut-il s’alarmer ?

Plusieurs questions se posent, et notamment : pourquoi les médias et les pouvoirs publics ne communiquent pas plus sur ces chiffres récurrents de la grippe, pour le moment (peut-être provisoirement ?) bien supérieurs à ce qui est attribué en France au Coronavirus (rappel pour la France : environ 60000 cas recensés le 2 avril et 5398 morts) ?
Inversement : pourquoi de telles réactions face au covid-19 ?
Vraisemblablement plusieurs raisons à cela, et notamment le fort taux de contagion, la plus forte létalité et le caractère inconnu de ce nouveau Coronavirus : on sait que la grippe est saisonnière, elle s’arrête au printemps, on ne sait pas ce qu’il en est du covid-19. Et peut-être aussi que nous nous sommes habitués à ces morts saisonniers, se disant que l’on n’y peut pas grand-chose… sinon respecter des gestes d’hygiène et se faire vacciner pour protéger les plus fragiles, ce qui serait déjà beaucoup.

Il ne faut pas perdre de vue non plus que le nombre de décès dus à la pandémie de covid-19 en France est encore incomplet (la vague épidémique n’a pas reflué : 471 nouveaux décès ce 2 avril), et sous-évalué, car nous n’avons pas encore tous les décès survenus à domicile, et que ceux des EHPAD commencent tout juste à arriver. Alors, oui, 5000 décès liés au Coronavirus alors que le pic est sans doute encore à venir, et que le décompte n’est pas fait entièrement, il y a de quoi s’alarmer et réagir.

• Le confinement est-il efficace ?

Je ne vais pas disserter ici sur l’efficacité du confinement, d’autres – médecins, scientifiques, politiques, journalistes – plus légitimes que moi (ou non) le font. Je me contenterai d’une remarque, et d’un renvoi vers une simulation que je trouve très parlante sur le rôle du confinement.

Une remarque : lorsque l’on compare ci-dessus les chiffres des décès liés au covid-19 et ceux liés à la grippe, il faut garder en tête que nous sommes confinés en France – et donc en Normandie – depuis le 17 mars. La question que tout le monde se pose et à laquelle je me garde bien de répondre : qu’auraient donné les courbes sans cela ? Jérôme Salomon, directeur de la Santé, commentant les chiffres de la France le 2 avril, ou Christine Gardel, directrice de l’ARS Normandie, commentant ceux de la région, avancent avec prudence que l’on aurait eu à déplorer plus de morts sans le confinement.

Je vous propose pour finir une simulation astucieuse proposée par le Washington Post et reprise par Courrier international, avec une maladie fictive et des paramètres simplifiés, pour comprendre la propagation de la maladie et l’efficacité du confinement.

Cliquez sur l’image pour afficher la page correspondante, et déroulez bien toute l’animation qui se trouve dans l’encadré pour comparer les différents scénarios, avec ou sans confinement.

Pour aller plus loin

Un document très clair, datant de mars 2020, pour comprendre la manière dont est suivi l’épidémie, découvrir les outils mis en place pour mesurer la propagation et savoir où trouver les données en open data : le livret de suivi d’épidémie mis en ligne par l’Insee, Santé publique France et le ministère des Solidarités et de la Santé .

Enquête sur le moral des journalistes

Infographie parue dans La Lettre EcoNormandie du 20 septembre 2019

Dans un contexte de montée de la défiance vis-à-vis des médias, le Club de la presse et de la communication de Normandie a interrogé les journalistes normands sur les évolutions et les difficultés de leur métier.
L’enquête est parue dans le numéro 2019 de la revue annuelle du club, In/Off (à consulter ici) et ses résultats sont désormais en ligne sur le site du club (à consulter ici). La Lettre EcoNormandie en a tiré son infographie dans son numéro daté du 20 septembre 2019 . Le blog EcoNormandie revient cette semaine sur ces résultats, tout d’abord avec (ci-dessus) le résumé graphique proposé dans La Lettre, grâce à la patte d’Isabelle Loyer, infographiste à Paris Normandie, puis ci-dessous avec les graphiques reprenant l’ensemble des résultats aux questions fermées. Nous vous invitons à consulter aussi (ici) les commentaires, souvent longs et très personnels, reçus en réponse à la question ouverte. Nous savions qu’il y avait un malaise dans la profession, et dans la manière dont les journalistes sont perçus, mais il est intéressant – et même inquiétant – de constater à quel point ce malaise touche d’une manière ou d’une autre les trois-quarts de la profession.

Les résultats de l’enquête

Les répondants : qui sont-ils ?

Note méthodologique

L’enquête « Le moral des journaliste » a été réalisée en ligne, en avril 2019, par Béatrice Picard (SNIC – EcoNormandie) dans le cadre de la rédaction du numéro 2019 de la Revue In/Off réalisée par le Club de la Presse et de la Communication de Normandie (à télécharger ici). Environ 500 journalistes normands ont reçu une invitation à répondre à l’enquête. 127 réponses ont pu être traitées, soit un taux de réponse de 25 %, qui est un premier enseignement : ce sujet les concerne !
Au total, 115 journalistes cartés et 12 journalistes non cartés ont répondu (dont 31 % sont adhérents du Club), à quasi-parité hommes (52 %) — femmes (48 %). Les moins de 30 ans représentent 14 % des répondants et les plus de 50 ans 25 %. L’échantillon n’étant pas un échantillon représentatif, on ne peut pas extrapoler les résultats pour l’ensemble de la population des journalistes normands. Cependant le nombre de réponses est suffisant pour donner une tendance (en 2018, la CCIJP recensait 822 journalistes cartés en Normandie : 1 sur 8 a répondu à l’enquête).

En bonus

Au moment où j’écris cet article, je tombe sur une chronique intitulée “Les médias sont-ils moins libres qu’avant ? dans l’émission de France Culture Les Chemins de la philosophie. A écouter ici.

Arrêt sur statistiques

Vous connaissez mon intérêt pour les chiffres et mon plaisir de le transmettre. Il a été comblé cette semaine [le 25 avril] avec la venue au Club de la presse et de la communication de statisticiens de l’Insee Normandie. Je prends aujourd’hui le prétexte de ce « Campus-sandwich », mais aussi d’autres rencontres organisées par l’Insee Normandie, pour faire un « arrêt sur statistiques », comme on parle « d’arrêt sur image ». Mon propos aujourd’hui n’est pas de m’intéresser aux résultats ni à l’analyse des données, mais de m’arrêter sur quelques commentaires faits par les statisticiens afin de partager mes réflexions sur la méthode statistique.

À l’occasion du « Campus-sandwich » de ce 25 avril, Jean-Louis Reboul, et son équipe avaient 1h30 pour donner quelques pistes afin de mieux se retrouver dans la forêt de données disponibles sur le site insee.fr.

Ils ont souligné que ces données doivent servir à éclairer le débat public et rappeler que « pour faire de la statistique, il faut des conventions, des seuils, et il faut interpréter ». Ce sont ces conventions, ces règles d’interprétation et aussi leurs limites qui m’intéressent aujourd’hui.

C’est en fait lors des derniers « Rendez-vous de l’Insee » consacrés aux “QPV” (quartiers politique de la ville), dont j’ai déjà parlé, que l’idée de cet « arrêt sur statistiques » a germé.

N’étant pas, contrairement aux autres participants, directement concernée par le sujet, j’ai pris de la distance par rapport aux enseignements que l’on pouvait tirer des différents exposés et des échanges qui suivaient, pour en tirer chaque fois une leçon de statistique, et de ce point de vue, j’ai été nourrie, car en trois heures, beaucoup des questions qui se posent lorsqu’on analyse des données ont été abordées. Je reviens ci-dessous sur certaines d’entre elles, et je dois avouer le réel plaisir que je retire des mots et des expressions mêmes que j’ai glanés durant ces rencontres.

Le choix du seuil

Le mode de calcul du seuil de pauvreté (60 % du revenu médian) définit un pauvre en France comme un individu ayant un niveau de vie inférieur à 1026 € (salaire 2016, pour une personne vivant seule ou encore 2150 € pour un couple avec 2 enfants). Avec cette définition, on compte 8,8 millions de pauvres, soit 14 % de pauvres. Avec un seuil à 50 %, on en compterait 5 millions.
Question : comment choisir le seuil le plus pertinent (en gardant en tête que l’objectif est « d’éclairer le débat public »)  ?

Le droit de comparer

Je l’ai souvent répété, un chiffre seul n’apporte pas une information pertinente, c’est la comparaison qui permet d’analyser.
Encore faut-il avoir le droit de comparer deux données entre elles. Il faut pour cela veiller à ce qu’elles aient la même source, et que la population de référence et le périmètre soient définis de manière à ce que l’on puisse comparer.
Pour des comparaisons dans le temps, cela pose la question de la pérennité des zonages et des modes de calcul.

Le décalage de temps

Le temps du recueil des données n’est pas le temps des décisions politiques, ce décalage est apparu clairement lors des échanges des “Rendez-vous de l’Insee”. Pour de nombreuses données collectées sur le thème de la politique de la ville, il faut compter 3 ans pour les remontées de données définitives et comparables, leur analyses par les statisticiens, et la mise à disposition. Mais sur le terrain, la nécessité de faire des bilans à mi-parcours pour les contrats politique de la ville achoppe sur cette question de délais.

La robustesse des données

La robustesse d’une donnée ou d’un indicateur (par opposition à sa fragilité) est ce qui assure sa fiabilité. Par exemple si l’échantillon est trop petit, ou mal construit, les données seront fragiles.

Le secret statistique

L’Insee ne diffuse que des données anonymisées, en veillant à ce qu’aucune information sur un individu de l’échantillon (personne, entreprise, collectivité, etc.) ne puisse être déduite des résultats. Lorsqu’il y a trop peu de monde dans une catégorie, on parle de secret statistique, et l’information n’est pas diffusée à cette maille, on agrège les résultats à une autre catégorie. Cela rend bien sûr indisponibles certaines informations .

Eclairer sans répondre

Le rôle des statisticiens n’est pas de répondre aux questions que se posent élus, journalistes, chercheurs, acteurs du terrains, mais de donner des informations qui leur permettront de répondre.