En route vers l’innovation

J’ai déjà évoqué dans l’article “Un coup de pouce pour EcoNormandie” les développements prévus pour booster le fonctionnement de notre base de données en ligne EcoNormandie – et les financements du “DNI fund” de Google – qui vont avec.
Après un temps de réflexion et de préparation, nous lançons aujourd’hui la consultation auprès des développeurs qui souhaiteraient nous accompagner dans cette aventure.
Avis aux amateurs !!

Cherche développeur innovant

EcoNormandie, je suppose que vous connaissez, j’en parle pratiquement toutes les semaines : c’est une base de données, en ligne (et bien sûr également hors ligne pour toutes les fonctionnalités qui vont de la mise à jour à la réalisation du Guide EcoNormandie ou du Palmarès) des acteurs économiques, politiques et sociaux de Normandie.
EcoNormandie est développée par le quotidien régional Paris-Normandie.

EcoNormandie ++

Demain, grâce aux développements en projet (nom de code : EcoSystem), EcoNormandie apportera plus de services aux internautes, plus de facilité aux journalistes et gestionnaires de la base de données, plus de liens entre le journal en ligne et la base de données.

L’idée est d’utiliser l’intelligence artificielle pour proposer un contenu plus riche, plus pertinent, plus engageant, en créant des outils qui permettent de :

  • simplifier l’intégration de multiples sources “open data
  • identifier automatiquement des données pertinentes qui apporteront un complément d’informations
  • intégrer des données vérifiées dans des formats augmentés

Les outils à créer

Open data

▪ EcoSystem combine la base existante d’EcoNormandie et plusieurs sources de données ouvertes locales et nationales toutes vérifiées.

▪ Cela permet aux journalistes de travailler avec des informations constamment mises à jour qui reflètent réellement les réalités locales, et aux internautes d’avoir accès à plus d’informations sur un sujet.

Text mining (analyse de texte)

▪ EcoSystem analyse le contenu de l’article en cours d’écriture

▪ Cela permet de suggérer des informations complémentaires sur ce sujet en proposant des liens vers les pages EcoNormandie.

Automated text generation (génération automatique de texte)

▪ EcoSystem génère automatiquement du texte à l’aide d’informations de la base de données.

▪ Cela permet au journaliste d’insérer un paragraphe pré-écrit, contenant des informations à jour, en appui ou en encadré de son article.

Pour aller plus loin

EcoNormandie cherche un ou des développeurs pour l’accompagner dans cette nouvelle aventure.

Vous pouvez :

En route pour de nouvelles aventures !

Cela ne transparaît peut-être pas ci-dessus, mais je trouve que j’ai de la chance de m’embarquer dans cette aventure, avec des financements à la clé. Nous venons de lancer la consultation, et déjà des marques d’intérêt nous parviennent, d’entreprises ou même de chercheurs… 😉

A suivre…

69 intercos et 2 652 communes

J’ai déjà parlé des communes et des intercommunalités normandes la semaine dernière (voir l’article Prêt pour les municipales ?), mais j’y reviens cette semaine pour présenter une source précieuse et remarquablement à jour, et souligner les changements qui cette année encore, ont fait évoluer les découpages du paysage normand.

Une commune de plus en 2020

Pour la première fois depuis cinq ans, il n’y a pas eu de fusion de communes au 1er janvier 2020. La dernière remonte au 1er janvier 2019, où 81 communes normandes s’étaient recomposées en 23 communes nouvelles. En revanche l’éphémère commune nouvelle de Saline, créée le 31 janvier 2017 par fusion des communes de Troarn et Sannerville, n’est plus. L’arrêté préfectoral portant création de la commune nouvelle, ayant été annulé, les deux communes de Caen-la-Mer vivent à nouveau séparément, ce qui porte à 2652 le nombre de communes normandes. Rappelons qu’on en comptait 3232 il y a cinq ans.

Chaises musicales dans l’Eure

Après l’intégration des communes de la comcom Eure Madrie Seine à l’Agglo Seine-Eure au 1er septembre 2019, ce département a connu d’autres changements dans le découpage intercommunal au 1er janvier 2020, concernant 8 EPCI et 20 communes. Les comcom de Roumois Seine, Pays de Honfleur – Beuzeville, Intercom Bernay Terre de Normandie, ainsi que Seine-Normandie Agglomération perdent des communes au profit des comcom du Pays du Neubourg, Pont-Audemer-Val-de-Risle, Lieuvin Pays d’Auge et de l’Agglo Seine-Eure.

Au 1er janvier 2020, la Normandie compte 69 EPCI (1 métropole, 3 communautés urbaines, 11 communautés d’agglomération et 54 communautés de communes). Il faut y ajouter deux EPCI hors de Normandie auxquels sont rattachées, une dizaine de communes normandes (ce qui explique sur la carte ci-dessus le résultat “71”).

À télécharger : le fichier des EPCI et des communes rattachées.
Le portail des collectivités
– site du gouvernement – vient de mettre en ligne un fichier Excel de 34964 lignes – correspondant aux nombre de communes françaises au 1/1/2020. Un fichier entièrement à jour des derniers découpages et des derniers chiffres de population, moins de 3 semaines après leur officialisation. Cette source est d’autant plus précieuse que ces changements – certes moins importants que les années précédentes – n’ont pas fait l’objet de communication appuyée.
Je dois même avouer qu’ils m’avaient échappé, et c’est en contrôlant la concordance entre ce fichier et ma base EcoNormandie que j’ai découvert quelques mises à jour à faire.

Conclusion : le doute est une vertu !

Comme je le répète souvent, le doute est une vertu lorsqu’il s’agit de tenir à jour des données, et le contrôle et la concordance avec des sources fiables est un des moyens les plus efficaces, le difficile étant d’avoir une source fiable.

Données ouvertes sur les comptes des entreprises

Les données en ligne sur les comptes des entreprises (chiffres d’affaires, résultats…) ne manquent pas. L’accès et la recherche se font librement ou sur abonnement selon les fournisseurs, qui sont nombreux et proposent différents services, gratuits ou payants (citons par exemple Ellisphère, Corporama, Société.com, etc.).
Aujourd’hui, à l’occasion de l’ouverture du portail data de l’INPI, je m’intéresserai à deux sites proposant les données financières des entreprises en Open Data : l’INPI (Institut national de la propriété intellectuelle) et Infogreffe (services de greffes des tribunaux de commerce).

Consultation des données en ligne avec l’INPI

L’INPI proposait déjà des licences pour accéder, sous conditions, aux données en masse de l’INPI avec téléchargement au format xml. En complément, un nouveau service permet désormais d’accéder directement à ces données, au cas par cas ou selon des critères de sélection, par un portail grand public :  data.inpi.fr.

Ce portail donne accès aux données d’identité légale des sociétés en provenance de tous les greffes des tribunaux à compétence commerciale, et centralisées par l’INPI dans le registre national du commerce et des sociétés (RNCS) dans le cadre de sa mission de conservation et de diffusion.

Ces informations sur les entreprises comprennent notamment la date de création, d’immatriculation, la forme juridique, le capital social, la dénomination sociale, le nom commercial, le sigle, l’activité principale, les représentants et l’adresse des établissements. Ces données permettent également de suivre la vie des entreprises immatriculées au RNCS : modifications et radiations. Les mises à jour sont quotidiennes.

Chacun peut faire des recherches simples, fluides et rapides, en saisissant la dénomination d’une entreprise, le nom des dirigeants ou le numéro Siren.

Puis grâce à des filtres, les résultats sont affinés afin de cibler au mieux les requêtes parmi 5,9 millions d’entreprises. Ces données sont téléchargeables, imprimables ou susceptibles d’être partagées.

Exemple : recherche de Ferrero sur le site INPI

Sur la page d’accueil du site INPI, on tape directement sa recherche (préciser la dénomination, le nom du dirigeant ou le numéro SIREN)

Astuce : Si l'on ne connaît pas le numéro Siren, on peut taper Ferrero dans la rubrique recherche (531 résultats) puis on affine en cochant "Seine-Maritime" dans le filtre département (9 résultats, dont 3 pour lesquels Ferrero correspond à la raison sociale). 
On peut alors afficher la fiche (voir ci-contre), et même la télécharger au format pdf. On y trouve notamment les noms de trois représentants : deux administrateurs et le président du CA, Eric Houdet.
L'onglet "documents associés" permet en outre, si on est connecté (gratuitement), de consulter les 3 derniers bilans. Pour Ferrero, le dernier bilan disponible le jour de la consultation (19/12/2019) est celui déposé au greffe en octobre 2017.

Téléchargement des données en ligne avec Infogreffe

Le site Infogreffe permet d’accéder aux données ouvertes des greffes des tribunaux de commerce et propose des données ouvertes sur les entreprises françaises, mais cette fois-ci sous forme de téléchargement.

Exemple : recherche de Ferrero dans le fichier des données

La page d'accueil du site nous invite à explorer les jeux de données. Nous choisissons les "chiffres clés 2018", où nous pouvons trouver les chiffres d'affaires et les résultats.On peut affiner en précisant la région. Le téléchargement est proposé en format csv, JSON ou Excel
Astuce : une fois téléchargé, il est parfois plus aisé, comme je l'ai remarqué d'ouvrir le fichier csv que le fichier Excel.
On peut bien sûr chercher Ferrero dans le fichier (qui contient plus d'un  million d'enregistrements). Personnellement, je convertis les données en FileMaker Pro pour pouvoir le lier (via le numéro SIRET) aux entreprises de la base de données, afin de faire des concordances et des mises à jour.
On voit ci-dessous les fiches des deux sociétés normandes du groupe Ferrero, avec leurs CA et leurs résultats 2018 et 2017. Le nom des dirigeants n'est pas compris dans ce jeu de données

Fiche Ferrero sur EcoNormandie*

La base de données EcoNormandie permet – sur abonnement* – de consulter la fiche de Ferrero, avec des données provenant de nos propres base de données (la fiche de Ferrero* a été mise à jour en octobre 2019 directement par les services de Ferrero), avec notamment plusieurs dirigeants et responsables de la société, l’activité, les réseaux sociaux, les coordonnées. Ces données sont complétées par des informations sur l’actualité (articles de presse) et des données financières issues de la base infogreffe.

*Si vous souhaitez accéder au portail EcoNormandie

L’accès à la base de données en ligne EcoNormandie est réservée aux abonnés. Si vous souhaitez vous connecter pour l’essayer, voici un code provisoire :

Et si vous souhaitez essayer les services d’EcoNormandie gratuitement pendant un mois, il suffit de le demander ici