Nombreux sont ceux qui comme moi se sont réjouit de l'ouverture de la Plateforme française d'ouverture des données publiques ce lundi avec ces 352.000 jeux de données. Sa naissance a même été saluée par data publica qui en a fait un inventaire exhaustif, il reste maintenant à faire une analyse qualitative de ceux-ci.

J'ai pour ma part essayé le jeu de données du registre parcellaire graphique qui recense plus de 6 millions de parcelles déclarées par les exploitants agricoles avec la culture majoritaire de l'année à l'échelle de la France. On trouve sur data.gouv.fr les données pour l'année 2010 au format shapefile directement exploitable par les outils SIG. L'utilisation de ce format est a saluer car il facilite de fait la réutilisation des données et surtout leur visualisation sans pré-traitement.

Jusque là tout va bien, le hic c'est que les shapefiles contiennent des erreurs, chaque parcelle (îlot) est représentée par un polygone regoupés dans des shapefiles par département, mais une fois ces shapefiles intégrés à une base postgis les outils de rendus (geoserver utilisé ici) ne peuvent effectuer leur travail à cause de géométries invalides (Ring Self-intersection, Points of LinearRing do not form a closed linestring, ...), ce qui rend les données un peu moins attractives de prime abord.

Après une analyse détaillées des 92 fichiers représentant les données de l'hexagone on note une moyenne de 0.26% de géométries invalides par fichier avec un maximum de 0.94% sur le département de la Mayenne, pour au total 0.29% d'erreur. Ces chiffres paraissent ridiculement petit mais lors du rendu par tuilage un polygone défectueux en plein milieu rend la tuile vide, à l'échelle de la France on obtient rien sur la carte. Après suppression des erreurs de la base on arrive tout de même à faire un rendu comme celui-ci, sympa toutes ces couleurs ;-) Maintenant vous savez ce qu'il y a eu dans le champs à coté de chez vous si vous avez la chance d'habiter à la campagne.

Le fichier de statistiques complet est attaché au billet

NB : le RPG est disponible sur le geoportail pour les années 2007 à 2009, pour pas aussi sur data.gouv.fr, on pourrait mesurer ainsi la perte de surface agricole année par année.