S'abonner au Flux RSS

Mot-clé - opendata

Fil des billets - Fil des commentaires

vendredi, juin 22 2012

L'OpenData toulousain

La communauté urbaine de Toulouse à récemment lancé son portail des données libres, le site accessible sur http://data.grandtoulouse.fr/ dispose à la date de publication de ce billet de 48 jeux de données couvrant des domaines comme l'éducation, les résultats électoraux ou encore la topographie avec l'altimétrie des voies. Je ne suis pas toulousain mais je me suis tout de même penché sur les données publiées avec un regard de bon père de famille, j'ai pour cela regardé de près les données liées aux écoles et aux équipements sportifs.

Pour les tout petits on trouve les coordonnées des crèches sur la commune de Balma, de même que pour les équipement sportifs seules cette ville a mis ses données à disposition semble-t'il. Pour les écoles on dispose déjà de beaucoup plus d'informations 90 écoles élémentaires publiques et 105 maternelles, cela donne déjà plus de données à analyser, au passage je ne note aucune donnée sur Blagnac dans ces fichiers. Je n'ai pas trouvé de données pour l'enseignement supérieur, ni collèges ni lycées, le portail étant jeune gageons qu'il gagnera en exhaustivité avec le temps.

Sur les formats de données c'est un peu disparate il ne faut pas hésiter à retraiter, les données géographiques sont parfois en 2 dimensions, parfois en 3. Les fichiers kmz ne sont pas directement exploitables pour les conversions, certains champs de données contenant directement du code HTML par exemple. Les fichiers CSV contiennent parfois une colonne avec les coordonnées géographiques parfois non. Le bilan global reste tout de même positif, même si il a fallu parfois utiliser les fichier MapInfo, parfois les kml, parfois les CSV pour obtenir un résultat homogène, mais sur l'ensemble j'ai réussit à récupérer les données que je cherchais dans ce qui était publié.

L'ensemble de ces données a été mise en oeuvre sur une carte en ligne.

Dernier point les données ont été publiées sous licence Open Data Commons Open Database License.

Merci à la CU de Toulouse et vivement la suite des données ....

PS : je cherche toujours le lien direct pour télécharger les fichiers sans passer par l'interface web

vendredi, décembre 9 2011

Registre parcellaire graphique en OpenData et BadData

Nombreux sont ceux qui comme moi se sont réjouit de l'ouverture de la Plateforme française d'ouverture des données publiques ce lundi avec ces 352.000 jeux de données. Sa naissance a même été saluée par data publica qui en a fait un inventaire exhaustif, il reste maintenant à faire une analyse qualitative de ceux-ci.

J'ai pour ma part essayé le jeu de données du registre parcellaire graphique qui recense plus de 6 millions de parcelles déclarées par les exploitants agricoles avec la culture majoritaire de l'année à l'échelle de la France. On trouve sur data.gouv.fr les données pour l'année 2010 au format shapefile directement exploitable par les outils SIG. L'utilisation de ce format est a saluer car il facilite de fait la réutilisation des données et surtout leur visualisation sans pré-traitement.

Jusque là tout va bien, le hic c'est que les shapefiles contiennent des erreurs, chaque parcelle (îlot) est représentée par un polygone regoupés dans des shapefiles par département, mais une fois ces shapefiles intégrés à une base postgis les outils de rendus (geoserver utilisé ici) ne peuvent effectuer leur travail à cause de géométries invalides (Ring Self-intersection, Points of LinearRing do not form a closed linestring, ...), ce qui rend les données un peu moins attractives de prime abord.

Après une analyse détaillées des 92 fichiers représentant les données de l'hexagone on note une moyenne de 0.26% de géométries invalides par fichier avec un maximum de 0.94% sur le département de la Mayenne, pour au total 0.29% d'erreur. Ces chiffres paraissent ridiculement petit mais lors du rendu par tuilage un polygone défectueux en plein milieu rend la tuile vide, à l'échelle de la France on obtient rien sur la carte. Après suppression des erreurs de la base on arrive tout de même à faire un rendu comme celui-ci, sympa toutes ces couleurs ;-) Maintenant vous savez ce qu'il y a eu dans le champs à coté de chez vous si vous avez la chance d'habiter à la campagne.

Le fichier de statistiques complet est attaché au billet

NB : le RPG est disponible sur le geoportail pour les années 2007 à 2009, pour pas aussi sur data.gouv.fr, on pourrait mesurer ainsi la perte de surface agricole année par année.