Rien que pour vos yeux…

30 avril 2015
OpenData - Traitements et qualité des données

Jeu de données attendu depuis longtemps par tous les aficionados de la cartographie statistique, les Contours… IRIS® de l’IGN sont désormais disponibles en licence ouverte. Oui, c’est ouvert mais c’est une marque déposée de l’INSEE comme l’indique la base de données de l’INPI. D’où le ®. Ce qui est rigolo, c’est que les trois points de suspension après Contours font partie intégrante de la marque. On peut le voir comme pour souligner le côté flou ou flottant de ces contours, dont on aurait du mal à cerner les limites. Et c’est vrai que quand on creuse un peu le sujet, on se pose vite des questions.

Pour ceux qui n’auraient jamais été dessillés sur le sujet, reprenons un peu la généalogie de ce jeu de données (oui, je parle comme j’INSPIRE maintenant). Les IRIS sont des subdivisions communales construites par agrégations d’îlots (voir la documentation officielle) à vocation de représentation statistique plus fine que la commune. Ils ont été définis par l’INSEE pour le recensement de 1999, et ont porté alors à l’occasion le joli nom d’IRIS2000 (c’était l’époque où on regardait encore K2000 à la TV, et le directeur de la statistique de l’époque était fan de David Hasselhoff, qui fait d’ailleurs son grand retour actuellement avec son clip True Survivor que je conseille à tous, même s’il faut se fader 30 secondes de pub avant d’en profiter). Bref, pour les communes de plus de 10000 habitants et certaines de plus de 5000, l’INSEE établit donc des subdivisions, calées sur la voirie avec donc des délimitations genre « de la droite de la Rue du Marteau entre les n° 12 et 146 à la gauche de la Rue du Sabot, ce qui rend franchement agréable le travail de numérisation. C’est pour cela que ce jeu de données était revendu par quelques officines seulement qui, partant du fait que le boulot était éminemment pénible et qu’il s’adressait essentiellement à des activités de géomarketing où on se fait de la thune, le faisaient payer plus cher que l’ArcMap (pas de ® ici, vous pouvez aller déposer la marque) qui servait à les visualiser.

Comme à chaque fois qu’un jeu de données dépend d’un autre (ici la voirie), son cycle de vie devient un peu compliqué. Car si la description des IRIS donnée par l’INSEE ne change pas, leur représentation graphique dépend de la base de données voirie utilisée. Certes ce sont principalement des axes importants qui servent de limites, mais des différences subtiles peuvent exister entre bases voirie, et perturber le bon déroulement d’un géocodage à l’IRIS par exemple si on n’utilise pas la même base voirie pour travailler. Et comme évidemment les IRIS ont été régulièrement révisés pour s’adapter aux évolutions démographiques, il faut co-utiliser les bonnes versions chaque.

On ne peut donc que se réjouir de l’ouverture de cette donnée, et sachant ce que nous savons, nous intéresser à sa généalogie dans la documentation fournie. On y apprend (paragraphe 1.3.1) que la géométrie provient d’un GEOROUTE®, recalé sur un référentiel proche du RGE® IGN (mais pas tout à fait le RGE donc) et enfin généralisé. Les Exemplecommunes non subdivisées sont issues du GEOFLA® comme les limites des communes subdivisées pour garantir la cohérence du tout. Il est donc par ailleurs précisé que « La géométrie des contours d’Iris étant issue d’une généralisation des limites fournies par l’INSEE, les requêtes spatiales fines à l’adresse ou au bâtiment doivent être effectuées avec Iris… GE (Grande Échelle), produit IGN compatible géographiquement avec la précision de ces données. » On vous explique donc que pour du travail de précision il faudra plutôt utiliser un autre produit, ce qui peut sembler de bonne guerre puisque c’est la précision qui fait la valeur. La documentation IGN est d’ailleurs fort bien fait puisqu’elle illustre l’étape de généralisation par cette image :

 

Iris... ContoursOn y comprend que la source IRIS… GE proposée en bleu est transformée en Contours… IRIS® montrée en rouge après un bon exercice de généralisation. Tout est donc clair.

Sauf que… Quand on récupère le jeu de données (qui est en fait une collection composée de jeux départementaux préalablement regroupés par régions désignées par leur code. Il va falloir réviser la nomenclature) et qu’on l’examine, on y trouve des géométries plutôt similaires à IRIS… GE et donc non généralisées :

 

On est donc tenté de superposer tout ça avec les limites de communes issues du GEOFLA®, pour voir… que rien ne colle…

GEOFLA

Alors on inspire un grand coup, et on va voir un vieil épisode de K2000 parce que tout ça est finalement bien trop compliqué pour nous. Mais on a hâte que grâce à l’OpenData le citoyen lambda prenne son destin en main et utilise toutes ces données à bon escient…

 

MISE A JOUR DU 7 MAI 2015

L’IGN vient de mettre en ligne une version 2.0 des Contours… IRIS® 2014 avec des géométries parfaitement alignées sur celles du GEOFLA Communal. On peut donc féliciter l’IGN pour sa réactivité et se précipiter sur le nouveau jeu de données ! Autre amélioration, plus pratique : les différents shapefiles départementaux sont désormais tous dans le même répertoire et non plus classés par code région, ce qui rend beaucoup plus facile leur manipulation.

iris