L' INSEE publie une version XML / RDF / OWL du Code Officiel
Geographique
L' INSEE , Mondeca et Dyomedea annoncent [1] la publication du Code
Officiel Geographique ( COG ) sous une forme [2] utilisant les
technologies XML , RDF et OWL .
Eric van der Vlist , Dyomedea ( vdv@dyomedea.com ).
---------------
Retrouvez cet article en ligne
(http://xmlfr.org/actualites/tech/060804-0001).
Donnez votre avis !
mailto:xml-tech@xmlfr.org?subject=Re:%20INFO%20:%20Version%20XML/RDF/OWL%20du%20COG
---------------
Le Code Officiel Geographique [3] est une des nomenclatures gerees par
l' INSEE . Il rassemble les codes et libelles des communes, des
cantons, des arrondissements, des departements, des regions, des pays
et territoires etrangers.
Il est disponible sous forme papier et electronique telechargeable [4]
sur le site de l' INSEE . Les codes utilises par le COG avaient deja
donne lieu a la publication de deux schemas W3C XML Schema publie sous
forme d'une documentation RDDL :
- Le module COG [5] decrit les codes du Code Officiel Geographique (
COG ) sans en donner la liste.
- Le module Code Officiel Geographique - enumerations [6] complete la
definition du module COG en definissant les listes des valeurs
acceptables. En raison de la volumetrie du COG qui comprend 36 685
communes au 1er janvier 2006, seuls les regions et departements ont
ete codes sous forme d'enumerations W3C XML Schema .
Realisee sous la supervision de Franck Cotton de l' INSEE , la
publication du COG sous forme d'une ontologie RDF/OWL [7] vient donc
completer ce dispositif en fournissant la liste exhaustive des entites
gerees par le COG et en en fournissant un modele abstrait sous forme
RDF Schema et OWL .
Si la liste des entites du COG peut etre vue comme une alternative XML
et RDF aux fichiers a telecharger aux formats dbf et texte deja publies
sur le site de l' INSEE , la modelisation RDF Schema / OWL de ces
donnees est par contre une nouveaute.
Elle a ete realise par Bernard Vatant de Mondeca avec l'aide des
experts metier des l' INSEE . Elle tient compte de toutes les
caracteristiques du COG qui cache parfois des surprises (une commune
qui est la plus petite subdivision administrative francaise peut par
exemple etre situee a cheval sur plusieurs cantons bien que le canton
soit une subdivision de rang superieur).
Cette modelisation est disponible sous forme d'une ontologie RDF , RDF
Schema et OWL dont elle utilise le profil « OWL-Lite ». Cette ontologie
est un document XML / RDF pouvant etre visualise avec un editeur
graphique tel que l'editeur Open Source SWOOP [8] .
Les donnees publiees sont conformes a cette ontologie et sont
regroupees par departements et niveaux administratifs : pour chaque
departement, un premier fichier donne la liste des arrondissements et
des cantons et un deuxieme fichier donne la liste des cantons et des
communes.
La coherence avec les schemas XML deja publies par l' INSEE a ete
validee par Eric van der Vlist qui a souhaite que les documents XML
soient utilisables a deux niveaux :
- Les applications RDF peuvent les utiliser comme des documents XML /
RDF sans se soucier du detail de leur serialisation XML .
- Les applications XML peuvent les utiliser d'autant plus simplement
que la serialisation XML retenue a ete choisie pour sa simplicite.
Le vocabulaire retenu utilise plusieurs fonctionnalites de la version
la plus recente de RDF qui permettent de reduire au strict minimum la
complexite additionnelle de RDF par rapport a un vocabulaire XML non
RDF . A titre d'exemple, la definition du canton d'Anet dans le
document http://rdf.insee.fr/geo/cantons-28-2003.rdf [9] est la
suivante :
<rdf:RDF xml:base="http://rdf.insee.fr/geo/"
xmlns:geo="http://rdf.insee.fr/geo/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#">
<geo:Canton rdf:about="CAN_2801">
<geo:code_canton>2801</geo:code_canton>
<geo:nom xml:lang="fr">Anet</geo:nom>
<geo:chef-lieu rdf:resource="COM_28007"/>
<geo:subdivision>
<geo:Commune rdf:about="COM_28001">
<geo:code_commune>28001</geo:code_commune>
<geo:nom xml:lang="fr">Abondant</geo:nom>
<geo:voisin rdf:resource="COM_28064"/>
<geo:voisin rdf:resource="COM_28098"/>
<geo:voisin rdf:resource="COM_28267"/>
<geo:voisin rdf:resource="COM_28321"/>
<geo:voisin rdf:resource="COM_28375"/>
<geo:voisin rdf:resource="COM_28377"/>
<geo:voisin>
<geo:Commune rdf:about="COM_27391">
<geo:code_commune>27391</geo:code_commune>
<geo:nom xml:lang="fr">Marcilly-sur-Eure</geo:nom>
</geo:Commune>
</geo:voisin>
<geo:voisin>
<geo:Commune rdf:about="COM_27543">
<geo:code_commune>27543</geo:code_commune>
<geo:nom xml:lang="fr">Saint-Georges-Motel</geo:nom>
</geo:Commune>
</geo:voisin>
</geo:Commune>
</geo:subdivision>
<geo:subdivision>
<geo:Commune rdf:about="COM_28007">
<geo:code_commune>28007</geo:code_commune>
<geo:nom xml:lang="fr">Anet</geo:nom>
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Fri Aug 4 17:32:40 2006