Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Commentaires et questions non techniques.Commentaires et questions techniques.

 
Cliquez ici.

xml tech : Technologies XML

[xml-tech] Re: Validation RelaxNG: problème avec le pattern text

[xml-tech] Re: Validation RelaxNG: problème avec le pattern text

Auteur: Eric van der Vlist <vdv@dyomedea.com>
Date: 07/03/2005 - 14:59
X-Mailer: Evolution 2.0.2

Bonjour,

Le lundi 28 février 2005 à 14:07 +0100, Laurent Jouanneau a écrit :
> Bonjour,
>
> Ça fait un petit moment que je suis abonné à la liste, mais ceci est mon
> premier message. Petite présentation donc : je suis développeur d'appli
> basée sur le framework de Mozilla (C++/XPCOM/XUL etc..), fondateur du
> site http://xulfr.org, co-fondateur du site http://openweb.eu.org.

Bien!

> Je réalise actuellement un validateur RelaxNG, et j'ai un petit souci
> avec le pattern <text />.
>
> Si j'ai bien compris les specs (et le livre d'Eric sur RelaxNG ;-), le
> pattern <text /> est "positif" quand :
> - il y a un noeud texte (ou cdata) avec du texte
> - il y a un noeud texte (ou cdata) avec seulement des caractères "blancs"
> - quand il n'y a pas de noeud texte.
>
> (cf :
> * http://books.xmlschemata.org/relaxng/ch05s02.html#id2821949 "More
> precisely, it matches zero or more text nodes"
> * http://www.relaxng.org/spec-20011203.html#text-pattern "a text element
> matches zero or more strings" )
>
>
> Imaginons ce bout de schema RelaxNG (que l'on retrouve dans le schema
> RelaxNG de RelaxNG : http://www.relaxng.org/spec-20011203.html#IDA5MCS
> au niveau du <define name="other"/>)
>
> <element>
> ....
> <zeroOrMore>
> <choice>
> <attribute>
> <anyName/>
> </attribute>
> <text/>
> </choice>
> </zeroOrMore>
> </element>
>
> Ce schema indique que l'élément peut contenir n'importe quel attribut OU
> un noeud text, et ce en un nombre indéterminé. D'une manière générale,
> le problème existe avec ce schema :
>
> <element>
> ....
> <zeroOrMore>
> <choice>
> <pattern_quelconque />
> <text/>
> </choice>
> </zeroOrMore>
> </element>
>
> ou même
>
> <element>
> <zeroOrMore>
> <text/>
> </zeroOrMore>
> </element>
>
> imaginons alors par exemple cette balise :
> <foo />
>
> comme il n'y a pas d'attribut le pattern <text /> s'applique, et est
> finalement positif (puisque valide l'absence de noeud text).
> Du coup <zeroOrMore> est valide.
> Bien sûr, puisque "zero ou plus", il faut vérifier une nouvelle fois
> que les sous-patterns de zeroOrMore ne valident pas encore une fois.
> D'où, une boucle dans mon implementation.
>
> Mais voilà, dans ce cas précis : ça tourne en boucle indéfiniement
> puisque le pattern <text /> valide toujours.
>
> Donc je m'interroge :
> - un "bug" dans les specs de RelaxNG ?
> - une mauvaise interpretation de ma part au sujet de <text/> ou de
> <zeroOrMore /> ? (ou même <oneOrMore> puisque le problème existe aussi
> avec lui)
> - mon implémentation est-elle incorrecte ? Mais alors, quand arreter
> cette boucle ? Quand est ce que le pattern <zeroOrMore> ne devrait-il
> plus "matcher" dans ce cas ?
>
>
> Merci d'avance pour vos idées..

Je pense qu'il faut distinguer deux types de documentations... La
description que l'on donne d'un langage dans un livre (qui cherche à
être didactique) et la formalisation d'un langage qui est faite dans sa
spécification ont des buts très différents et ne sont pas
interchangeables :-) ...

Dans le cas de RELAX NG, la référence est la norme ISO
(http://dsdl.org/relaxng-is.pdf) et mon livre doit être vu comme une
vulgarisation pour les auteurs de schémas RNG qui ne veulent pas rentrer
dans la description mathématique du langage plus que comme une référence
pour les implémenteurs.

Pour ceux-ci; James Clark a publié des notes d'implémentation assez
détaillées (http://www.thaiopensource.com/relaxng/implement.html) qu'ils
peuvent suivre s'ils le souhaitent ainsi qu'une suite de tests
(http://thaiopensource.com/relaxng/testSuite.zip) permettant de vérifier
la conformité de leurs implémentations.

Vous pouvez également vous inspirer de l'implémentation (partielle) que
j'ai écrit en Python et qui s'inspire très fortement des notes de James
Clark : http://downloads.xmlschemata.org/python/xvif/

Il n'est pas évident de comparer l'algorithme que vous décrivez
brièvement et celui de James Clark puisqu'ils semblent prendre le
problème de la validation de manière diamétralement opposée.

James Clark décrit une méthode dite "par dérivation" adaptée de celles
qui permettent d'écrire des processeurs d'expressions régulières : en
gros, on calcul la "dérivée" du schéma par le document en enlevant du
schéma ce que l'on trouve dans le document et le document est valide si
l'on n'a détecté aucune erreur pendant la validation et si tout ce qui
reste dans le schéma à la fin de la validation est optionnel.

En suivant ce principe, mon écriture de la dérivation d'un pattern
"oneOrMore" par un noeud est :

        def deriv(self, node):
                pderiv = self.p.deriv(node)
                if pderiv == notAllowed:
                        if self.p.nullable():
                                pderiv = self.savp.deriv(node)
                                if pderiv == notAllowed:
                                        return pderiv
                                else:
                                        self.p = pderiv
                                        return self
                        else:
                                return pderiv
                else:
                        self.p = pderiv
                        return self

C'est à dire que je calcul la dérivée de la valeur actuelle du pattern
inclus dans le pattern "oneOrMore" par le noeud (pderiv =
self.p.deriv(node)).

S'il n'y a pas d'erreur, je conserve cette valeur (c'est que l'on est
toujours dans la même "boucle" pour reprendre votre terminologie).
Sinon, je regarde s'il n'y avait que des patterns optionnels dans "la
boucle courante" (self.p.nullable()).

Si ce n'est pas le cas il y a erreur, sinon je pars dans une nouvelle
boucle en dérivant la valeur initiale du pattern inclus dans le pattern
oneOrMore (pderiv = self.savp.deriv(node)).

J'espère que vous pourrez adapter tout cela à votre propre
implémentation!

Cordialement,

Eric van der Vlist

-- 
If you have a XML document, you have its schema.
                                                  http://examplotron.org
------------------------------------------------------------------------
Eric van der Vlist       http://xmlfr.org            http://dyomedea.com
(ISO) RELAX NG   ISBN:0-596-00421-4 http://oreilly.com/catalog/relax
(W3C) XML Schema ISBN:0-596-00252-1 http://oreilly.com/catalog/xmlschema
------------------------------------------------------------------------
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de 
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant 
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Mon Mar 7 15:59:30 2005

Archive générée par hypermail 2.1.8 le 31/03/2005 - 17:52 UTC

webmaster@xmlfr.org

 

xml tech

Discussions techniques au sujet de XML.

Cette liste est à votre disposition pour discuter en français de tout sujet technique lié à XML.



Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot@online.fr  

Conception, réalisation et hébergement