Bonjour,
Le lundi 28 février 2005 à 14:07 +0100, Laurent Jouanneau a écrit :
> Bonjour,
>
> Ça fait un petit moment que je suis abonné à la liste, mais ceci est mon
> premier message. Petite présentation donc : je suis développeur d'appli
> basée sur le framework de Mozilla (C++/XPCOM/XUL etc..), fondateur du
> site http://xulfr.org, co-fondateur du site http://openweb.eu.org.
Bien!
> Je réalise actuellement un validateur RelaxNG, et j'ai un petit souci
> avec le pattern <text />.
>
> Si j'ai bien compris les specs (et le livre d'Eric sur RelaxNG ;-), le
> pattern <text /> est "positif" quand :
> - il y a un noeud texte (ou cdata) avec du texte
> - il y a un noeud texte (ou cdata) avec seulement des caractères "blancs"
> - quand il n'y a pas de noeud texte.
>
> (cf :
> * http://books.xmlschemata.org/relaxng/ch05s02.html#id2821949 "More
> precisely, it matches zero or more text nodes"
> * http://www.relaxng.org/spec-20011203.html#text-pattern "a text element
> matches zero or more strings" )
>
>
> Imaginons ce bout de schema RelaxNG (que l'on retrouve dans le schema
> RelaxNG de RelaxNG : http://www.relaxng.org/spec-20011203.html#IDA5MCS
> au niveau du <define name="other"/>)
>
> <element>
> ....
> <zeroOrMore>
> <choice>
> <attribute>
> <anyName/>
> </attribute>
> <text/>
> </choice>
> </zeroOrMore>
> </element>
>
> Ce schema indique que l'élément peut contenir n'importe quel attribut OU
> un noeud text, et ce en un nombre indéterminé. D'une manière générale,
> le problème existe avec ce schema :
>
> <element>
> ....
> <zeroOrMore>
> <choice>
> <pattern_quelconque />
> <text/>
> </choice>
> </zeroOrMore>
> </element>
>
> ou même
>
> <element>
> <zeroOrMore>
> <text/>
> </zeroOrMore>
> </element>
>
> imaginons alors par exemple cette balise :
> <foo />
>
> comme il n'y a pas d'attribut le pattern <text /> s'applique, et est
> finalement positif (puisque valide l'absence de noeud text).
> Du coup <zeroOrMore> est valide.
> Bien sûr, puisque "zero ou plus", il faut vérifier une nouvelle fois
> que les sous-patterns de zeroOrMore ne valident pas encore une fois.
> D'où, une boucle dans mon implementation.
>
> Mais voilà, dans ce cas précis : ça tourne en boucle indéfiniement
> puisque le pattern <text /> valide toujours.
>
> Donc je m'interroge :
> - un "bug" dans les specs de RelaxNG ?
> - une mauvaise interpretation de ma part au sujet de <text/> ou de
> <zeroOrMore /> ? (ou même <oneOrMore> puisque le problème existe aussi
> avec lui)
> - mon implémentation est-elle incorrecte ? Mais alors, quand arreter
> cette boucle ? Quand est ce que le pattern <zeroOrMore> ne devrait-il
> plus "matcher" dans ce cas ?
>
>
> Merci d'avance pour vos idées..
Je pense qu'il faut distinguer deux types de documentations... La
description que l'on donne d'un langage dans un livre (qui cherche à
être didactique) et la formalisation d'un langage qui est faite dans sa
spécification ont des buts très différents et ne sont pas
interchangeables :-) ...
Dans le cas de RELAX NG, la référence est la norme ISO
(http://dsdl.org/relaxng-is.pdf) et mon livre doit être vu comme une
vulgarisation pour les auteurs de schémas RNG qui ne veulent pas rentrer
dans la description mathématique du langage plus que comme une référence
pour les implémenteurs.
Pour ceux-ci; James Clark a publié des notes d'implémentation assez
détaillées (http://www.thaiopensource.com/relaxng/implement.html) qu'ils
peuvent suivre s'ils le souhaitent ainsi qu'une suite de tests
(http://thaiopensource.com/relaxng/testSuite.zip) permettant de vérifier
la conformité de leurs implémentations.
Vous pouvez également vous inspirer de l'implémentation (partielle) que
j'ai écrit en Python et qui s'inspire très fortement des notes de James
Clark : http://downloads.xmlschemata.org/python/xvif/
Il n'est pas évident de comparer l'algorithme que vous décrivez
brièvement et celui de James Clark puisqu'ils semblent prendre le
problème de la validation de manière diamétralement opposée.
James Clark décrit une méthode dite "par dérivation" adaptée de celles
qui permettent d'écrire des processeurs d'expressions régulières : en
gros, on calcul la "dérivée" du schéma par le document en enlevant du
schéma ce que l'on trouve dans le document et le document est valide si
l'on n'a détecté aucune erreur pendant la validation et si tout ce qui
reste dans le schéma à la fin de la validation est optionnel.
En suivant ce principe, mon écriture de la dérivation d'un pattern
"oneOrMore" par un noeud est :
def deriv(self, node):
pderiv = self.p.deriv(node)
if pderiv == notAllowed:
if self.p.nullable():
pderiv = self.savp.deriv(node)
if pderiv == notAllowed:
return pderiv
else:
self.p = pderiv
return self
else:
return pderiv
else:
self.p = pderiv
return self
C'est à dire que je calcul la dérivée de la valeur actuelle du pattern
inclus dans le pattern "oneOrMore" par le noeud (pderiv =
self.p.deriv(node)).
S'il n'y a pas d'erreur, je conserve cette valeur (c'est que l'on est
toujours dans la même "boucle" pour reprendre votre terminologie).
Sinon, je regarde s'il n'y avait que des patterns optionnels dans "la
boucle courante" (self.p.nullable()).
Si ce n'est pas le cas il y a erreur, sinon je pars dans une nouvelle
boucle en dérivant la valeur initiale du pattern inclus dans le pattern
oneOrMore (pderiv = self.savp.deriv(node)).
J'espère que vous pourrez adapter tout cela à votre propre
implémentation!
Cordialement,
Eric van der Vlist
--
If you have a XML document, you have its schema.
http://examplotron.org
------------------------------------------------------------------------
Eric van der Vlist http://xmlfr.org http://dyomedea.com
(ISO) RELAX NG ISBN:0-596-00421-4 http://oreilly.com/catalog/relax
(W3C) XML Schema ISBN:0-596-00252-1 http://oreilly.com/catalog/xmlschema
------------------------------------------------------------------------
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Mon Mar 7 15:59:30 2005