Simon St.Laurent
a annoncé
Regular Fragmentations,
un filtre SAX2 qui
sépare des éléments XML
en éléments plus petits en utilisant des règles s'appuyant sur des expressions régulières.
Eric van der Vlist,
Dyomedea (vdv@dyomedea.com).
lundi 25 juin 2001
Ce développement fait suite à des discussions sur xml-dev:
"Un compte rendu des discussions qui ont conduit à ce package est
disponible sur XML.com dans l'article de Leigh Dodds "Parsing the Atom"."
Les définitions des expressions régulières et de leurs
règles d'application sont stockées dans un fichier (XML)
de configuration:
"Au fur et à mesure que le contenu passe à travers le filtre, les
éléments identifiés par le fichier de configuration sont traités et brisés en
éléments plus petits et utilisant des règles construites sur des expressions
régulières."
Le package s'appuie sur les expressions régulières incluses
dans le parseur Xerces qui sont "largement
conformes au langage d'expressions régulières définies dans l'appendice F de W3C XML Schema partie 2: types de données".
Son implémentation sous forme de filtre SAX permet d'utiliser cet outil au moment du parsing,
juste avant que le contenu soit traité par une application SAX ou DOM ou un
traitement tel qu'une transformation XSLT ou la validation
par un langage de schéma.
Les Regular
Fragmentations sont écrites en Java, nécessitent
le parseur Xerces et sont publiées sous licence
open source MPL (Mozilla
Public License).
Copyright 2001,
Eric van der Vlist.
|