Fabrice Estiévenart wrote:
>bonjour,
>
>je cherche un moyen direct et élégant (si possible en Java) pour interroger
>de l'HTML distant avec XPath (sans transiter par Tidy et la création d'un
>fichier XML temporaire)...j'aimerais éviter Tidy car il déplace certains
>tags et rend mes expressions XPath invalides.
>
>
Vous pouvez essayer NekoHTML, qui se greffe sur Xerces, et qui est
beaucoup moins "destructeur" que JTidy.
http://www.apache.org/~andyc/neko/doc/html/
Il sera malgré tout nécessaire de construire le DOM résultant, parce que
XPath ne sait travailler que sur un arbre...
Sylvain
--
Sylvain Wallez Anyware Technologies
http://www.apache.org/~sylvain http://www.anyware-tech.com
{ XML, Java, Cocoon, OpenSource }*{ Training, Consulting, Projects }
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Tue Dec 7 18:29:52 2004