From: Sylvain Wallez (sylvain.wallez@anyware-tech.com)
Date: 05/12/2003 - 11:33
BELLENGIER Sylvain PP DL SDIT EPP wrote:
>Bonjour,
>
>Existe-t-il des produits open source permettant de générer automatiquement des documents XML et XSLT à partir d'un document HTML (à défaut XHTML) ?
>
>
Il y a en fait deux problèmes différents :
1 - convertir du HTML en XHTML (pour retrouver un document XML bien formé)
2 - convertir du XHTML en XML + XSLT
Pour le premier problème, on peut utiliser Tidy ou JTidy (qui semble ne
plus évoluer) et NeckoHTML (une extension de Xerces).
Pour le 2ème problème, c'est un sujet beaucoup plus vaste : s'agit-il
d'extraire le contenu sémantique d'une page HTML arbitraire, la XSLT
doit-elle reconstituer le HTML d'origine à partir du XML obtenu?
Sylvain (un autre!)
--
Sylvain Wallez Anyware Technologies
http://www.apache.org/~sylvain http://www.anyware-tech.com
{ XML, Java, Cocoon, OpenSource }*{ Training, Consulting, Projects }
Orixo, the opensource XML business alliance - http://www.orixo.com
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Archive générée par hypermail 2.1.3 le 28/06/2004 - 11:06 UTC
webmaster@xmlfr.org
|