From: Eric van der Vlist (vdv@dyomedea.com)
Date: 27/06/2000 - 13:52
Bonjour,
"Lefebvre, Christophe" wrote:
>
> Bonjour,
>
> Je crains que ce genre de question soit trop generale pour pouvoir y
> apporter une reponse.
Effectivement et j'avoue que je n'avais pas compris la question ;=) ...
> Je pense qu'une transformation HTML => XML est possible mais plus ou moins
> difficile selon le HTML d'entree. Rien ne ressemble a
> un <p> qu'un autre <p> alors qu'ils peuvent contenir deux informations tres
> distinctes.
> Si maintenant il est possible d'ecrire des regles logiques qui permettent de
> donner un qualificatif a notre <p> un programme de transformation
> implementant ces regles pourrait etre ecrit (en OmniMark par exemple).
Il y a en fait deux problèmes imbriqués :
1) la transformation de HTML en XHTML.
C'est une transformation purement syntaxique qui, dans les cas simples
peut être gérée par HTML Tidy (http://www.w3.org/People/Raggett/tidy/)
qui malheureusement a tendance à laisser tomber un peu vite quand le
HTML est vraiment trop mal structuré.
Peut-être que la question initiale s'arrêtait-elle à cette étape !
2) la transformation XHTML vers un autre format XML qui demande de
"deviner", en fonction du contexte, la valeur sémantique des
informations contenues dans la page (X)HTML.
Si l'on a traduit le document en XHTML, cette transformation peut
utiliser XSLT, et il est vrai qu'elle peut être complexe.
> Par contre je doute qu'il soit possible de generer automatiquement une XSL
> qui, appliquee au XML, permettrait d'obtenir le fichier HTML d'origine. Une
> intervention "manuelle" me semble incontournable.
Effectivement (sauf si l'on s'est arrêté au 1. auquel cas la
transformation se limite à la transformation "identité" !).
Eric
> Christophe Lefebvre
> Nagora Consultants
>
--
------------------------------------------------------------------------
Eric van der Vlist Dyomedea http://dyomedea.com
http://xmlfr.org http://4xt.org http://ducotede.com
------------------------------------------------------------------------
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Archive générée par hypermail 2.1.3 le 28/06/2004 - 11:05 UTC
webmaster@xmlfr.org
|