Cliquez ici.
Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.

 
Cliquez ici.

dev@xmlfr.org : liste de discussion des développeurs du site XMLfr

[dev@xmlfr.org] Re: Première(naïve) pr oposition d'utilisation de Lucene

From: Eric van der Vlist (vdv@dyomedea.com)
Date: 28/06/2004 - 13:33


Bonjour,

On Mon, 2004-06-28 at 15:05, Frédéric Laurent wrote:
> Eric van der Vlist wrote:
>
> > Ces instructions indiquent que tout les textes sous l'élément "/nitf"
> > seront indexés dans un champ de type "UNSTORED" appelé "contenu", que
> > les textes sous les éléments hedline/hl1 et hedline/hl2 seront stockés
> > dans des champs de type TEXT nommés respectivement "titre1" et "titre2"
> > et que les attributs dateline/story.date/chron/@norm et
> > dateline/story.date/@norm seront stockés dans des champs de type DATE
> > nommés "date".
>
> je trouve que titre1 et titre2 ne sont pas très bien choisis, et qu'ils
> sont difficiles à exploiter pour l'utilisateur
> titre et description seraient sans doute plus explicites
> car hedline/hl2 et item/description correspondent bien à une description

Oui, je vais modifier cela.

> >
> > Les chemins sont du simili XPath (je ne me suis pas (encore?) ennuyé à
> > supporter les espaces de noms).
>
> pourquoi utiliser un Handler sax ?

Parce que j'aime bien SAX :-) et que c'est rapide...

> pour ne pas faire un ensemble de requetes Xpath et indexer les
> résultats ? ça me parait plus simple...

Je ne pense pas que cela simplifierait tellement et mon handler SAX me
semble au contraire particulièrement simple mais je me trompe peut-être.

> le cas des balises imbriquées est gérée par exemple,
> <hedline><hl1>le <org>W3C</org> ...</hl1></hedline> ?
> car le terme W3C n'est pas dans hedline/hl1...

C'est déjà le cas et dans mon implémentation actuelle, je considère que
lorsque je dis que le titre est "hedline/hl1", je considère que c'est
tout le contenu de hedline/hl1 et des éléments qui y sont inclus qui
forme le titre. C'est en quelque sorte <xsl:value-of
select="//hedline/hl1"/> sauf que j'insère des espaces après chaque fin
d'élément pour éviter des concaténations intempestives (je pourrais
améliorer la chose pour ne pas les ajouter en cas de contenu mixte mais
je ne suis pas allé jusque là pour le moment).

> > PS: pour faire tourner cela chez vous, il vous faut Xerces, Lucene et
> > Snowball.
>
> oui mais il faut aussi une base de documents à indexer...

Assurément. Elle est disponible sous
http://dev.xmlfr.org/cgi-bin/viewcvs.cgi/xmlfr/ et
http://dev.xmlfr.org/svn/xmlfr/ mais il manque les brèves qui ne sont
pas stockées (pour le moment) dans le répertoire subversion. Je vais
essayer d'arranger cela. En attendant, si vous en voulez une copie,
envoyez-moi un mail privé et je vous en enverrai une copie.

Merci,

Eric

-- 
Tired of typing XML tags?
                                                       http://wikiml.org
Upcoming XML schema languages tutorial:
 - Portland   -half day-   (27/07/2004)        http://masl.to/?E6ED13728
------------------------------------------------------------------------
Eric van der Vlist       http://xmlfr.org            http://dyomedea.com
(ISO) RELAX NG   ISBN:0-596-00421-4 http://oreilly.com/catalog/relax
(W3C) XML Schema ISBN:0-596-00252-1 http://oreilly.com/catalog/xmlschema
------------------------------------------------------------------------

-- Devenez redacteur <XML>fr et contribuez au developpement du xml francophone (http://xmlfr.org/infos/redacteurs/) !

Liste de diffusion "dev@xmlfr.org" (http://xmlfr.org).

Cette liste est a votre disposition pour discuter en francais de tout sujet technique lie au developpement du site XMLfr.

Pour resilier votre abonnement, envoyez un message contenant la commande "unsubscribe" a dev-request@xmlfr.org (mailto:dev-request@xmlfr.org?Subject=unsubscribe)



Archive générée par hypermail 2.1.3 le 28/06/2004 - 21:32 UTC

webmaster@xmlfr.org

 

dev@xmlfr.org

Liste de discussion de la communauté des développeurs de XMLfr.

Cette liste publique est dédiée aux discussions concernant la conception et le développement technique du site XMLfr.



Cliquez ici.
Cliquez ici.

Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot  

Conception, réalisation et hébergement
Questions ou commentaires
  redacteurs@xmlfr.org