dev@xmlfr.org : liste de discussion des développeurs du site XMLfr
[dev@xmlfr.org] Re: Première(naïve) pr oposition d'utilisation de Lucene]
From: Frédéric Laurent (fl@opikanoba.org)
Date: 28/06/2004 - 13:11
Eric van der Vlist wrote:
> Dans le cas des brèves, si vous regardez par exemple
> http://xmlfr.org/actualites/breves/2004-06-24, vous avez toutes les
> brèves publiées le 24 juin mais cela n'empêche pas que chaque a son URL,
> par exemple http://xmlfr.org/actualites/breves/2004-06-24#T14:56:44:354
> et le fait de pouvoir les indexer individuellement me semble
> intéressant.
>
> Pour un moteur de recherche qui n'a pas de connaissance de la structure
> des sites, 1 information = 1 page me semble incontournable.
>
> Lucene permet de sortir de cette restriction lorsque l'on connait la
> structure d'un site et d'avoir une granularité différente ce celle des
> pages.
>
> Est-ce que les brèves ne sont pas un exemple pour lequel cette
> possibilité est intéressante?
c'est vraiment le cas typique de décorrelation entre la structure
physique : 1 fichier et la structure logique : n documents Lucene
pour moi, c'est en effet comme ça que cela doit fonctionner
>
> A l'inverse, on pourrait également se demander s'il est intéressant
> d'indexer en tant que tel la page 3 d'un document qui serait
> incompréhensible sans lecture préalable des pages 1 et 2 (mais je n'ai
> pas d'exemples de tels documents sur XMLfr et le débat serait donc plus
> théorique!).
si c'est vrai pour la lecture, ce peut être différent pour la
recherche... priver l'utilisateur de tomber sur le document
parce que le terme qu'il cherche se trouve à la 5 eme page me
semble très restrictif... à lui de voir s'il doit tout lire ou pas...
il peut chercher un paragraphe bien spécifique dans un document qu'il
connait, et ne pas avoir besoin des premières pages...
--
XPath free testing software : http://www.opikanoba.org/lantern/
Frédéric Laurent http://www.opikanoba.org
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "dev@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie au developpement du site XMLfr.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a dev-request@xmlfr.org
(mailto:dev-request@xmlfr.org?Subject=unsubscribe)
Archive générée par hypermail 2.1.3 le 28/06/2004 - 21:32 UTC
webmaster@xmlfr.org
|