Cliquez ici.
Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.

 
Cliquez ici.

dev@xmlfr.org : liste de discussion des développeurs du site XMLfr

[dev@xmlfr.org] Re: Moteur de recherche : que booster?

From: Frédéric Glorieux (frederic.glorieux@ajlsm.com)
Date: 05/07/2004 - 17:51


> On trouve http://xmlfr.org/ (utile quand on vient
> de l'extérieur mais totalement inutile quand on est déjà sur XMLfr),

Pour un premier résultat, ce n'est pas si mal ? Ils augmentent peut-être
le score selon le niveau dans une branche.

> En l'occurrence, LA page à afficher en premier pour les termes faisant
> partie de l'index est à mon avis la page de l'index, soit dans ce cas :
> http://xmlfr.org/index/object.title/xml/
> C'est en effet cette page qui contient la définition du terme.

ça, ils ne peuvent pas le savoir s'il n'y a pas des personnes qui la
citent dans leurs pages ? Par contre, voilà un exemple où un moteur de
recherche interne connaissant sa structure ajoute de la valeur, c'est
rassurant.

> Par ailleurs, on pourra toujours proposer comme alternative une
> recherche Google depuis la page de recherche de XMLfr (cela ne nous
> dispense pas de faire de notre mieux pour fournir une fonction de
> recherche décente!).

En tous cas en dev, je crois très intéressant de mettre les deux en
parallèle jusqu'à ajuster les meilleurs filtres.

> Question subsidiaire : comment booster un terme apparaissant dans un
> titre? J'ai vu comment booster un document ou un champ, mais n'ai pas vu
> comment booster un terme dans un champ (surtout si l'utilisateur
> n'interroge pas sur ce champ).

je vois que ma science est mauvaise et déformée pas nos couches de
développement sur Lucene (la division du travail...). De retour à l'API
source, j'ai d'abord découvert l'excellente méthode explain() sur un
IndexSearcher, qui pourrait nous être servi en tests de dev ?

http://jakarta.apache.org/lucene/docs/api/org/apache/lucene/search/Searchable.html#explain(org.apache.lucene.search.Query,%20int)

Par contre, je suppose qu'à court terme il vaudrait mieux limiter le
nombre de résultats à l'affichage ?

> Autre question : est-il utile de proposer de chercher parmi les
> résultats de la requête précédante?

Nous le faisons, cela plait, mais pour l'utilisateur, nous ne maintenons
pas de stats. Selon la surcouche SDX,

http://www.nongnu.org/sdx/docs/html/doc-sdx2/fr/reference/actions/recherche/amender.html#sdx_basequery

cela s'appelle une "requête de base". Peu importe, l'idée est de garder
en mémoire la requête initiale de l'utilisateur et d'ajouter un "et" à
la suivante.

> Est-ce que cela demande l'utilisation de
> "FilteredQuery"?

Pour les requêtes filtrées, elle permettent de diminuer le jeu de
documents sur lequel chercher (un bitset de résultats que l'on obtient
par une requête).

La différence est ici,
si je cherche XML et Vlist (le "base query") les résultats tiendront
compte de la pertinence de XML, tandis que XMl puis Vlist fera d'abord
un tri de tous ce qui parle d'XML, puis rangera ensuite selon la
fréquence de Vlist.

Ces raffinements commencent à prendre de l'importance sur des
collections importantes.

> * le fait qu'il faut indexer les pages de l'index (ou prévoir une
> autre méthode d'interfaçage entre index et moteur de recherche).

Oui ! Pas encore d'idée pour obtenir que cela passe en no 1 (hors Lucene
? comme tooltip d'analyse de requête ?)

> * le fait qu'il faut effectivement "sous-booster" les courriels.

Et probablement les nettoyer.

>>On pourrait booster un terme apparaissant dans un titre (après avoir
>>nettoyer les titres de mails ) ?

Sur cette proposition, il faut que je cherche plus pour fournir une
réponse précise.

--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !

Liste de diffusion "dev@xmlfr.org" (http://xmlfr.org).

Cette liste est a votre disposition pour discuter en francais de tout sujet technique lie au developpement du site XMLfr.

Pour resilier votre abonnement, envoyez un message contenant la commande "unsubscribe" a dev-request@xmlfr.org (mailto:dev-request@xmlfr.org?Subject=unsubscribe)



Archive générée par hypermail 2.1.3 le 21/07/2004 - 21:32 UTC

webmaster@xmlfr.org

 

dev@xmlfr.org

Liste de discussion de la communauté des développeurs de XMLfr.

Cette liste publique est dédiée aux discussions concernant la conception et le développement technique du site XMLfr.



Cliquez ici.
Cliquez ici.

Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot  

Conception, réalisation et hébergement
Questions ou commentaires
  redacteurs@xmlfr.org