dev@xmlfr.org : liste de discussion des développeurs du site XMLfr
[dev@xmlfr.org] Lucene ? Re: [xhtml] Objectifs
From: Frédéric Glorieux (frederic.glorieux@ajlsm.com)
Date: 31/12/2003 - 16:52
>>Cela repose sur Lucene. Tous les documents sont indexés en plein texte,
>>avec des champs pour leurs meta (date, sujet, auteur...). Cela devient
>>alors très facile de fournir des listes de termes sur un champ, ainsi
>>que bien sûr des résultats sur des requêtes.
>>
>>
>
>
> Je suis très intéressé par ce que peut apporter SDX (ou ses grands
> principes) pour faire des recherches classifiées.
Pour le projet que je signe en bas (un portail SDX pour la
Méditerranée), le problème le plus essentiel est l'exigence documentaire
initiale. Cela peut se formuler en termes de schémas, mais cela ne
suffit pas. Jusqu'où faut-il baliser ? A un moment le problème devient
aussi bête que de fournir des listes d'autorités de noms de lieux ou de
personnes s'il on veut faire quelques regroupements crédibles.
> D'après ce que j'ai
> vu, on peut l'utiliser pour naviguer dans des taxonomies (ou
> ontologies?) de façon assez souple.
Voulez vous parler de thesauri ? La fonctionalité à été commandée et
implantée depuis un an. Elle est destinée à remplacer ceci
<http://www.culture.gouv.fr/documentation/thesarch/pres.htm>
(développements Bull vieillissants).
> A propos, Lucene 1.3 est sorti, et dans la discussion suivant l'annonce
> sur TSS, on parle d'un moteur de recherche assez monstrueux motorisé par
> Lucene (http://www.theserverside.com/home/thread.jsp?thread_id=23043)
Je le vois bien, encore du travail en perspective pour ajister nos
surcharges. Nous avons par exmemple un contributeur qui a fait ceci
<http://narsil.toulouse.archi.fr:8075/sdx/quran>. A votre avis, est-ce
que le coran parle d'ordinateurs ? Tapez "computer" dans le champ de
recherche anglais...
--
Frédéric Glorieux
AJLSM, ingénieur documentaire
<frederic.glorieux@ajlsm.com>
tel +33 (0)1 49 54 22 22
fax +33 (0)1 49 54 21 80
http://www.strabon.org
EUMEDIS - Strabon - WP7 - formation/training
Maison des Sciences de l'Homme
54 Boulevard Raspail
75006 PARIS
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "dev@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie au developpement du site XMLfr.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a dev-request@xmlfr.org
(mailto:dev-request@xmlfr.org?Subject=unsubscribe)
Archive générée par hypermail 2.1.3 le 31/12/2003 - 17:02 UTC
webmaster@xmlfr.org
|