Cliquez ici.
Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.

 
Cliquez ici.

dev@xmlfr.org : liste de discussion des développeurs du site XMLfr

[dev@xmlfr.org] Moteur de recherche

From: Eric van der Vlist (vdv@dyomedea.com)
Date: 22/06/2004 - 11:41


Bonjour,

Tout d'abord, toutes mes excuses pour le peu de temps que j'ai consacré
à cette liste ces derniers mois.

Mon emploi du temps reste chargé et j'ai peur de ne pas être très
disponible pendant les semaines à venir.

Parmi les sujets de discussion ou de récrimination sur la liste des
rédacteurs, le plus virulent est sans doute les critiques portant sur
l'intégration du moteur de recherche au site XMLfr.

Dans la mesure où c'est un sujet moins structurant que le moteur de
publication, j'ai pensé que nous pourrions choisir ce sujet pour
redémarrer doucement les travaux sur cette liste...

Que reproche t-on au moteur actuel?

     1. Le fait de ne pas pouvoir faire de recherche partielles sur une
        portion du site.
     2. Le fait d'indexer des pages intermédiaires (telles que
        http://xmlfr.org ou http://xmlfr.org/actualites, ...).
     3. Les titres qui ne sont pas parlant dans le cas des brèves.
     4. Le fait de ne pas indexer indépendamment des fragments de pages
        (cas des brèves qui sont regroupées par journée).
     5. Autre? <rajoutez.votre.critique.ici/>...

La plupart de ces griefs peuvent être corrigés avec le moteur actuel
(htdig).

Ainsi par exemple, les recherches partielles sont implémentées dans
htdig :

      *
http://xmlfr.org/chercher/htsearch.cgi?config=htdigv2&words=xslt&restrict=/actualites/breves = recherche de "XSLT" uniquement dans les brèves
      *
http://xmlfr.org/chercher/htsearch.cgi?config=htdigv2&words=xslt&restrict=/actualites = recherche de XSLT dans toutes les actualités (info et brèves)
      *
http://xmlfr.org/chercher/htsearch.cgi?config=htdigv2&words=xslt&exclude=/listes recherche de XSLT partout sauf dans les archives de liste
      *
http://xmlfr.org/chercher/htsearch.cgi?config=htdigv2&words=xslt&restrict=/actualites&exclude=/actualites/breves recherche de XSLT dans les actualités mais pas dans les brèves
      * ...

Il suffirait donc de modifier la forme de saisie
http://xmlfr.org/chercher/ pour les exposer.

Le problème de la gestion de fragments de documents semble un peu plus
compliquée à résoudre avec htdig mais j'ai quelques astuces dans mes
cartons qui devraient permettre de faire cela.

Ceci dit, c'est sans doute le moment de remettre en cause le choix du
moteur de recherche et de vois si nous ne pourrions pas trouver quelque
chose de plus facilement intégrable dans l'architecture Java/XSLT
actuelle (sans Cocoon) ou future (avec Cocoon).

Parmi les candidats figurent tout naturellement Lucene déjà mentionné
sur cette liste.

Sa particularité est "d'être déconnecté du web" dans la mesure où ce
n'est qu'une API et qu'elle n'intègre pas de crawler.

Sur XMLfr, on pourrait donc écrire un crawler qui indexe directement les
documents source (NITF pour les articles, RSS pour les brèves et
l'agenda, HTML pour les archives de mail et les traduction, ...) et
intégrer complètement les fonctions de recherche dans l'architecture
Java/XSLT du site.

Avez-vous d'autres moteurs de recherche à proposer et/ou des
commentaires permettant d'éclairer ce choix?

Merci,

Eric

-- 
Have you ever thought about unit testing XSLT templates?
                                                     http://xsltunit.org
Upcoming XML schema languages tutorial:
 - Portland   -half day-   (27/07/2004)        http://masl.to/?E6ED13728
------------------------------------------------------------------------
Eric van der Vlist       http://xmlfr.org            http://dyomedea.com
(ISO) RELAX NG   ISBN:0-596-00421-4 http://oreilly.com/catalog/relax
(W3C) XML Schema ISBN:0-596-00252-1 http://oreilly.com/catalog/xmlschema
------------------------------------------------------------------------

-- Devenez redacteur <XML>fr et contribuez au developpement du xml francophone (http://xmlfr.org/infos/redacteurs/) !

Liste de diffusion "dev@xmlfr.org" (http://xmlfr.org).

Cette liste est a votre disposition pour discuter en francais de tout sujet technique lie au developpement du site XMLfr.

Pour resilier votre abonnement, envoyez un message contenant la commande "unsubscribe" a dev-request@xmlfr.org (mailto:dev-request@xmlfr.org?Subject=unsubscribe)



Archive générée par hypermail 2.1.3 le 28/06/2004 - 21:32 UTC

webmaster@xmlfr.org

 

dev@xmlfr.org

Liste de discussion de la communauté des développeurs de XMLfr.

Cette liste publique est dédiée aux discussions concernant la conception et le développement technique du site XMLfr.



Cliquez ici.
Cliquez ici.

Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot  

Conception, réalisation et hébergement
Questions ou commentaires
  redacteurs@xmlfr.org