Cliquez ici.
Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Commentaires et questions non techniques.Commentaires et questions techniques.

 
Cliquez ici.

xml tech : Technologies XML

[xml-tech] Re: Filtrage de doublons

[xml-tech] Re: Filtrage de doublons

Auteur: <greg@gregserveur.com>
Date: 06/02/2006 - 17:33

Je préfere bien preciser car j'ai pas envie de partir dans un truc qui
n'est pa necessaire.

Les articles sont assez "volumineux", c'est des articles scientifiques et
il risque d'y en avoir pas mal avec le temps. C'est pour ca qu'on a
preferé crer plusieurs fichiers separés. De plus ca sera plus simple pour
les mises à jour. Les articles ont été balisés afin de respecter une
ontologie. (Realisé par des chercheurs de la facultés)

Ce que je comprend pas c'est pourquoi on arrive a trier l'ensemble des
titres de tous les articles (chaques titres est dans un fichier separé) et
pourquoi on peut pas effectuer un filtrage de doublons.

En tout cas, ca devient le bordel pour les doublons. Car encore les
auteurs ca va. Ca m'inquite...Mais les concepts c'est deja plus emmerdants
mais aprés c'est dans le moteur de recherche. Car il peux y avoir
plusieurs resultats dans un même fichiers a des positions differentes...
Il faut pas qu'un article apparaissent 2 fois des les resultats. Au
maximum, dans le moteur de recherche il y aura x resultats : x etant le
nombre d'articles referenciés.

Quoique en reflechissant, on peut tres bien rien faire lorsque on
rencontre un resultat et juste mettre à jour la pertinence. Il y aura donc
autant de variable pertiance que de resultat... Comment on peux gérer ça ?

On generera donc un structure avec les pertinance.. et on trira comme on
en a discué dans un message précédent.

D'ailleurs, peut-on créer et utiliser une structure dans un même fichier
XSL ?
C'est nécessaire de créer le fichier ?

Merci pour tes conseils et ton aide!

> Le lundi 06 février 2006 à 17:42 +0100, greg@gregserveur.com a écrit :
>> C'est vraiment tordu le XSL.
> Oui et non... XSLT est fait avant tout pour travailler sur des documents
> XML de manière "unitaire".
>
>> Le SORT fonctionne sur des documents qui peuvent etre separés...
>
> xsl:sort permet de trier des données dans un document distinct du
> document dans lequel on est actuellement.
>
>> et la ca marche pas :s
>
> Si, cela marche parfaitement dans ce contexte (trier des données dans un
> autre document que le document actuel). C'est le contexte dans lequel je
> pensais que vous étiez avant de lire votre mail précédent!
>
>> Le problème c'est que pour filtrer sur les auteurs, il n'y a pas de
>> soucis. Mais le problemes c'est qu'il y a d autres filtrage de doublons
>> prévus. Les articles referencie des concepts (pas mal) et tout un tas de
>> truc dont on ne connais pas forcement la positions... et qu'il faut
>> aussi
>> dédoublonner... Alors si a chaque fois, il faut créer un fichier XML
>> pour
>> transiter... Tu aurais un exemple simple ?
>
> Est-ce que le plus simple n'est pas de tout recopier (je ne connais pas
> la volumétrie)...
>
> <xsl:template match="fichier">
> <fichier path="{.}">
> <xsl:for-each select="document(.)/ARTICLE">
> <xsl:copy>
> <xsl:copy-of select="@num|id|..."/>
> <xsl:copy>
> </xsl:for-each>
> </fichier>
> </xsl:template>
>
> donnera une structure dans laquelle vous retrouverez à la fois les
> informations de la liste des fichiers et celles des articles (remplacer
> les "..." dans xsl:copy-of par les éléments à recopier).
>
>> Ils ont de la chance que c'est pas moi qui est choisi le format. Je
>> t'aurais callé une bonne petite bdd et avec SQL...
>
> Il y avait également sans doute moyen de faire plus simple en
> XML :-) ...
>
> Cordialement,
>
> Eric van der Vlist
>
> --
> GPG-PGP: 2A528005
> Curious about Relax NG? Read my book online.
> http://books.xmlschemata.org/relaxng/
> ------------------------------------------------------------------------
> Eric van der Vlist http://xmlfr.org http://dyomedea.com
> (ISO) RELAX NG ISBN:0-596-00421-4 http://oreilly.com/catalog/relax
> (W3C) XML Schema ISBN:0-596-00252-1 http://oreilly.com/catalog/xmlschema
> ------------------------------------------------------------------------
>
>
> -- Attached file included as plaintext by Ecartis --
>
> -----BEGIN PGP SIGNATURE-----
> Version: GnuPG v1.4.1 (GNU/Linux)
>
> iD8DBQBD539kDvn+ZCpSgAURAvlDAJ91oYlG/OgGaz7OYBAInF+UAcfUlwCbBGoX
> ozM97V+09utEhtVAzGXFJ54=
> =j6eX
> -----END PGP SIGNATURE-----
>
>
> --
> Devenez redacteur <XML>fr et contribuez au developpement du
> xml francophone (http://xmlfr.org/infos/redacteurs/) !
>
> Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
>
> Cette liste est a votre disposition pour discuter en francais de
> tout sujet technique lie a XML.
>
> Pour resilier votre abonnement, envoyez un message contenant
> la commande "unsubscribe" a xml-tech-request@xmlfr.org
> (mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
>
>

--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de 
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant 
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Mon Feb 6 18:33:46 2006

Archive générée par hypermail 2.1.8 le 28/02/2006 - 20:42 UTC

webmaster@xmlfr.org

 

xml tech

Discussions techniques au sujet de XML.

Cette liste est à votre disposition pour discuter en français de tout sujet technique lié à XML.



Devenez rédacteur <XML>fr et contribuez au développement du xml francophone !
Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot@online.fr  

Conception, réalisation et hébergement