Accueil
 chercher             Plan du site             Info (English version) 
L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.Les listes de discussions XMLfr sont à votre disposition pour réagir sur nos articles ou simplement poser une question.Si vous ètes passionnée(e) par XML, pourquoi ne pas en faire votre métier ?XMLfr n'est heureusement pas le seul site où l'on parle de XML. Découvrez les autres grâce à XMLfr et à l'ODP.Les partenaires grâce auxquels XMLfr peut se développer.Pour tout savoir sur XMLfr.XMLfr sans fil, c'est possible !Pour ceux qui veulent vraiment en savoir plus sur XML.L'index du site.
 Manifestations XML francophones et internationales.L'actualité des affaires et stratégies XML.L'actualité des technologies XML.Les nouveautés et l'actualités de notre site.Pointeurs sur l'actualité XML sur d'autres sites, en français comme en anglais.


La linguistique est-elle mûre?

Répondez à cet article.

Habituellement considérées comme des technologies prometteuses mais manquant de maturité, les approches linguistiques semblent faire de grands progrès dans le domaine de la recherche et de la catégorisation automatique de documents, ce qui ne les empêchent pas de rester controversées.

Eric van der Vlist, Dyomedea (vdv@dyomedea.com).
vendredi 21 mars 2003

Ce sujet était le thème de la présentation de Bernard Normier intitulée "Recherche, Taxonomies et Langage Naturel" à Documation lors de la session C20 (Recherche, taxonomies et langages naturels).

Opposant approches statistiques et linguistiques dans le domaine de la classification de documents, il reproche aux premières leur côté "boîtes noires" manquant de réglages et la difficulté de mise au point de corpus d'apprentissage adaptés à chaque contexte.

Présentant taxonomies, ontologies et phraséologies comme les composantes des approches linguistiques, Bernard Normier note la disponibilité d'un nombre croissants d'outils et notamment de bases de connaissances publiées sous des licences comparables aux licences open source qui permettent de mettre en place des systèmes linguistiques en quelques semaines au lieu de plusieurs mois comme c'était le cas auparavant.

Affirmant que ces systèmes ont atteint le stade de la maturité, il a présenté brièvement les résultats d'une étude menée dans le cadre du projet européen ePatent situant les performances atteintes par les différentes composantes des systèmes linguistiques.

Se plaçant sous l'angle plus spécifique de la recherche d'informations, Renaud Laplanche a abondé dans ce sens en montrant comment les techniques linguistiques permettaient de réaliser des recherches à la fois plus exhaustives (en utilisant des thésaurus et des techniques de lemmatisation pour rechercher des formes grammaticales dérivées) et plus précises (pour lever les ambiguïtés).

Si la présentation de Renaud Laplanche visait à maintenir un équilibre entre précision et exhaustivité dans la recherche d'informations, ce n'était pas le cas de la présentation de Michel Bolze ("Gérer la connaissance dans un centre d'appel de support technique") dont la préoccupation était au contraire de ne donner à des téléconseillers qu'une seule réponse répondant à chaque question posée.

Compte tenu de cette contrainte et d'un contexte très tendu en matière de budget et de délais de mise en place, Michel Bolze s'est au contraire déclaré très satisfait de l'aspect "boîte noire sans réglage" des technologies statistiques mises en place dans le cadre de son projet ainsi que des résultats obtenus.

Si les technologies linguistiques arrivent à maturité, elles semblent donc être encore réservées à certains types de projets.

Autres articles:

Copyright 2003, Eric van der Vlist.


 

Mots clés.



L'histoire de XML s'écrit en ce moment même. XMLfr vous aide à la suivre et à en dégager les tendances.


Les documents publiés sur ce site le sont sous licence "Open Content"
Conception graphique
  l.henriot  

Conception, réalisation et hébergement
Questions ou commentaires
  redacteurs@xmlfr.org