Bonjour,
Je souhaite extraire au moins le texte de fichiers word et pdf, pour une
chaîne XML en JAVA.
Une recherche rapide semble m'orienter vers <http://www.textmining.org>
et <http://www.pdfbox.org/>.
Aurais-je manqué une librairie incontournable ? Merci d'avance pour
votre conseil.
--
Frédéric Glorieux ("AJLSM", <http://ajlsm.com>)
--
Devenez redacteur <XML>fr et contribuez au developpement du
xml francophone (http://xmlfr.org/infos/redacteurs/) !
Liste de diffusion "xml-tech@xmlfr.org" (http://xmlfr.org).
Cette liste est a votre disposition pour discuter en francais de
tout sujet technique lie a XML.
Pour resilier votre abonnement, envoyez un message contenant
la commande "unsubscribe" a xml-tech-request@xmlfr.org
(mailto:xml-tech-request@xmlfr.org?Subject=unsubscribe)
Received on Mon Jun 6 11:50:48 2005