Bonjour,
Je cherchait un moyen d'indexer des documents joints (notamment *.doc et *.pdf) et jâai finalement opté pour une indexation dans SPIP. En effet, htdig et mnogosearch utilisent des logiciels annexes (catdoc, pdftotext...) pour convertir ces types de document et les indexer ensuite.
Jâai donc utilisé les logiciels de conversion (cités précédemment) ainsi que les fonctions de nettoyage de chaines inclues dans SPIP pour indexer les docs dans une nouvelle table (de même structure que les tables dâindex)
Cette solution marche plutôt bien, cependant, il arrive parfois quâun même mot nâait pas le même numéro de hash. Ainsi, un mot recherché pourra ne pas être trouvé alors quâil a bien été indexé...
A quoi cela peut-il être du ?
Merci.
_________________________________________________________________
MSN Messenger http://g.msn.fr/FR1001/866 : dialoguez en direct et gratuitement avec vos amis !