Indexation de documents joints

Maxime_Lemonnier · Décembre 15, 2003, 4:30

Bonjour,

Je cherchait un moyen d'indexer des documents joints (notamment *.doc et *.pdf) et jâai finalement optÃ© pour une indexation dans SPIP. En effet, htdig et mnogosearch utilisent des logiciels annexes (catdoc, pdftotext...) pour convertir ces types de document et les indexer ensuite.

Jâai donc utilisÃ© les logiciels de conversion (citÃ©s prÃ©cÃ©demment) ainsi que les fonctions de nettoyage de chaines inclues dans SPIP pour indexer les docs dans une nouvelle table (de mÃªme structure que les tables dâindex)

Cette solution marche plutÃ´t bien, cependant, il arrive parfois quâun mÃªme mot nâait pas le mÃªme numÃ©ro de hash. Ainsi, un mot recherchÃ© pourra ne pas Ãªtre trouvÃ© alors quâil a bien Ã©tÃ© indexÃ©...

A quoi cela peut-il Ãªtre du ?

Merci.

_________________________________________________________________
MSN Messenger http://g.msn.fr/FR1001/866 : dialoguez en direct et gratuitement avec vos amis !