C'est un travail en cours de réalisation avec ht://dig : http://www.htdig.org
Je n'ai que des documents pdf à indexer, mais il existe aussi des outils
annexes (catdoc par exemple si mes souvenirs sont exacts) qui permettent
d'indexer des documents word.
J'ai oublié de préciser que je vais faire tourner ça sur plate-forme
IIS, donc sur Windows NT.
A ma connaissance, ht://Dig ne tourne que sur Unix, non ?
"ht://Dig has been tested on these machines (and compilers):
Sun Solaris SPARC 2.X (using gcc/g++)
Sun SunOS 4.1.4 SPARC (using gcc/g++ 2.7.0)
HP/UX 10.X (using gcc/g++)
IRIX 5.3 and 6.X (SGI C++ compiler.)
Most Linux Distributions (using gcc/g++)
Most BSD platforms, including BSDI and Mac OS X (using gcc/g++)"
Je pourrais bien entendu le compiler avec Cygwin, mais je doute de la
stabilité et capacité de montée en charge ...
Je n'ai que des documents pdf à indexer, mais il existe aussi des
outils annexes (catdoc par exemple si mes souvenirs sont exacts) qui
permettent d'indexer des documents word.
J'ai oublié de préciser que je vais faire tourner ça sur
plate-forme IIS, donc sur Windows NT.
Je pourrais bien entendu le compiler avec Cygwin, mais je doute de
la stabilité et capacité de montée en charge ...
Tu peux mettre en place une petite machine dédiée pour htdig, non ?
Non.
Mon client ne veut pas une machine de plus à gérer, et il ne veut que
du Windows.
Ma question initiale était d'ailleurs bien orientée sur Microsoft
Index Server ...
Tant pis, si personne ne l'a fait je vais expérimenter ...