Merci pour cette réponse fort détaillée !
Désolé pour le doublons que j'ai envoyé, mais je ne voyais pas arriver ma question...
Ah si, une derniere question: est-il possible d'autoriser des recherches sur des mots à deux lettres ?
Ne me prenez pas pour un fou, mais j'ai des sigles en mots-clés qui pour certains sont courts et de plus (heureusement) n'ont aucune signification en français et n'ont donc aucune chance de se retrouver dans des articles. Où peut-on modifier ce paramètre ?
Merci et mille bravos pour votre travail, c'est gigantesque !
Max
pitrou@free.fr on 13/08/2001 15:01:00
Pour : spip@rezo.net@hub
cc : (ccc : Maxime CALMEJANE/AEE/DER/EDFGDF/FR)
Objet : Re: [Spip] Moteur de recherche intégré: questions
Maxime CALMEJANE wrote:
1/ Sur quel(s) champ(s) fonctionne-t-il: titre, surtitre, texte....?
Tous, avec pondération (le titre compte plus que le post-scriptum, etc)
2/ Fonctionne-t-il uniquement sur la base spip_articles ?
Non, aussi les brèves, les rubriques, les auteurs, les mots-clés.
L'utilisation de l'indexation a tendance à tripler la taille
de la base mysql (i.e. chaque table d'indexation prend en moyenne
deux fois plus de place que la table du contenu correspondant -
articles, brèves...).
3/ Accepte-t-il les mots tronqués/non entiers, les opérateurs booléens ?
Les mots tronqués, oui ("libe" trouvera "liberté" - pas l'inverse).
Les caractères accentués sont transformés en caractères non
accentués, pour éviter les problèmes de claviers et charsets.
Les mots de trois lettres ou moins sont ignorés. L'extraction
des mots est faite en une passe avec une unique expression régulière
assez crade, ce qu'il fait qu'il y a 1 ou 2% de déchets dans
la base d'indexation ; ce qui reste négligeable (de plus
personne ne cherche les déchets). C'est la seule façon de
conserver une indexation rapide en PHP (par comparaison, voir
PHPDig, qui fait une indexation propre, et est horriblement
lent, inutilisable en temps réel).
Pas d'opérateurs booléens : les scores des différents mots de
la recherche sont cumulés pour donner le score total.
4/ Est-il "facile" d'utiliser un autre moteur de recherche à la place de
l'existant ?
Il suffit de désactiver le moteur intégré (ce qui est fait par défaut)
et d'en installer un autre.
Par contre, tu ne peux pas l'appeler depuis les squelettes : les pages
de résultats affichées par le moteur seront celles du moteur, non des
pages définies dans SPIP. De même, SPIP ne commandera pas automatiquement
au moteur de réindexer un document s'il a changé : il n'y a pas de
communication entre les deux.
5/ Si oui: quel fichier modifier, y a-t-il des particularités de
configuration ?
Voir le manuel de ton moteur ! Tu dois indexer ton site SPIP comme
n'importe quel autre site. La seule chose est que le moteur doit
pouvoir fonctionner avec les sites dynamiques (cela veut dire en
général qu'il passe par le serveur Web au lieu d'indexer directement
les fichiers HTML).
Merci d'avance pour la réponse, de plus si quelqu'un a remplacé
le moteur existant, je suis intéressé par le retour d'expérience !!!
Le Monde Diplomatique utilise htdig à la place ; il n'y a apparemment
aucun problème.
a+
Antoine.
_______________________________________________
spip mailing list
spip@rezo.net
http://listes.rezo.net/mailman/listinfo/spip