Question pondération recherche via mot-clé

Bonjour,

J’ai une question concernant la pondération de la recherche en fonction des mot-clés. Sur cette page Comment fonctionne le moteur de recherche de SPIP ? - SPIP, on lit :

« Si un mot-clé est associé à un article, il entre alors dans l’indexation de l’article lui-même, avec une forte pondération (12 points pour le nom du mot-clé, 3 points pour son descriptif). »

J’ai bien une pondération lié au nom du mot-clé mais je n’en retrouve pas avec son descriptif. Voila quelques détails :

J’ai créé ce mot-clé :

  • Nom : « bowie »
  • Descriptif rapide : « mercury »
  • Texte explicatif : « mercury »

Et j’ai créé 4 articles en faisant varier leur contenu et la présence/absence du mot-clé :

  • Article 1 avec « bowie » présent dans le texte et sans « bowie » associé en tant que mot-clé
  • Article 2 avec « bowie » présent dans le texte et avec « bowie » associé en tant que mot-clé
  • Article 3 avec « bowie » + « mercury » présents dans le texte et sans « bowie » associé en tant que mot-clé
  • Article 4 avec « bowie » + « mercury » présents dans le texte et avec « bowie » associé en tant que mot-clé

Voici les points que SPIP accorde en fonction de deux recherches :

  • recherche de « bowie » :
    • Article 1 : 5 points
    • Article 2 : 20 points
    • Article 3 : 5 points
    • Article 4 : 20 points
  • recherche de « mercury » :
    • Article 1 : 0 points
    • Article 2 : 0 points
    • Article 3 : 7 points
    • Article 4 : 7 points

Les résultats de recherche pour « bowie » me paraissent cohérents : les points augmentent si l’article a en plus le mot-clé associé.

Par contre, les résultats de recherche pour « mercury » ne me semblent pas cohérents avec ce qu’indique la documentation : il n’y pas de points accordés à l’article si le mot recherché est dans la description du mot-clé associé et ce que le mot recherché soit présent ou non dans le texte de l’article.

Est-ce que c’est le fonctionnement normal de SPIP ? Je suis sur SPIP 4.1.5.

Bonne journée,
Vincent

Bonjour Vincent,

Je ne suis pas certain que quelqu’un se soit donné la peine de vérifier les calculs de points et leur pondération comme tu l’as fait, et donc il se peut qu’il y ait des trucs à améliorer.

Toutefois, si tu modifies ton site au fur et à mesure que tu fais les tests, il se peut aussi que ce soit un effet de la mise en cache des résultats.

  • SPIP met en cache les résultats HTML de l’évaluation des squelettes. Mais a priori ajouter un motclé invalide le cache donc ça ne devrait pas interférer.
  • Les résultats de recherche sont également mis en cache par un mécanisme spécifique à la recherche : dans la table spip_resultats. Je ne sais pas comment cette table est mise à jour en cas de modification de la BDD, alors tu pourrais simplement la vider de son contenu pour vérifier si ça change quelque chose.

Si jamais il se confirme qu’il y a un problème, il faudrait faire un ticket sur Tickets · spip / spip · GitLab, avec le descriptif précis des situations testées et des résultats.

Bonjour,
Merci @JLuc pour ta réponse. J’ai repéré en effet qu’il fallait bien s’assurer que les résultats ne soient pas mis en cache. Dans mes tests, j’y ai été attentif en enregistrant les pages des articles + celle du mot-clé, en désactivant le cache et en recalculant la page.
Comme tu le suggérais, j’ai donc aussi testé en passant la commande DELETE FROM spip_resultats; sur la base sqlite et les résultats sont bien les mêmes.
Suivant les réponses ici, je ferai éventuellement un ticket sur le git.

Bonjour,
Je viens de créer un ticket sur le git : Problème de pondération de la recherche via mot-clé (#5941) · Tickets · spip / spip · GitLab