[spip-dev] Bug surlignage après recherche Google

En SPIP 2.1.0 dev SVN [13590], si je fais une recherche dans Google puis clique sur un lien allant sur mon site, j'ai bien les mots recherchés qui sont surlignés, mais j'en ai aussi d'autres.

Par exemple, cette recherche :
http://www.google.com/search?hl=fr&q=site%3Awww.gasteroprod.com+stephen+king&btnG=Rechercher&lr=

Donne notamment ce résultat :
http://www.gasteroprod.com/blog/citation-de-stephen-king.html

Dans lequel j'ai bien « stephen » et « king » qui sont alors surlignés, mais j'ai aussi « commentaire », « commentaires », « commenter », « incompatibilité », « comment », « communautés », « commons » et « commerciale ».

Du coup on voit que ce sont tous des mots contenant « com », donc je suppose que cela est dû au « com » du critère de recherche « site:www.gasteroprod.com ».

Peut-être faudrait-il ne pas découper les chaînes de recherche contenant des "."

-Nicolas

Nicolas Hoizey a écrit :

Du coup on voit que ce sont tous des mots contenant « com », donc je suppose que cela est dû au « com » du critère de recherche « site:www.gasteroprod.com ».

Peut-être faudrait-il ne pas découper les chaînes de recherche contenant des "."

plutôt exclure les chaines qui contiennent des : ?

JL

Pourquoi exclure plutôt que simplement ne pas couper ?

-Nicolas

> plutôt exclure les chaines qui contiennent des : ?

Pourquoi exclure plutôt que simplement ne pas couper ?

Parce que tu ne veux pas non plus de la chaîne www.gasteroprod.com. En fait
on veut échapper ce qui commence par "site:" dans ce cas particulier, mais
comment généraliser ?

Olivier G. a écrit :

plutôt exclure les chaines qui contiennent des : ?

Pourquoi exclure plutôt que simplement ne pas couper ?

les préfixes avec : sont des meta-instructions pour les moteurs de recherches
(link, site, inurl, ...)

Ces méta instructions ne concernent pas une recherche dans le site,
qui est la seule demande pertinente pour le moteur de recherche spip.

JL

plutôt exclure les chaines qui contiennent des : ?

Pourquoi exclure plutôt que simplement ne pas couper ?

Parce que tu ne veux pas non plus de la chaîne www.gasteroprod.com.

Bin à priori, si j'ai la chaîne "site:www.gasteroprod.com" dans les contenus de mon site, je veux bien qu'elle soit surlignée si elle fait partie de la recherche...

En fait on veut échapper ce qui commence par "site:" dans ce cas particulier, mais
comment généraliser ?

Pourquoi ne pas tout « simplement » dire que seuls les espaces sont des séparateurs de mots dans les recherches (et donc le surlignage) comme le fait Google ?

-Nicolas