Chaque fois qu'un paramètre bidon est passé en url
cela crée des fichiers de cache
Or il arrive que des erreurs de programmation
font que des paramètres erronés sont créés, temporairement.
Ou bien il arrive que les noms des paramètres d'url changent,
et alors les anciens ne sont plus valables.
Mais les moteurs de recherche se souviennent de toutes ces adresses
qui ont un jour existé, et continuent à venir les visiter
même lorsqu'elles n'existent plus, longtemps après,
continuant à générer des fichiers de cache.
Ces urls parasites et les fichiers de cache correspondant
ne peuvent que se multiplier avec le temps
- les webmaster tools montrent à quel point -.
Or SPIP évite la génération de cache pour les paramètres d'url
dont le nom commence par "var_"
La logique ne pourrait elle, optionnellement, être inversée,
c'est à dire que seules les variables explicitement déclarées
(via un define, une variable ou une page de paramétrage)
seraient considérées comme significatives pour le cache ?
Pour les autres, ne générant pas de cache, elles seraient
soit totalement ignorées
soit (var_recalcul, etc) gérées par les mécanismes du noyau spip.
Mais les moteurs de recherche se souviennent de toutes ces adresses
qui ont un jour existé, et continuent à venir les visiter
même lorsqu'elles n'existent plus, longtemps après,
continuant à générer des fichiers de cache.
Ce point a été réglé depuis un petit moment déjà, de façon plus agressive : on ne génère jamais de cache pour les URLs demandées par un robot d'indexation connu (et si on peut on lui sert le cache disponible même si il est périmé) : http://core.spip.org/projects/spip/repository/revisions/20378
Après le mieux serait de déclarer des variables obsolètes et de renvoyer un 301 sans cette variable à chaque fois qu'une URL est présentée avec, pour l'éliminer des index.
Il faut faire cela dans un des plugins SEO très certainement.
Ce point a été réglé depuis un petit moment déjà, de façon plus agressive : on ne génère jamais de cache pour les URLs
demandées par un robot d'indexation connu (et si on peut on lui sert le cache disponible même si il est périmé) : http://core.spip.org/projects/spip/repository/revisions/20378
Ah, super. Ça semble bien.
Après le mieux serait de déclarer des variables obsolètes
Pas évident d'en avoir une liste exhaustive : ce serait un peu comme de faire la liste
des brins et des poussières dans une pelle, après avoir passer le balai.
et de renvoyer un 301 sans cette variable à chaque fois qu'une
URL est présentée avec, pour l'éliminer des index. Il faut faire cela dans un des plugins SEO très certainement.
Effectivement, pour éviter des calculs pour rien.
Pour google, on peut aussi déclarer dans les webmastertools les paramètres d'url non significatives,
- quand je l'ai fait pour un site de 12 ans d'age, cela a bien divisé les visites du robot -
mais il faudrait le faire pour tous les autres moteurs, pour autant que ça soit possible.
Renvoyer une 301 a des effets plus solides.