[spip-dev] cache et multi domaine

Bonjour,

ayant visiblement un problème de cache sur mon site (spip 1.7) j'ai commencé à regarder les fonctions liées au cache et me demandant si le fait d'avoir 3 ou 4 domaines pointant sur le site pouvait en être la cause. A noter que j'utilise aussi la réécriture d'url

Sur un site qui contient 1035 articles, 366 brèves, 993 contributions de forum je me suis retrouvé avec 100 Mo de cache. En regardant le cache je vois que visiblement un article peut être plusieurs fois en cache exemple :

pour l'article suivant : http://www.cyberbougnat.net/Allez_Clermont_a1113.html en 3 heures j'ai eu 62 fichiers cache avec pour nom des trucs dans le genre :
ann-Allez_Clermont_a1113.f722a3.NEW
ann-Allez_Clermont_a1113.539e65.NEW
cin-Allez_Clermont_a1113.45126e.NEW
mem-Allez_Clermont_a1113.3716b7.NEW
gal-Allez_Clermont_a1113.daafd0.NEW

Je me demandais si cela pouvait venir du fait que le site peut être consulté via 3 ou 4 domaines différents. Après avoir regardé le code je pense que non car le nom de base du calcul utilise REQUEST_URI et après test la ligne $fichier_cache = generer_nom_fichier_cache($fichier_requete); renvoie bien la même valeur que ce soit avec un domaine ou un autre.

Alors reste la question : où chercher si ce n'est pas ça et à quoi correspondent les premiers caractères (ann-, cin-, ....) ?

Merci de votre aide

Bertrand

Salut,

pour l'article suivant :
http://www.cyberbougnat.net/Allez_Clermont_a1113.html en 3 heures j'ai
eu 62 fichiers cache avec pour nom des trucs dans le genre :
ann-Allez_Clermont_a1113.f722a3.NEW
ann-Allez_Clermont_a1113.539e65.NEW
cin-Allez_Clermont_a1113.45126e.NEW
mem-Allez_Clermont_a1113.3716b7.NEW
gal-Allez_Clermont_a1113.daafd0.NEW

C'est dû à une réécriture d'URLs trop laxiste.
Par exemple :
  http://www.cyberbougnat.net/annuaire/Allez_Clermont_a1113.html
est équivalent à :
  http://www.cyberbougnat.net/Allez_Clermont_a1113.html

Il suffit donc qu'un lien relatif depuis l'annuaire soit mal écrit pour
que la première URL ci-dessus soit indexée. Or une fois que Google (ou
tout autre moteur ou aspirateur) arrive sur cette page, il va y suivre
les liens relatifs... qui sont également mauvais :
  http://www.cyberbougnat.net/annuaire/Le_Mag_r51.html
  http://www.cyberbougnat.net/annuaire/Sortir_r1.html

Tu vas donc te retrouver avec une flopée de fichiers inutiles dans le
cache. Le système des ".NEW" est un garde-fou permettant de limiter les
effets d'une telle erreur : en effet il purge périodiquement les pages
qui n'ont été chargées qu'une fois (typiquement les URLs trop laxistes
ci-dessus).

Il faut donc que tu réécrives tes règles de réécriture afin d'être plus
strict sur les variantes d'URLs autorisées.

Amicalement

Antoine.

Salut Antoine

Il faut donc que tu réécrives tes règles de réécriture afin d'être plus
strict sur les variantes d'URLs autorisées.

Amicalement

Antoine.

effectivement j'ai reproduit le problème. je vais de ce pas corriger cela. merci beaucoup

Bertrand