[spip-dev] CACHE gonfl é gonflant

Bonjour,

Le 20 novembre 2002, Fil avait écrit ceci :

Coucou,

sur le Diplo le CACHE/ fait 1.1 Go... ;-(

je suppose qu'un aspirateur a déraillé et fait n'importe quoi, mais on ne
peut pas laisser les choses partir comme ça sans contrôle... il va falloir
trouver un mécanisme de limitation de l'espace disque occupé par le cache.

Des idées ?

Il s'en était suivi une discussion sur l'opportunité de pouvoir gérer le
cache.

Il y a quelques mois mon hébergeur râlait car mon cache remplissait tout
l'espace qui m'était alloué.

J'ai augmenté mon espace disque et...me voilà à nouveau rendu à 2Go de
cache!

C'est vrai que beaucoup de nos utilisateurs aspirent le site pour le
consulter offline mais bon...c'est clair que ça pose problème à force là :slight_smile:

Il y a une parade qui a été trouvée? Un moyen de pouvoir limiter la taille
du cache?

Il n'y a pas que les utilisateurs, il y a aussi les robots google & cie.

Un truc simple qui pourrait être implémenté, ce serait de ne générer la page
dans le cache que si les stats indiquent que cette page fait plus de n
consultations / jour.

C'est sur que l'idéal serait d'implémenter un LRU, m'enfin c'était une idée
comme ça pour faire simple :slight_smile:

- --
Hervé LEFEBVRE http://www.linuxfrench.net
aegir@free.fr
LUTTEZ CONTRE LA VENTE FORCÉE DE LOGICIELS :
http://www.linuxfrench.net/oem/

Sur les machines ou j'ai des sites SPIP j'ai accès aux crontab donc je
supprime tous les jours le cache qui a une date de création de plus de
7 jours... . Bon dans le cas d'un gonflage du cache ponctuel
(aspirateur) c'est vrai que ca ne sert pas à grand chose, mais
autrement ca permet de le garder à une taille raisonnable.

Salut Philippe,

Il y a quelques mois mon hébergeur râlait car mon cache remplissait tout
l'espace qui m'était alloué.

J'ai augmenté mon espace disque et...me voilà à nouveau rendu à 2Go de
cache!

Deux gigots ?! C'est quoi ton site ? Il y a beaucoup d'articles ?
Tu devrais essayer la dernière version CVS, il y a un mécanisme
pour limiter les dégâts (mais deux gigots, c'est énorme, à moins
que tu sois le webmestre masqué de l'Humanité et des amateurs
de haricots blancs).

a+

Antoine.

Salut Antoine,

Il y a quelques mois mon hébergeur râlait car mon cache remplissait tout
l'espace qui m'était alloué.

J'ai augmenté mon espace disque et...me voilà à nouveau rendu à 2Go de
cache!

Deux gigots ?!

Yep... Tout rond.

C'est quoi ton site ?

En plus c'est un "petit" site confidentiel: le journal des actualités sur
les allergies : deux articles/jour...

Il y a beaucoup d'articles ?

Non, 1300 et quelques centaines de brèves :frowning:

50Mo de base..pour 2Go de cache: c'est disproportionné...

Et en plus avec cette taille la commande "vider le cache" ne fonctionne
plus, je le fais en ftp.

La seule *connerie* que je vois que j'aurais pu faire eut été un
recherche.php3 avec un délai différent de 0 mais...non, même pas.
:frowning:

Il y a d'autres conneries que j'ai pu faire? Là je vois pas...

Tu devrais essayer la dernière version CVS, il y a un mécanisme
pour limiter les dégâts

Ok je vais me faire prochainement (dans l'été, c'est moins fréquenté..) la
mise à jour.

(mais deux gigots, c'est énorme, à moins
que tu sois le webmestre masqué de l'Humanité et des amateurs
de haricots blancs).

Même pas, plus les années passent et moins je suis "politique", y compris
"politique des haricots blancs" :wink:

> Il y a beaucoup d'articles ?
Non, 1300 et quelques centaines de brèves :frowning:

50Mo de base..pour 2Go de cache: c'est disproportionné...

Oui, à tout le moins. Tu devrais aller voir les fichiers du CACHE,
leur nom te renseignera peut-être sur le type de requêtes dont
il s'agit. Notamment, si tu as été trop large sur les rewrite
rules et qu'une URL erronée est indexée par les moteurs de
recherche, ça peut récursivement générer beaucoup d'URLs
foireuses.

(par exemple, si tonsite.com/tonsite.com/ affiche à tort le
contenu de tonsite.com, et que cette URL est présente sur une
de tes pages - par exemple à cause d'un forumiste distrait
qui aura mis une URL relative à la place d'une URL absolue -,
les moteurs de recherche vont se mettre à indexer :

tonsite.com
tonsite.com/tonsite.com
tonsite.com/tonsite.com/tonsite.com ...

mais aussi

tonsite.com/tonsite.com/article1.html
tonsite.com/tonsite.com/article25.html ...
tonsite.com/tonsite.com/tonsite.com/article1.html ...)

Même pas, plus les années passent et moins je suis "politique", y compris
"politique des haricots blancs" :wink:

Tu reprendras bien une petite raffarinade de fayots mijotés ?

j'aimerai bien savoir ce que ceci sous entends...

Re bonsoir,

Il y a beaucoup d'articles ?

Non, 1300 et quelques centaines de brèves :frowning:

50Mo de base..pour 2Go de cache: c'est disproportionné...

Oui, à tout le moins. Tu devrais aller voir les fichiers du CACHE,

Les 2Go? Morts, paix à leur âmes d'octets.

Par contre pour les nouveaux je vois déjà un problème :
Mes pages articles c'est une colonne de droite, une colonne de droite ET un
corps qui correspond à l'article.
Dans le cache CHAQUE colonne est rattachée à l'article au lieu d'être
incluse telle quelle.

leur nom te renseignera peut-être sur le type de requêtes dont
il s'agit. Notamment, si tu as été trop large sur les rewrite
rules et qu'une URL erronée est indexée par les moteurs de
recherche, ça peut récursivement générer beaucoup d'URLs
foireuses.

Pas de rewrite url.

(par exemple, si tonsite.com/tonsite.com/ affiche à tort le
contenu de tonsite.com, et que cette URL est présente sur une
de tes pages - par exemple à cause d'un forumiste distrait
qui aura mis une URL relative à la place d'une URL absolue -,
les moteurs de recherche vont se mettre à indexer :

tonsite.com
tonsite.com/tonsite.com
tonsite.com/tonsite.com/tonsite.com ...

Ah ...euh ...les forumistes mettent rarement des url (ils savent même pas
que ça existe et qu'on dit plutôt uri (http://www.w3.org/Addressing/) et
comme je reçois les messages du forum en direct je corrigerai si je vois
passer.

mais aussi

tonsite.com/tonsite.com/article1.html
tonsite.com/tonsite.com/article25.html ...
tonsite.com/tonsite.com/tonsite.com/article1.html ...)

La colonne de gauche link vers plan.php3...et comme elle est calculée pour
chauqe article ou breve avec l'id de l'article ou de la breve...pouf pouf...
:frowning:

A noter aussi que mon site est dans un sous repertoire du premier site ce
qui donne deux adresses valables:

http://www.allergique.org/ l'officiel
Et...
http://www.weballergies.com/(blanc pas être googlisé)allergique.org/

Ça peut doubler la taille du cache ça aussi sûrement.
200Mo de cache ça serait correct, 2Go ça l'est pas.

Même pas, plus les années passent et moins je suis "politique", y compris
"politique des haricots blancs" :wink:

Tu reprendras bien une petite raffarinade de fayots mijotés ?

Cent façons :-p

Par contre pour les nouveaux je vois déjà un problème :
Mes pages articles c'est une colonne de droite, une colonne de droite ET un
corps qui correspond à l'article.
Dans le cache CHAQUE colonne est rattachée à l'article au lieu d'être
incluse telle quelle.

Si tu vas à l'adresse suivante :
http://www.allergique.org/article.php3?id_article=1332

Le chapo de l'article est cliquable et renvoie vers :
http://www.allergique.org/article.php3?id_article=1332&PHPSESSID=120f2249a33f44872e23357c51fd7c0a

Ca n'arrive que la première fois, ou si on refuse les cookies.
Malheureusement les moteurs de recherche, eux, ne risquent
pas d'accepter les cookies :wink:
Du coup ton cache va être pollué par des tas de PHPSESSID
à la noix de coco.

Il se pourrait que ce soit lié à ton système de paiement
pour les articles, non ?

a+

Antoine.

http://www.allergique.org/article.php3?id_article=1332&PHPSESSID=120f2249a33f44872e23357c51fd7c0a
Du coup ton cache va être pollué par des tas de PHPSESSID
à la noix de coco.

A tout hasard: PHPSESSID est négligé par la version CVS de SPIP dans son
calcul du num du fichier cache

-- Fil

Par contre pour les nouveaux je vois déjà un problème :
Mes pages articles c'est une colonne de droite, une colonne de droite ET un
corps qui correspond à l'article.
Dans le cache CHAQUE colonne est rattachée à l'article au lieu d'être
incluse telle quelle.

Si tu vas à l'adresse suivante :
http://www.allergique.org/article.php3?id_article=1332

Le chapo de l'article est cliquable et renvoie vers :
http://www.allergique.org/article.php3?id_article=1332&PHPSESSID=120f2249a33f4
4872e23357c51fd7c0a

Dans mon squelette c'est juste [(#URL_ARTICLE)], étrange ça.

Ca n'arrive que la première fois, ou si on refuse les cookies.

Malheureusement les moteurs de recherche, eux, ne risquent
pas d'accepter les cookies :wink:
Du coup ton cache va être pollué par des tas de PHPSESSID
à la noix de coco.

Il se pourrait que ce soit lié à ton système de paiement
pour les articles, non ?

Pas au système allopass mais ptet bien avec phpsecure oui.

Visiblement il renvoie le PHPSESSID du dernier connecté...
Bof ça...

Merci : j'avais pas vu.

Fil a également écrit:

A tout hasard: PHPSESSID est négligé par la version CVS de SPIP dans son
calcul du num du fichier cache

Ça c'est une BONNE idée :slight_smile:
Merci!

> Du coup ton cache va être pollué par des tas de PHPSESSID
> à la noix de coco.

A tout hasard: PHPSESSID est négligé par la version CVS de SPIP dans son
calcul du num du fichier cache

-- Fil

Quel est le fichier à récupérer pour cette mise à jour ?
Quelle version de spip utiliser ??? 1.6 ou 1.6+CVS ???

merci d'avance

Coyote