[SPIP Zone] Une idée de plugin pour tirer partie des nouvelles URL propres de la 1.9.3

Avec la 1.9.3, on dispose d'une mécanique pour gérer plusieurs url pour un même objet SPIP. La dernière en date étant celle active.

Lorsqu'on migre un site statique vers SPIP, on a le problème du référencement des URLs de l'ancien site.

Avec un pipeline sur les 404, on pourrait enregistrer dans spip_urls :
- l'url demandée
- mettre comme type 404
- mettre comme id_objet=id_objet+1
- mettre dans la date la date heure de demande

Et faire une interface qui permettrait d'afficher les URL en 404 et de proposer de les lier à un objet SPIP existant.

--
RealET

Le 08/10/07, RealET <real3t@gmail.com> a écrit :

Avec la 1.9.3, on dispose d’une mécanique pour gérer plusieurs url pour
un même objet SPIP. La dernière en date étant celle active.

Lorsqu’on migre un site statique vers SPIP, on a le problème du
référencement des URLs de l’ancien site.

Avec un pipeline sur les 404, on pourrait enregistrer dans spip_urls :

  • l’url demandée
  • mettre comme type 404
  • mettre comme id_objet=id_objet+1
  • mettre dans la date la date heure de demande

Et faire une interface qui permettrait d’afficher les URL en 404 et de
proposer de les lier à un objet SPIP existant.


RealET


spip-zone@rezo.net - http://listes.rezo.net/mailman/listinfo/spip-zone

Bof, si tu listes les répertoires de l’ancien site pour les pages html et les pj,
tu colles ça dans un tableur , tu mets un id spip à coté et tu injectes ça en dur en base, pas plus simple ?
Chaque fois que j’ai eu ce pb j’avais à faire à une reprise en masse.
A+

Arnaud

* Arnaud Ventre tapuscrivait, le 08/10/2007 17:29:

Le 08/10/07, *RealET* <real3t@gmail.com <mailto:real3t@gmail.com>> a écrit :

    Avec la 1.9.3, on dispose d'une mécanique pour gérer plusieurs url pour
    un même objet SPIP. La dernière en date étant celle active.

    Lorsqu'on migre un site statique vers SPIP, on a le problème du
    référencement des URLs de l'ancien site.

    Avec un pipeline sur les 404, on pourrait enregistrer dans spip_urls :
    - l'url demandée
    - mettre comme type 404
    - mettre comme id_objet=id_objet+1
    - mettre dans la date la date heure de demande

    Et faire une interface qui permettrait d'afficher les URL en 404 et de
    proposer de les lier à un objet SPIP existant.

    --
    RealET

    _______________________________________________
    spip-zone@rezo.net
    <mailto:spip-zone@rezo.net> -
    http://listes.rezo.net/mailman/listinfo/spip-zone

Bof, si tu listes les répertoires de l'ancien site pour les pages html et les pj,
tu colles ça dans un tableur , tu mets un id spip à coté et tu injectes ça en dur en base, pas plus simple ?
Chaque fois que j'ai eu ce pb j'avais à faire à une reprise en masse.

C'est aussi une solution.
Elle pourrait être complémentaire.
L'intérêt de la solution 404, c'est d'être dynamique dans le temps.

--
RealET

Le 08/10/07, RealET <real3t@gmail.com> a écrit :

  • Arnaud Ventre tapuscrivait, le 08/10/2007 17:29:

Le 08/10/07, RealET <real3t@gmail.com
mailto:[real3t@gmail.com](mailto:real3t@gmail.com)> a écrit :

Avec la 1.9.3, on dispose d’une mécanique pour gérer plusieurs url pour
un même objet SPIP. La dernière en date étant celle active.

Lorsqu’on migre un site statique vers SPIP, on a le problème du
référencement des URLs de l’ancien site.

Avec un pipeline sur les 404, on pourrait enregistrer dans spip_urls :

  • l’url demandée
  • mettre comme type 404
  • mettre comme id_objet=id_objet+1
  • mettre dans la date la date heure de demande

Et faire une interface qui permettrait d’afficher les URL en 404 et de
proposer de les lier à un objet SPIP existant.


RealET


spip-zone@rezo.net
<mailto: spip-zone@rezo.net> -
http://listes.rezo.net/mailman/listinfo/spip-zone

Bof, si tu listes les répertoires de l’ancien site pour les pages html
et les pj,
tu colles ça dans un tableur , tu mets un id spip à coté et tu injectes
ça en dur en base, pas plus simple ?
Chaque fois que j’ai eu ce pb j’avais à faire à une reprise en masse.
C’est aussi une solution.
Elle pourrait être complémentaire.
L’intérêt de la solution 404, c’est d’être dynamique dans le temps.

Dans ce cas c’est pas trop pour de la reprise mais plus pour faire de l’analyse d’erreur 404 et éventuellement de les rediriger (tu peux avoir une pollution non négligeables dans les 404, url tapées à la main , lien tronqués, …). Ce qui me semble utile dans ce cas est de les remonter avec un nombre d’appel (genre un count /group by url). Avec aussi éventuellement le referrer pour voir si tu as pas des sites qui te référence mal. Mais là on est plus proche d’une analyse de logs non ?..

A+

Arnaud

Un truc plus cool, pour eviter de traiter tout ce bruit qu'Arnaud
mentionne serait d'avoir une page 404 qui utilise un {like} ou un
{recherche} sur l'url propre arrivant, pour pointer vers des articles
qui pourraient correspondrent...

ça fait un moment que j'y pense, mais j'ai pas eu le temps de faire
tout ce que je voulais là dessus. En particulier, je ne sais pas trop
comment changer la fonction d'url propre pour rediriger avec une
variable correspondant à l'url propre tappée.

Pierre

On 10/8/07, Arnaud Ventre <ventrea@gmail.com> wrote:

Le 08/10/07, RealET <real3t@gmail.com> a écrit :
> * Arnaud Ventre tapuscrivait, le 08/10/2007 17:29:
> > Le 08/10/07, *RealET* <real3t@gmail.com
> > <mailto:real3t@gmail.com>> a écrit :
> >
> > Avec la 1.9.3, on dispose d'une mécanique pour gérer plusieurs url
pour
> > un même objet SPIP. La dernière en date étant celle active.
> >
> > Lorsqu'on migre un site statique vers SPIP, on a le problème du
> > référencement des URLs de l'ancien site.
> >
> > Avec un pipeline sur les 404, on pourrait enregistrer dans spip_urls
:
> > - l'url demandée
> > - mettre comme type 404
> > - mettre comme id_objet=id_objet+1
> > - mettre dans la date la date heure de demande
> >
> > Et faire une interface qui permettrait d'afficher les URL en 404 et
de
> > proposer de les lier à un objet SPIP existant.
> >
> > --
> > RealET
> >
> > _______________________________________________
> > spip-zone@rezo.net
> > <mailto: spip-zone@rezo.net> -
> > http://listes.rezo.net/mailman/listinfo/spip-zone
> >
> >
> > Bof, si tu listes les répertoires de l'ancien site pour les pages html
> > et les pj,
> > tu colles ça dans un tableur , tu mets un id spip à coté et tu injectes
> > ça en dur en base, pas plus simple ?
> > Chaque fois que j'ai eu ce pb j'avais à faire à une reprise en masse.
> C'est aussi une solution.
> Elle pourrait être complémentaire.
> L'intérêt de la solution 404, c'est d'être dynamique dans le temps.

Dans ce cas c'est pas trop pour de la reprise mais plus pour faire de
l'analyse d'erreur 404 et éventuellement de les rediriger (tu peux avoir une
pollution non négligeables dans les 404, url tapées à la main , lien
tronqués, .....). Ce qui me semble utile dans ce cas est de les remonter
avec un nombre d'appel (genre un count /group by url). Avec aussi
éventuellement le referrer pour voir si tu as pas des sites qui te référence
mal. Mais là on est plus proche d'une analyse de logs non ?....

A+
--
Arnaud
_______________________________________________
spip-zone@rezo.net -
http://listes.rezo.net/mailman/listinfo/spip-zone

--
Pierre Andrews
Ph.D. Student, The University of York
Ing.info.dipl. EPFL
pierre.andrews@a3.epfl.ch
http://www.cs.york.ac.uk/~pandrews

* Arnaud Ventre tapuscrivait, le 08/10/2007 18:24:

Le 08/10/07, *RealET* <real3t@gmail.com <mailto:real3t@gmail.com>> a écrit :

    * Arnaud Ventre tapuscrivait, le 08/10/2007 17:29:
     > Le 08/10/07, *RealET*
    <real3t@gmail.com
    <mailto:real3t@gmail.com>
     > <mailto:real3t@gmail.com
    <mailto:real3t@gmail.com>>> a écrit :
     >
     > Avec la 1.9.3, on dispose d'une mécanique pour gérer
    plusieurs url pour
     > un même objet SPIP. La dernière en date étant celle active.
     >
     > Lorsqu'on migre un site statique vers SPIP, on a le problème du
     > référencement des URLs de l'ancien site.
     >
     > Avec un pipeline sur les 404, on pourrait enregistrer dans
    spip_urls :
     > - l'url demandée
     > - mettre comme type 404
     > - mettre comme id_objet=id_objet+1
     > - mettre dans la date la date heure de demande
     >
     > Et faire une interface qui permettrait d'afficher les URL en
    404 et de
     > proposer de les lier à un objet SPIP existant.
     >
     > --
     > RealET
     >
     > _______________________________________________
     > spip-zone@rezo.net
    <mailto:spip-zone@rezo.net>
     > <mailto: spip-zone@rezo.net
    <mailto:spip-zone@rezo.net>> -
     > http://listes.rezo.net/mailman/listinfo/spip-zone
     >
     > Bof, si tu listes les répertoires de l'ancien site pour les pages
    html
     > et les pj,
     > tu colles ça dans un tableur , tu mets un id spip à coté et tu
    injectes
     > ça en dur en base, pas plus simple ?
     > Chaque fois que j'ai eu ce pb j'avais à faire à une reprise en
    masse.
    C'est aussi une solution.
    Elle pourrait être complémentaire.
    L'intérêt de la solution 404, c'est d'être dynamique dans le temps.

Dans ce cas c'est pas trop pour de la reprise mais plus pour faire de l'analyse d'erreur 404 et éventuellement de les rediriger (tu peux avoir une pollution non négligeables dans les 404, url tapées à la main , lien tronqués, .....). Ce qui me semble utile dans ce cas est de les remonter avec un nombre d'appel (genre un count /group by url).

Le count, c'est : id_objet=id_objet+1

Avec aussi éventuellement le referrer pour voir si tu as pas des sites qui te référence mal. Mais là on est plus proche d'une analyse de logs non ?....

Oui et non.
Analyser, c'est bien, décider, c'est mieux.
Là, c'est un outil d'analyse qui permet de décider.

--
RealET

Pierre Andrews a écrit :

Un truc plus cool, pour eviter de traiter tout ce bruit qu'Arnaud
mentionne serait d'avoir une page 404 qui utilise un {like} ou un
{recherche} sur l'url propre arrivant, pour pointer vers des articles
qui pourraient correspondrent...

ça fait un moment que j'y pense, mais j'ai pas eu le temps de faire
tout ce que je voulais là dessus. En particulier, je ne sais pas trop
comment changer la fonction d'url propre pour rediriger avec une
variable correspondant à l'url propre tappée.

moi j'avais fait ça qui a bien marché pendant un moment
dans un vieux inc-url-perso.php3 :

function recuperer_parametres_url($fond, $url)
{
...
  if ($row = spip_fetch_array($result)) // si on trouve l'article
  {
  ...
  }
  else if (strpos ($url, ".html")===FALSE) // pas trouvé
    return; // c'est un php3 donc on laisse passer ...
  else
  {
      $rech=str_replace("-","+",str_replace(".html","",substr($url,1)));
      Header("Location: recherche.php3?pourquoi=Page_Inconnue&recherche=".$rech);

      exit;
  };
}

Quand ça marchait c'était super satisfaisant !
ça appelle simplement la page de recherche
avec un parm 'pourquoi' en plus pour un petit message signalant le pb.

JLuc

Ce serait sympa de pouvoir afficher une liste des urls, mais aussi
d'en préciser "à la main" ou d'en fixer certaines de manière à ce
qu'elles ne bougent pas même si le titre changent (ça c'est quand leur
date est en l'an 9999).

Si ça se trouve c'est une interface qui peut se coder exclusivement en
squelette + crayons.

-- Fil