[spip-dev] liaison d'articles par les titres

Bonjour,

Un des problèmes des sites web est la cohérence des liaisons entre les documents. Leur écriture à la main devient de plus en plus coûteuse avec l'augmentation du nombre d'articles et de rubriques. Une solution désirable est de lier automatiquement les documents entre eux, de manière à n'avoir que des liens opérationnels dans le document livré au client web.

J'ai programmé un filtre spip qui permet la liaison tardive des articles en fonction de leur titre. J'entends par liaison tardive la création d'hyperliens au moment de la génération du fichier cache. Cette fonctionnalité assure la cohérence des liaisons entre les documents.

Vous pouvez observer son comportement sur le site http://hypergeo.free.fr

Ce filtre effectue un ensemble de traitements syntaxiques permettant de prendre en compte les formes plurielles des titres, de reconnaître les mots accentués ou sans accents et avec des caractères HTML. Il reconnaît des formes similaires comme "centre/périphérie", "centre-périphérie", "centre et périphérie"...
A partir du titre "Christaller (le modèle de)", il reconnaît "Christaller" et "le modèle de Christaller".
A partir du titre "Système d'Information Géographique (S.I.G.)", il reconnaît "Système d'Information Géographique", "S.I.G." mais aussi "SIG".
Ces caractéristiques fonctionnent avec des sites multilingues, actuellement en français, anglais et espagnol. Pour prendre en compte d'autres langues il faut créer les règles relatives à ces langues.
Le filtre est programmé de manière à pouvoir facilement l'appliquer à d'autres cas. Il est possible par exemple de lier les articles en fonction de mots clés.

Je propose de s'inspirer de ce filtre pour intégrer une fonctionnalité similaire à SPIP. J'invite l'équipe des développeurs de SPIP à prendre contact avec moi à ce sujet.

Bien cordialement à tous,

Alain Touret

Salut à tous

J'ai un problème avec le rafraîchissement des forums sur mon site (hébergé
chez OVH) :
http://www.info-camargue.com/camargue-forum.html

De temps en temps, une ou deux fois par semaine, les nouveaux messages
n'apparaissent pas, la page en cache n'est plus rafraîchie.
Ca arrive aussi bien sur la liste des sujets (liste des messages forums de
premier niveau sur un article SPIP) que sur un sujet donné (message de
premier niveau et toutes ses réponses).

Le fait de forcer manuellement le recalcul de la page fait apparaître les
messages postés qui n'étaient pas visibles, et ça marche de nouveau...
jusqu'à la prochaine fois.

Est-ce que quelqu'un a déjà constaté ce problème ? Y a-t-il une solution ou
une explication ?

Merci d'avance
Thierry Chatel

J'ai programmé un filtre spip qui permet la liaison tardive des articles
en fonction de leur titre. J'entends par liaison tardive la création
d'hyperliens au moment de la génération du fichier cache. Cette
fonctionnalité assure la cohérence des liaisons entre les documents.

Vous pouvez observer son comportement sur le site http://hypergeo.free.fr

Intéressant ; peux-tu le distribuer sur www.spip-contrib.net ?

-- Fil

Fil wrote:

J'ai programmé un filtre spip qui permet la liaison tardive des articles en fonction de leur titre. J'entends par liaison tardive la création d'hyperliens au moment de la génération du fichier cache. Cette fonctionnalité assure la cohérence des liaisons entre les documents.

Vous pouvez observer son comportement sur le site http://hypergeo.free.fr
   
Intéressant ; peux-tu le distribuer sur www.spip-contrib.net ?

-- Fil

Oui, bientôt, car je veux l'accompagner d'un texte descriptif que je n'ai pas encore terminé.

Alain