Affichage de site corrompu

Bonjour,

Le site que j'administre https://www.etudes-jean-richard-bloch.org/
en Spip 3.2.1, utf-8 depuis longtemps, sans aucun plugin ni squelette
particulier, donne depuis quelques jours un affichage incorrect des
caractères accentués.

J'ai réinstallé Spip, j'ai sauvegardé la base de données et l'ai
restaurée chez moi sur un Spip vierge : rien n'y fait. Je crois
que c'est dans la base que la corruption a eu lieu. C'est hébergé
chez OVH.

Quelqu'un d'entre vous a-t-il déjà rencontré un problème similaire ?

Cordialement.

--
Laurent Bloch - https://www.laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)

Salut,

j’ai eu le cas récemment suite à une mise à jour d’Apache sur mon hébergement.

Si ton site vient de différentes mises à jour depuis un vieux SPIP 3.0, ça peut être un souci d’encodage de la base ou juste de configuration.

La démarche pour corriger est expliquée par ici . Tu peux également regarder les liens dans la partie Autres ressources.

Regarde aussi si ton connect.php précise bien utf8 :
spip_connect_db(‹ localhost ›,’’,‹ root ›,’’,‹ base ›,‹ mysql ›, ‹ spip ›,’’,‹ utf8 ›);

Attention a bien sauvegarder ta base avant toute chose…

jean marie

Bonsoir,

Le Sun, 30 Sep 2018 14:26:10 +0200,
Jean Marie Grall <jeanmarie.listes@cousumain.info> a écrit :

Si ton site vient de différentes mises à jour depuis un vieux SPIP
3.0, ça peut être un souci d'encodage de la base ou juste de
configuration.

Alors, il y a peut-être à l'origine un problème d'encodage, mais
ce n'est plus cela. Un coup d'œil au site pourrait donner une
piste : https://www.etudes-jean-richard-bloch.org/

Merci de la suggestion !

Cordialement.

--
Laurent Bloch - https://www.laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)

Si ton site vient de différentes mises à jour depuis un vieux SPIP
3.0, ça peut être un souci d'encodage de la base ou juste de
configuration.

Alors, il y a peut-être à l'origine un problème d'encodage, mais
ce n'est plus cela. Un coup d'œil au site pourrait donner une
piste : https://www.etudes-jean-richard-bloch.org/

Hummm... des textes s'affichant en réfugié pointent quand même vers un pb d'encodage :slight_smile:

Regarde dans ta base via phpMyAdmin si si les caractères sont bien encodés.
Si mal encodés > plugin grenier
Si bien encodés > suivre le point 2 de Réparer le charset d'une base SPIP - ZZZ + vérifier que tu as bien utf8 dans ton connect.php

         jean marie

Bonjour,

Le 01/10/2018 à 10:13, Jean Marie Grall a écrit :

Hummm... des textes s'affichant en réfugié pointent quand même vers un pb d'encodage :slight_smile:

Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?

CM

Salut

Le 01/10/2018 à 10:54, Christian Marget a écrit :

Bonjour,

Le 01/10/2018 à 10:13, Jean Marie Grall a écrit :

Hummm... des textes s'affichant en réfugié pointent quand même vers un pb d'encodage :slight_smile:

Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?

Nan mais je dis ça parce que, comme précisé dans mon 1er mail, ça m'est arrivé il y a une 10aine de jour suite à une mise à jour d'apache chez OVH et que cette mise à jour s'est terminée sur l'ensemble des hébergements mutualisés en fin de semaine dernière et que le dit site est justement chez OVH...

Donc bon, comme dirait docteur House : "It fits" :slight_smile:

         jean marie

Bonjour,

Le lundi 01 octobre 2018 Christian Marget a écrit ceci :

Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?

Oui, alors c'est bien cela. Si je fais (sous Linux) :

$ recode UTF-8..ISO-8859-1 copie-article-jeu-caracteres.spip

j'obtiens bien un document UTF-8 correct et qui s'affiche correctement :

$ file copie-article-jeu-caracteres.spip
copie-article-jeu-caracteres.spip: UTF-8 Unicode text

Maintenant j'aimerais bien exécuter cette transformation sur les 130 articles
du site sans les prendre un par un. L'un d'entre vous aurait-il une idée ?

Cordialement.

--
Laurent Bloch - https://laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)

Le 01/10/2018 à 16:48, Laurent Bloch a écrit :

Bonjour,

Le lundi 01 octobre 2018 Christian Marget a écrit ceci :

Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?

Oui, alors c'est bien cela. Si je fais (sous Linux) :

$ recode UTF-8..ISO-8859-1 copie-article-jeu-caracteres.spip

j'obtiens bien un document UTF-8 correct et qui s'affiche correctement :

$ file copie-article-jeu-caracteres.spip
copie-article-jeu-caracteres.spip: UTF-8 Unicode text

Maintenant j'aimerais bien exécuter cette transformation sur les 130 articles
du site sans les prendre un par un. L'un d'entre vous aurait-il une idée ?

Si c'est un champ de base de données, ça doit être faisable en ouvrant
la table dans un tableur et en faisant un rechercher-remplacer puis en
la réinjectant dans la base de données (c'est comme ça que je ferais,
personnellement). Ça ne coûte pas beaucoup de temps d'essayer sur une
copie en local.

Voir ce tutoriel pour plus d'infos :

Le procédé est le même si l'objet diffère.

--

Ysabeau
Services, s. m. pl. Mot usité dans cette formule à peu près invariable
du typo en quête de travail: Monsieur, je viens vous offrir mes services
pour la casse.
Dictionnaire de l'argot des typographes - Eugène Boutmy, correcteur
d'imprimerie, 1883.

Le Mon, 1 Oct 2018 17:05:13 +0200,
Ysabeau <id@dutailly.net> a écrit :

Le 01/10/2018 à 16:48, Laurent Bloch a écrit :
> Bonjour,
>
> Le lundi 01 octobre 2018 Christian Marget a écrit ceci :
>
>> Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en
>> UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en
>> UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen
>> de retrouver tes textes initiaux, pour vérifier leurs encodages
>> respectifs?
>
> Oui, alors c'est bien cela. Si je fais (sous Linux) :
>
> $ recode UTF-8..ISO-8859-1 copie-article-jeu-caracteres.spip
>
> j'obtiens bien un document UTF-8 correct et qui s'affiche
> correctement :
>
> $ file copie-article-jeu-caracteres.spip
> copie-article-jeu-caracteres.spip: UTF-8 Unicode text
>
> Maintenant j'aimerais bien exécuter cette transformation sur les
> 130 articles du site sans les prendre un par un. L'un d'entre vous
> aurait-il une idée ?

Si c'est un champ de base de données, ça doit être faisable en ouvrant
la table dans un tableur et en faisant un rechercher-remplacer puis en
la réinjectant dans la base de données (c'est comme ça que je ferais,
personnellement). Ça ne coûte pas beaucoup de temps d'essayer sur une
copie en local.

Voir ce tutoriel pour plus d'infos :
De Wordpress à Spip : un tutoriel, 3 - Tutoriels et logiciels libres

Le procédé est le même si l'objet diffère.

Merci de cette piste : je le fais avec Emacs sur la sauvegarde de
la base, mais le principe est le même.

Au fait, quelqu'un sait-il à quel caractère correspond ß ? Je
soupçonne ß.

Cordialement !

--
Laurent Bloch - https://www.laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)

Le Mon, 1 Oct 2018 17:32:18 +0200,
Laurent Bloch <lb@laurentbloch.org> a écrit :

Au fait, quelqu'un sait-il à quel caractère correspond ß ? Je
soupçonne ß.

La réponse est ici :

https://murviel-info-beziers.com/conversion-iso-8859-1-utf-8-php/

--
Laurent Bloch - https://www.laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)

Le 01/10/2018 à 17:48, Laurent Bloch a écrit :

Le Mon, 1 Oct 2018 17:32:18 +0200,
Laurent Bloch <lb@laurentbloch.org> a écrit :

Au fait, quelqu'un sait-il à quel caractère correspond ß ? Je
soupçonne ß.

La réponse est ici :

https://murviel-info-beziers.com/conversion-iso-8859-1-utf-8-php/

Il y a un truc à corriger à cette page :

INTÊRÊT > INTÉRÊT

--

Ysabeau
Services, s. m. pl. Mot usité dans cette formule à peu près invariable
du typo en quête de travail: Monsieur, je viens vous offrir mes services
pour la casse.
Dictionnaire de l'argot des typographes - Eugène Boutmy, correcteur
d'imprimerie, 1883.

Le Tue, 2 Oct 2018 08:42:31 +0200,
Ysabeau <id@dutailly.net> a écrit :

Le 01/10/2018 à 17:48, Laurent Bloch a écrit :
> Le Mon, 1 Oct 2018 17:32:18 +0200,
> Laurent Bloch <lb@laurentbloch.org> a écrit :
>
>> Au fait, quelqu'un sait-il à quel caractère correspond ß ? Je
>> soupçonne ß.
>
> La réponse est ici :
>
> https://murviel-info-beziers.com/conversion-iso-8859-1-utf-8-php/

Il y a un truc à corriger à cette page :
SUR LE MANQUE D’INTÉRÊT DES JEUNES POUR LE DRAME LYRIQUE - [Groupe Études Jean-Richard Bloch]

INTÊRÊT > INTÉRÊT

Merci pour cette lecture attentive ! Oui, les caractères composés
en bas de casse, on ne peut pas les rater, et là les majuscules
sont plus rares.

Bonne journée !

--
Laurent Bloch - https://www.laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)