Le site que j'administre https://www.etudes-jean-richard-bloch.org/
en Spip 3.2.1, utf-8 depuis longtemps, sans aucun plugin ni squelette
particulier, donne depuis quelques jours un affichage incorrect des
caractères accentués.
J'ai réinstallé Spip, j'ai sauvegardé la base de données et l'ai
restaurée chez moi sur un Spip vierge : rien n'y fait. Je crois
que c'est dans la base que la corruption a eu lieu. C'est hébergé
chez OVH.
Quelqu'un d'entre vous a-t-il déjà rencontré un problème similaire ?
Le Sun, 30 Sep 2018 14:26:10 +0200,
Jean Marie Grall <jeanmarie.listes@cousumain.info> a écrit :
Si ton site vient de différentes mises à jour depuis un vieux SPIP
3.0, ça peut être un souci d'encodage de la base ou juste de
configuration.
Alors, il y a peut-être à l'origine un problème d'encodage, mais
ce n'est plus cela. Un coup d'œil au site pourrait donner une
piste : https://www.etudes-jean-richard-bloch.org/
Merci de la suggestion !
Cordialement.
--
Laurent Bloch - https://www.laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)
Si ton site vient de différentes mises à jour depuis un vieux SPIP
3.0, ça peut être un souci d'encodage de la base ou juste de
configuration.
Alors, il y a peut-être à l'origine un problème d'encodage, mais
ce n'est plus cela. Un coup d'œil au site pourrait donner une
piste : https://www.etudes-jean-richard-bloch.org/
Regarde dans ta base via phpMyAdmin si si les caractères sont bien encodés.
Si mal encodés > plugin grenier
Si bien encodés > suivre le point 2 de Réparer le charset d'une base SPIP - ZZZ + vérifier que tu as bien utf8 dans ton connect.php
Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?
Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?
Nan mais je dis ça parce que, comme précisé dans mon 1er mail, ça m'est arrivé il y a une 10aine de jour suite à une mise à jour d'apache chez OVH et que cette mise à jour s'est terminée sur l'ensemble des hébergements mutualisés en fin de semaine dernière et que le dit site est justement chez OVH...
Le lundi 01 octobre 2018 Christian Marget a écrit ceci :
Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?
Oui, alors c'est bien cela. Si je fais (sous Linux) :
j'obtiens bien un document UTF-8 correct et qui s'affiche correctement :
$ file copie-article-jeu-caracteres.spip
copie-article-jeu-caracteres.spip: UTF-8 Unicode text
Maintenant j'aimerais bien exécuter cette transformation sur les 130 articles
du site sans les prendre un par un. L'un d'entre vous aurait-il une idée ?
Cordialement.
--
Laurent Bloch - https://laurentbloch.net - lb@laurentbloch.org
Si vous trouvez que l'éducation coûte cher, essayez l'ignorance !
(A. Lincoln)
Le lundi 01 octobre 2018 Christian Marget a écrit ceci :
Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen de retrouver tes textes initiaux, pour vérifier leurs encodages respectifs?
Oui, alors c'est bien cela. Si je fais (sous Linux) :
j'obtiens bien un document UTF-8 correct et qui s'affiche correctement :
$ file copie-article-jeu-caracteres.spip
copie-article-jeu-caracteres.spip: UTF-8 Unicode text
Maintenant j'aimerais bien exécuter cette transformation sur les 130 articles
du site sans les prendre un par un. L'un d'entre vous aurait-il une idée ?
Si c'est un champ de base de données, ça doit être faisable en ouvrant
la table dans un tableur et en faisant un rechercher-remplacer puis en
la réinjectant dans la base de données (c'est comme ça que je ferais,
personnellement). Ça ne coûte pas beaucoup de temps d'essayer sur une
copie en local.
Voir ce tutoriel pour plus d'infos :
Le procédé est le même si l'objet diffère.
--
Ysabeau
Services, s. m. pl. Mot usité dans cette formule à peu près invariable
du typo en quête de travail: Monsieur, je viens vous offrir mes services
pour la casse.
Dictionnaire de l'argot des typographes - Eugène Boutmy, correcteur
d'imprimerie, 1883.
Le Mon, 1 Oct 2018 17:05:13 +0200,
Ysabeau <id@dutailly.net> a écrit :
Le 01/10/2018 à 16:48, Laurent Bloch a écrit :
> Bonjour,
>
> Le lundi 01 octobre 2018 Christian Marget a écrit ceci :
>
>> Ça fait penser à un double encodage. De l'UTF-8 "ré-encodé" en
>> UTF-8. Ça peut arriver quand on transcode de l'ISO-8859-* en
>> UTF-8, s'il y avait déjà de l'UTF-8 mélangé à l'ISO. As-tu moyen
>> de retrouver tes textes initiaux, pour vérifier leurs encodages
>> respectifs?
>
> Oui, alors c'est bien cela. Si je fais (sous Linux) :
>
> $ recode UTF-8..ISO-8859-1 copie-article-jeu-caracteres.spip
>
> j'obtiens bien un document UTF-8 correct et qui s'affiche
> correctement :
>
> $ file copie-article-jeu-caracteres.spip
> copie-article-jeu-caracteres.spip: UTF-8 Unicode text
>
> Maintenant j'aimerais bien exécuter cette transformation sur les
> 130 articles du site sans les prendre un par un. L'un d'entre vous
> aurait-il une idée ?
Si c'est un champ de base de données, ça doit être faisable en ouvrant
la table dans un tableur et en faisant un rechercher-remplacer puis en
la réinjectant dans la base de données (c'est comme ça que je ferais,
personnellement). Ça ne coûte pas beaucoup de temps d'essayer sur une
copie en local.
Ysabeau
Services, s. m. pl. Mot usité dans cette formule à peu près invariable
du typo en quête de travail: Monsieur, je viens vous offrir mes services
pour la casse.
Dictionnaire de l'argot des typographes - Eugène Boutmy, correcteur
d'imprimerie, 1883.
Le Tue, 2 Oct 2018 08:42:31 +0200,
Ysabeau <id@dutailly.net> a écrit :
Le 01/10/2018 à 17:48, Laurent Bloch a écrit :
> Le Mon, 1 Oct 2018 17:32:18 +0200,
> Laurent Bloch <lb@laurentbloch.org> a écrit :
>
>> Au fait, quelqu'un sait-il à quel caractère correspond ß ? Je
>> soupçonne ß.
>
> La réponse est ici :
>
> https://murviel-info-beziers.com/conversion-iso-8859-1-utf-8-php/