[spip-dev] Problème de charset sur text/csv

Bonjour,

Avec un SPIP 3.1.3, j’utilise la version embarquée des documents CSV. Et je rencontre un soucis de charset avec un fichier encodé en Windows-1252, les accents et caractères spécifiques ne sont pas interprétés correctement. Le site est pourtant en utf-8.
Même en corrigeant l’appel à inc/charsets, le problème persiste. Cf. https://zone.spip.org/trac/spip-zone/changeset/102684/

Est-ce que quelqu’un d’autre rencontre également ce soucis?

Amicalement,

Hello,

le format CSV est un format plein texte qui n'inclue pas de déclaration de charset.

Du coup il n'y a aucun moyen d'être sûr du charset source d'un fichier CSV, et d'avoir un affichage propre.

Ah tiens, c'est rigolo, j'ai eu un CSV la semaine dernière pareil en charset window-bidule… c'est pour ça que j'ai modifié légèrement la fonction de bonux :stuck_out_tongue:

$importer_csv = charger_fonction('importer_csv', 'inc');
$liste = $importer_csv($csv, true, ';', '"', 10000, 'windows-1252');

L'ennui c'est que c'est pas automatique donc.

MM.

Et avec mb_detect_encoding ?

JLuc