[SPIP Zone] r58139 - in _plugins_/coordonnees/trunk

rastapopoulos · Février 8, 2012, 10:33

Le 08/02/2012 11:06, guillaume@outofspace.fr a écrit :

- Remplacement des accents présent dans le fichier de traduction francais par leur equivalent HTML

Les fichiers de lang sont tous en UTF-8 désormais. Il ne faut donc plus utiliser les entités.

--
RastaPopoulos

gilcot · Février 9, 2012, 12:33

- Remplacement des accents présent dans le fichier de traduction francais
par leur equivalent HTML

Les fichiers de lang sont tous en UTF-8 désormais. Il ne faut donc plus
utiliser les entités.

J'en prends bonne note... Il faut donc impérativement travailler avec
un éditeur qui supporte l'Unicode en UTF-8 et une police qui convient

Pas de souci pour les sites qui ne sont pas en utf-8 ?

Christian_Marget · Février 9, 2012, 8:50

Bonjour,

Le 09/02/2012 01:33, Gildas Cotomale a écrit :

- Remplacement des accents présent dans le fichier de traduction francais
par leur equivalent HTML

Les fichiers de lang sont tous en UTF-8 désormais. Il ne faut donc plus
utiliser les entités.

Le "Il ne faut plus" me paraît excessif. "Il n'est plus nécessaire" me paraîtrait mieux convenir. Je travaille peu en entités HTML, ça va plus vite de frapper les accents directement mais j'ai parfois eu des mauvaises surprises. À une époque pas si lointaine, on disait "l'ISO-8859-1 étant la norme en HTML, pas besoin d'utiliser les entités"... Les entités sont une valeur sûre, quoique lourde.

J'en prends bonne note... Il faut donc impérativement travailler avec
un éditeur qui supporte l'Unicode en UTF-8 et une police qui convient

Pas de souci pour les sites qui ne sont pas en utf-8 ?

Effectivement, l'UTF-8 se veut universel mais son champ d'application ne l'est pas encore.

CM

rastapopoulos · Février 9, 2012, 9:07

Le 09/02/2012 09:50, Christian Marget a écrit :

Le "Il ne faut plus" me paraît excessif. "Il n'est plus nécessaire" me
paraîtrait mieux convenir. Je travaille peu en entités HTML, ça va plus
vite de frapper les accents directement mais j'ai parfois eu des
mauvaises surprises. À une époque pas si lointaine, on disait
"l'ISO-8859-1 étant la norme en HTML, pas besoin d'utiliser les
entités"... Les entités sont une valeur sûre, quoique lourde.

Non non : "il ne faut plus" !

Tous les plugins gérés par Salvatore (et normalement tout plugin stable est censé l'être) sont forcément en UTF-8.

Dès que Salvatore trouve une entité, il reconvertit en UTF-8 et il recommit le fichier. Donc dans tous les cas tes entités vont disparaître le lendemain de les avoir mis, en gros...

Et si on retransforme un fichier de lang UTF-8 en entité (comme c'était le cas ici), Salvatore détecte qu'il y a eu des changements (inutiles), les chaînes sont mises en "MODIF" et ça lui fait faire une conversion + un commit pour rien.

Donc : il faut directement mettre de l'UTF.

--
RastaPopoulos

gilcot · Février 9, 2012, 10:44

Le 9 février 2012 10:07, RastaPopoulos a écrit :

Le 09/02/2012 09:50, Christian Marget a écrit :

Le "Il ne faut plus" me paraît excessif. "Il n'est plus nécessaire" me
paraîtrait mieux convenir. Je travaille peu en entités HTML, ça va plus
vite de frapper les accents directement mais j'ai parfois eu des
mauvaises surprises. À une époque pas si lointaine, on disait
"l'ISO-8859-1 étant la norme en HTML, pas besoin d'utiliser les
entités"... Les entités sont une valeur sûre, quoique lourde.

On a effectivement de mauvaises surprises quand
- on utilise un éditeur qui ne connait pas le charset utilisé (ici
UTF-8) et ça peut se voir tout de suite (pour peu qu'il y ait des
caractères mal affichés/substitués sinon on modifie le fichier en
toute innocence et c'est la cata)
- on a l'éditeur qui vous converti silencieusement le charset (c'est
le cas sur certaines plateformes où ISO-.. est transforme en OEM-natif
---genre Mac-... ou CP-... ou IBM-... ou Windows-... etc.-- et c'est
parfois une option de configuration par défaut...) et ça se voit plus
à l'arrivé (la page web s'affiche mal ou les traitements effectué --au
niveau du language de script ou de la base de données-- sont faussés
parce-que le jeu de caractères déclaré ne correspond pas à celui
utilisé)
- on marque silencieusement (ou volontairement) le fichier comme étant
de l'Unicode (BOM --octet non affiché placé tout au début du fichier
et qui indique quel encodage --UTF-8 ou une variante UCS-- ce qui peut
être une bonne chose dans les environnements où plusieurs encodages se
côtoient et donc pour les échanges) et qu'une application utilisant le
fichier n'aime pas (c'est le cas avec PHP quand le résultat renvoyé ne
doit rien contenir et qu'il y a cet octet BOM avant le "<?" supposé
tout au début)

Ceci dit, ISO-8859-1 continue à être la base du web car :
- compatible ASCII comme toutes les normes d'encodage ISO (du moins
celles que je connais) et commun à beaucoup de pays européens (bon, il
manque quelques caractères chaque fois selon la langue mais le
dénominateur commun y est)
- standard adopté par le W3C (les valeurs des entités numériques
--&#dec; &#xhex;-- sont ceux de cet encodage)
- base aussi des encodages normalisés pour l'Unicode (parmi lesquels
l'UTF-8 privilégié par le monde des LL pour son rapport au poids final
des documents du fait de son aspect dynamique --et donc pour beaucoup
de langues européennes on a des fichiers presque de la même taille
qu'avec ISO-... alors qu'on aurait au moins doublé avec l'UCS)

Non non : "il ne faut plus" !

Tous les plugins gérés par Salvatore (et normalement tout plugin stable est
censé l'être) sont forcément en UTF-8.

Dès que Salvatore trouve une entité, il reconvertit en UTF-8 et il recommit
le fichier. Donc dans tous les cas tes entités vont disparaître le lendemain
de les avoir mis, en gros...

D'accord, ça veut dire que le choix a été fait de produire des
fichiers directement en UTF-8 (et donc que SPIP est
entièrement/nativement en Unicode)

Et si on retransforme un fichier de lang UTF-8 en entité (comme c'était le
cas ici), Salvatore détecte qu'il y a eu des changements (inutiles), les
chaînes sont mises en "MODIF" et ça lui fait faire une conversion + un
commit pour rien.

Donc : il faut directement mettre de l'UTF.

Oui mais ça ne change pas la formulation proposée : "il faudrait"...
("il faut" laisse entendre que si je n'ai pas les caractères désirés
accessibles sur mon clavier et qu'il existe des entités nommées pour
eux, que je dois m'abstenir de les utiliser --et donc ça devient une
gymnastique compliquée ou alors on ne fait rien avant d'avoir les
bonnes locales et le bon keymap)