[spip-dev] [PATCH] Typo : incise et suspension

Salut,

en typo française, comme en typo anglaise, les tirets d'incise sont des
tirets demi cadratins; le tiret de base étant un quart de cadratin.
De même les points de suspension (3 petits points) ont une approche plus
réduite que 3 points alignés. C'est (en typo en plomb) un caractère à
part entière, si je ne m'abuse.

Je propse ce patch, validé avec netscape 4.X, a placer où on veut, et
modifable pour être plus mieux. Personellement, je l'ai mis dans la
routine de correction de la typo française, mais il faut alors également
le mettre pour d'autres langages.

        // unifier sur la representation unicode
        $letexte = ereg_replace(" ","~",$letexte);
        $letexte = ereg_replace("»","»",$letexte);
        $letexte = ereg_replace("«","«",$letexte);
        $letexte = ereg_replace("°","°",$letexte);

        $cherche1 = array(
                /* 1 */ '/ --? *([\(;:\?])/',
                                '/ --? *([,.!\)])/',
                                '/ --? /',
                /* 2 */
'/((^|[^\#0-9a-zA-Z\&])[\#0-9a-zA-Z]*)\;/',
                /* 3 */ '/»|[!?]| -,|:([^0-9]|$)/',
                /* 4 */ '/«|(M(M?\.|mes?|r\.?)|[MnN]&#176:wink: /',
                /* 5 */ '/ *\.\.\.+ /'
        );
        $remplace1 = array(
                /* 1 */ '~–~\1',
                                '~–\1',
                                ' –~',
                /* 2 */ '\1~;',
                /* 3 */ '~\0',
                /* 4 */ '\0~',
                /* 5 */ '… '
        );

Pourquoi '--?' ? Eh bien il y a quelques mois, j'avais proposé le même
genre de "raccourci" pour avoir un tiret d'incise à partir de "--" ce
qui est généralement fait. Je veut dire que les auteurs sur le NET
écrivent deux tirets Œ de cadratin pour un tiret œ cadratin. En espérant
que le fureteur fasse un rendu correct.

Je propse ce patch, validé avec netscape 4.X, a placer où on veut, et
modifable pour être plus mieux. Personellement, je l'ai mis dans la
routine de correction de la typo française, mais il faut alors également
le mettre pour d'autres langages.

Je ne suis pas d'accord pour un patch qui introduit de l'unicode si le site
n'est pas lui-même en unicode. Mais si le site est en utf-8, pourquoi pas...

-- Fil

Bonjour,

Gaetan Ryckeboer a écrit le mercredi 4 juin 2003 19:29 :

en typo française, comme en typo anglaise, les tirets d'incise sont des
tirets demi cadratins; le tiret de base étant un quart de cadratin.

Ah bon... Il existe plusieurs usages : tirets d'incise sont des tirets
cadratins ou demi-cadratins. Quant au tiret de base, je ne sais pas ce
que c'est (trait d'union ?).

De même les points de suspension (3 petits points) ont une approche plus
réduite que 3 points alignés. C'est (en typo en plomb) un caractère à
part entière, si je ne m'abuse.

Non, en anglais uniquement.

Mais laissons la typo (hors charte sûrement pour revenir au patch) :

Je propse ce patch, validé avec netscape 4.X, a placer où on veut, et
modifable pour être plus mieux. Personellement, je l'ai mis dans la
routine de correction de la typo française, mais il faut alors également
le mettre pour d'autres langages.

        // unifier sur la representation unicode
        $letexte = ereg_replace(" ","~",$letexte);
        $letexte = ereg_replace("»","»",$letexte);
        $letexte = ereg_replace("«","«",$letexte);
        $letexte = ereg_replace("°","°",$letexte);

C'est codes sont des codes Windows-1252 (si ma mémoire est bonne). Ils
ne sont ni valables en ISO-Latin 1, ni en Unicode...

Pourquoi '--?' ? Eh bien il y a quelques mois, j'avais proposé le même
genre de "raccourci" pour avoir un tiret d'incise à partir de "--" ce
qui est généralement fait. Je veut dire que les auteurs sur le NET
écrivent deux tirets de cadratin pour un tiret cadratin. En espérant
que le fureteur fasse un rendu correct.

Je pense que le mieux est de mettre ce genre de fonctions dans
mes_fonctions.php3 et de passer un filtre dans les squelettes. Ça peut
paraître lourd mais ça permet, une fois pour toute, de pouvoir modifier
très facilement le contenu des champs. Défaut, quand même : le filtre
ne passe pas dans l'espace privé.

À bientôt,

Gilles.

Bonjour,

Gaetan Ryckeboer a écrit le mercredi 4 juin 2003 19:29 :
> en typo française, comme en typo anglaise, les tirets d'incise sont des
> tirets demi cadratins; le tiret de base étant un quart de cadratin.
Ah bon... Il existe plusieurs usages : tirets d'incise sont des tirets
cadratins ou demi-cadratins. Quant au tiret de base, je ne sais pas ce
que c'est (trait d'union ?).

trait d'union: quart de cadratin.

> De même les points de suspension (3 petits points) ont une approche plus
> réduite que 3 points alignés. C'est (en typo en plomb) un caractère à
> part entière, si je ne m'abuse.
Non, en anglais uniquement.

Hmmm... il me semble pourtant en avoir vu une référence sur le bouquin
de

Mais laissons la typo (hors charte sûrement pour revenir au patch) :

> Je propse ce patch, validé avec netscape 4.X, a placer où on veut, et
> modifable pour être plus mieux. Personellement, je l'ai mis dans la
> routine de correction de la typo française, mais il faut alors également
> le mettre pour d'autres langages.
> // unifier sur la representation unicode
> $letexte = ereg_replace(" ","~",$letexte);
> $letexte = ereg_replace("»","»",$letexte);
> $letexte = ereg_replace("«","«",$letexte);
> $letexte = ereg_replace("°","°",$letexte);
C'est codes sont des codes Windows-1252 (si ma mémoire est bonne). Ils
ne sont ni valables en ISO-Latin 1, ni en Unicode...

Ce ne sont pas MES codes, mais ces lignes existent déjà.. D'ailleurs, il
s'agit de remplacer les codes windows générés par la foultitude de
wysiwyg HTML pseudo conformes par des codes corrects. Les codes winwin
apparaîssent des les champs _a remplacer_ , pas dans les champs de
remplacement...

très facilement le contenu des champs. Défaut, quand même : le filtre
ne passe pas dans l'espace privé.

Ben oui, c'est le problème...

Fil demandait de ne pas insérer d'unicode si le site n'était pas en
UTF-8. Et bien les Netscape* le gèrent corectement, en estimant que le
nom "humain" ne passe pas, le code UTF passe bien même sur un site en
ISO-8859-15 comme clx...