>Si tu connais une notation qui se rapproche de ça, on peut l'intégrer.
Je peux te proposer, pour le vietnamien, un standard de translitération existant: le Vietnet
a: 225=>a' 224=>a` 7843=>a? 227=>a~ 7841=>a. 226=>a^ 7845=>a^' 7847=>a^` 7849=>a^? 7851=>a^~ 7853=>a^. 259=>a( 7855=>a(' 7857=>a(` 7859=>a(? 7861=>a(~ 7863=>a(.
....
c'est basé sur les cinq accents de base ' ` ? ~ et .
plus trois accents supplémentaire ^ + et (
Le problème c'est que l'indexation se fait en ne conservant que les
caractères alphanumériques de la translittération : a-z et 0-9. On peut
éventuellement décider de numéroter les accents 0, 1, 2, etc.,
Ok, cela ne me semble pas une grosse contrainte de numéroter, lors de l'indexation, les accents en
' : 1
` : 2
? : 3
~ : 4
. : 5
^ : 6
+ : 7
( : 8
- : 9 (j'avais oublié aussi le - du 'd')
La correspondance est immédiate et cette notation existe plus ou moins déjà.
le moteur marchera, mais pour chercher ma'ta' il faudra alors soit le taper en unicode
(ça, quelle que soit la solution retenue, ça fonctionne), soit connaitre le
systeme de translittération et taper en latin ma1ta1. Qu'en penses-tu ?
Cela me semble, en effet, un bon compris
Le webmaster qui chipotera n'aura qu'à créer un filtre de conversion accent => numéro.
Ok, cela ne me semble pas une grosse contrainte de numéroter, lors de l'indexation, les accents en
' : 1
` : 2
? : 3
~ : 4
. : 5
^ : 6
+ : 7
( : 8
- : 9 (j'avais oublié aussi le - du 'd')
La correspondance est immédiate et cette notation existe plus ou moins déjà.
On y serait presque, mais je pense à une nouvelle difficulté : les accents
simples figurent dans le bas de l'unicode, ce qui signifie que le "à"
vietnamien doit être traité à la même enseigne que le "à" français (c'est le
même caractère)...
Je ne vois pas d'autre solution que d'adopter un mode d'indexation différent
si la langue du site est 'vi'.
On aurait donc :
langue <> 'vi' : pas de translittération particulière des caractères
vietnamiens, on laisse le comportement standard
de SPIP : à => 'a', a? => '.' ou 'a', selon que
le serveur dispose ou pas de l'extension iconv
langue == 'vi' : translittération complexe a? => 'a3'... du coup,
pour la recherche, on peut ajouter un petit filtre
automatique histoire d'accepter comme clés de
recherche aussi bien Ố que Ô, O ou O^.
C'est dommage de devoir faire ça, mais j'ai beau retourner la question dans
tous les sens, je ne vois pas d'issue "universelle".