vietnamien

Bonjour,

voici le tableau de translittérations complet pour le vietnamien

a: áàảãạ âấầẩẫậ ăắằẳẵặ
A: ÁÀẢÃẠ ÂẤẦẨẪẬ ĂẮẰẲẴẶ
e: éèẻẽẹ êếềểễệ
E: ÉÈẺẼẸ ÊẾỀỂỄỆ
i: íìỉĩị
I: ÍÌỈĨỊ
o: óòỏõọ ôốồổỗộ ơớờởỡợ
O: ÓÒỎÕỌ ÔỐỒỔỖỘ ƠỚỜỞỠỢ
u: úùủũụ ưứừửữự
U: ÚÙỦŨỤ ƯỨỪỬỮỰ
y: ýỳỷỹỵ
Y: ÝỲỶỸỴ
d: ư
D: Ư

Les minuscules et majuscules sont encore séparées. Mais je suppose que ce n'est pas nécessaire pour l'indexation.

Néanmoins le vietnamien filtrés sans les accents, l'indexation risque de n'être pas assez discriminante.
En effet, les mots vietnamiens prennent des sens complétement différents suivants l'accentuation.

L'exemple classique qu'on apprends à l'école est :
  ma : fantôme
  ma` : pourtant
  ma' : joue
  ma? : tombe
  ma~ : cheval
  ma. : jeune pousse de riz

Je pense donc que malgré que cela facilite la saisie, filtrer les accents risque d'introduire une joyeuse confusion.

Pierre

Salut,

en activant le 'debug' et en indexant la page www.vps.org, on obtient les
translittérations suivantes pour le vietnamien. Je ne suis pas sûr que ça
soit complet, et il faudrait nettoyer avant de mettre ça en standard dans
SPIP. Mais c'est assez facile à obtenir, n'hésitez pas (surtout Pierre).

7841=>'a',7897=>'o',117=>'u',7913=>'u',7875=>'e',7919=>'u',417=>'o',432=>'u',7899=>'o',
7855=>'a',7907=>'o',7885=>'o',7911=>'u',7873=>'e',7879=>'e',7893=>'o',7889=>'o',259=>'a',
7921=>'u',7871=>'e',7847=>'a',7915=>'u',7887=>'o',7853=>'a',7845=>'a',7883=>'i',7909=>'u',
7903=>'o',253=>'y',361=>'u',7881=>'i',7863=>'a',7923=>'y',7869=>'e',7877=>'e',7917=>'u',
7843=>'a',7891=>'o',7929=>'y',7901=>'o',7867=>'e',297=>'i',7895=>'o',7842=>'A',431=>'U',
7878=>'E',7849=>'a',7902=>'O',258=>'A',7888=>'O',560=>'O',7851=>'a',7859=>'a'

-- Fil

_______________________________________________
spip-trad@rezo.net - http://listes.rezo.net/mailman/listinfo/spip-trad

voici le tableau de translittérations complet pour le vietnamien

a: áàảãạ âấầẩẫậ ăắằẳẵặ
A: ÁÀẢÃẠ ÂẤẦẨẪẬ ĂẮẰẲẴẶ
e: éèẻẽẹ êếềểễệ
E: ÉÈẺẼẸ ÊẾỀỂỄỆ
i: íìỉĩị
I: ÍÌỈĨỊ
o: óòỏõọ ôốồổỗộ ơớờởỡợ
O: ÓÒỎÕỌ ÔỐỒỔỖỘ ƠỚỜỞỠỢ
u: úùủũụ ưứừửữự
U: ÚÙỦŨỤ ƯỨỪỬỮỰ
y: ýỳỷỹỵ
Y: ÝỲỶỸỴ
d: ư
D: Ư

Les minuscules et majuscules sont encore séparées. Mais je suppose que ce n'est pas nécessaire pour l'indexation.

Je préfère conserver une translittération la plus complète possible, quitte
à passer ensuite un filtre avant d'indexer. Du coup on peut imaginer
translittérer de la façon suivante :
    225=>'a`', 226=>'a?', etc.

Néanmoins le vietnamien filtrés sans les accents, l'indexation risque de n'être pas assez discriminante.
En effet, les mots vietnamiens prennent des sens complétement différents suivants l'accentuation.

L'exemple classique qu'on apprends à l'école est :
  ma : fantôme
  ma` : pourtant
  ma' : joue
  ma? : tombe
  ma~ : cheval
  ma. : jeune pousse de riz

Là, effectivement, le modèle d'indexation de SPIP ne conviendra pas... à
moins de faire une translittération d'une autre forme :
    225=>'ax', 226=>'ay', etc.

Si tu connais une notation qui se rapproche de ça, on peut l'intégrer.

-- Fil