Ci-joint ce que j'ai pu pondre jusqu'ici pour gérer la correction
des oe, et ae dans les entités HTML qui vont bien.
Reste à faire la même chose pour d'autres caractères spéciaux.
Le code demande un peu de mise en ordre, mais je pense que tout y est.
Reste à voir si cela répond au mieux au problème; j'en ai l'impression,
mais peux me tromper.
Une remarque, au passage : il me semble impossible d'avoir un
"correcteur" exhaustif (il y aura forcément des retouches à faire
"à la main").
Par exemple, avec "oeconomie" (latin, j'imagine). Si on fait abstraction
de l'accent, le mot macroéconomie (sauf si on l'écrit macro-économie,
mais tout le monde n'est pas forcément d'accord là-dessus) rentre dans
la correction à faire. Vous me direz que c'est un défaut de mon
correcteur qui ne prend en compte que la racine "oeconomie"; mais je
ne suis pas sûr que cet exemple soit isolé, ni le plus explicite.
Solution complémentaire, faire une liste des mots stricts à corriger,
en plus de la liste des racines. Cela permet de traiter la plupart des
mots, sauf des exceptions.
J'attends vos commentaires.
Il y a une fonction de test en fin de page.
romain.
liste.php.gz (3.29 KB)