Coucou,
j'ai activé sur spip.net le moteur de recherche "fulltext" (plugin
_stable_/fulltext/), ce qui devrait permettre de le tester dans toutes
les langues. Yay!
-- Fil
Coucou,
j'ai activé sur spip.net le moteur de recherche "fulltext" (plugin
_stable_/fulltext/), ce qui devrait permettre de le tester dans toutes
les langues. Yay!
-- Fil
Fil wrote:
j'ai activé sur spip.net le moteur de recherche "fulltext" (plugin
_stable_/fulltext/)
Cela a fait disparaître le bug sur la recherche du mot « critères » que j'avais mentionné ici :
http://thread.gmane.org/gmane.comp.web.spip.devel/51999
En fait la recherche de « critères » donne maintenant un premier résultat avec une pertinence de 116% (!?)
Je suis surpris que chercher « critère » rend le même article avec une pertinence de seulement 3%, même si le mot revient plusieurs fois dans le texte.
Quand les rencontres de Pâques et de la semaine prochaine diminuent un peu ici, je veux bien l'essayer sur taize.fr Y a-t-il de chances que cela marche pour le chinois, coréen, ...?
Paolo
En fait la recherche de « critères » donne maintenant un premier résultat
avec une pertinence de 116% (!?)Je suis surpris que chercher « critère » rend le même article avec une
pertinence de seulement 3%, même si le mot revient plusieurs fois dans le
texte.
Je crois que ça fait bien longtemps que ces scores ne sont plus des
"pourcentages", mais juste des sommes de "points".
Quand les rencontres de Pâques et de la semaine prochaine diminuent un peu
ici, je veux bien l'essayer sur taize.fr Y a-t-il de chances que cela
marche pour le chinois, coréen, ...?
oui
-- Fil
J'avais écrit :
Y a-t-il de chances que cela
marche pour le chinois, coréen, ...?oui
-- Fil
Mes premiers tests montrent que :
cela marche pour le coréen (qui possède des espaces entre les mots).
Problème : beaucoup de mots ont moins de 4 sigles. Et comme la longueur minime recherchée est une configuration du serveur entier cela fait hésiter de le mettre à "3".
Pour le japonais et le chinois (langues qui n'ont pas d'espace entre les mots) cela est problematique. Si tu recherches le texte en entier d'une phrase ou d'un titre, alors tu trouves l'article. Mais c'est assez peu probable que tu arrives à chercher de cette façon !
Comme on dit ici :
http://dev.mysql.com/doc/refman/5.0/en/fulltext-restrictions.html
"Ideographic languages such as Chinese and Japanese do not have word delimiters. Therefore, the FULLTEXT parser cannot determine where words begin and end in these and other such languages."
Et en fait l'usage de fulltext pour du chinois et du japonais semble vraiment trop compliqué :
http://blogs.sun.com/soapbox/entry/fulltext_and_asian_languages_with
Paolo