pb avec le moteur de recherche

salut à vous grands manitous

j'ai un léger pb avec le moteur de recherche intégré qui m'est indispensable.
certaines recherches sur des mots très courants ne donnent rien alors que d'autres donnent un résultat parfait.
le site (encore en construction) est là:
http://www.confidentiel.f2s.com

avec "cia" j'ai aucun résultat
avec "reagan", j'ai les bons résultats

je lui ai déjà fait recalculer le cache.

une idée?
@+

Re,

Je crois qu'il avait été expliqué par Arno qu'il fallait plus de 3 lettres pour "activer" le moteur de recherche. Au dela de trois lettres en tout cas, le moteur me semble très pertinent et rapide.

A suivre

J.Chatignoux@inforoutes.net
*******************
betton mathieu wrote:

salut à vous grands manitous

j'ai un léger pb avec le moteur de recherche intégré qui m'est indispensable.
certaines recherches sur des mots très courants ne donnent rien alors que d'autres donnent un résultat parfait.
le site (encore en construction) est là:
http://www.confidentiel.f2s.com

avec "cia" j'ai aucun résultat
avec "reagan", j'ai les bons résultats

je lui ai déjà fait recalculer le cache.

une idée?
@+

At 8:38 +0100 5/11/01, Chatignoux wrote:

Re,

Je crois qu'il avait été expliqué par Arno qu'il fallait plus de 3 lettres pour "activer" le moteur de recherche. Au dela de trois lettres en tout cas, le moteur me semble très pertinent et rapide.

salut à vous grands manitous

j'ai un léger pb avec le moteur de recherche intégré qui m'est indispensable.
certaines recherches sur des mots très courants ne donnent rien alors que d'autres donnent un résultat parfait.
le site (encore en construction) est là:
http://www.confidentiel.f2s.com

avec "cia" j'ai aucun résultat
avec "reagan", j'ai les bons résultats

C'est la principale limitation du moteur: les mots de 3 lettres et moins ne sont pas indexés, donc il n'est pas possible de faire de recherche sur ces mots.

La raison est un problème de pertinence et de pollution par les mots "courants" très courts. En effet, les mots les plus utilisés sont par exemple "par", "le", "la, "les", "aux", "de", "des"... Ces mots, très très fréquents dans les textes, prendraient ainsi un "poids" énorme dans l'indexation et pollueraient les recherches.

Par exemple, une recherche sur "la valse des pantins", si vous n'avez aucun texte avec les mots "valse" et "pantin", ne doit pas donner de réponse à votre recheche. Mais la présence des mots "la" et "des", très fréquents dans tous les textes, fait qu'une tripotée de textes, n'ayant rigoureusement rien à voir avec "valse" et "pantins", seront donnés en réponse. Dans la même logique, un article titré "la charge des éléphants", qui contient les mots "la" et "des" passerait avant un article titré "les pantins", qui lui semble plus pertinent, mais ne contient que le mot "pantin". Donc ne référençant pas les mots de 3 lettres et moins est le compromis qui nous permet d'avoir un moteur pertinent sans trop de complications (par complications, il faut comprendre qu'il faudrait établir pour chaque langue une liste des mots "à ne pas référencer"...).

Amicalement,
ARNO*

--
Le Scarabée : http://www.scarabee.com
uZine 2 : http://www.uzine.net

DH/DSS, 0x11930F0B, DEEB 602D B344 644B AF88 BF73 85F4 2297 1193 0F0B