compter les mots

Pour décoincer j'aurais besoin d'un coup de pouce sur les instructions à
utiliser pour exploiter les tables spip_index_dico (hash, mot) et
spip_index_articles (hash, id_article)
- Quelles lignes d'instructions (COUNT, SELECT,...) permettent de lister les 100
premiers mots les plus écrits dans les articles d'un site ?

select dico, sum(points) as pts from spip_index_dico, spip_index_articles
where spip_index_dico.hash = spip_index_articles.hash GROUP BY
spip_index_dico.hash order by pts DESC LIMIT 0,100;

- Quelles lignes ajouter pour exclure une liste de mots préenregistrés dans un
fichier .php3 ?

select dico, sum(points) as pts from spip_index_dico, spip_index_articles
where spip_index_dico.hash = spip_index_articles.hash
AND NOT(dico IN('dans','pour','plus','avec','sont'))
GROUP BY spip_index_dico.hash
order by pts DESC
LIMIT 0,10;

C'est très lent, mais très intéressant :wink:

-- Fil

http://webgeneraction.levillage.org/motop.php3
A améliorer bien sûr, nombre d'occurences, écarter des mots, élargir aux brèves
etc...
Mais ça donne une idée de ce qu'on pourra faire bientôt pour indiquer au
visiteur tout de suite sur quoi il tombe réellement...

Fichier (de travail) dispo sur demande, projet ouvert à qui veut.

Wonderfull ! Encore merci Fil !

Walk

----- Message d'origine -----
Je repars en chasse pour réaliser un motop:
liste des mots principaux écrits
dans un spip.