Est-ce que quelque chose m'échappe ?
Seenthis s'en sert-il encore vraiment ?
Y a t il un plugin pour SPIP ou une bonne alternative aujourd'hui pour l'annotation sémantique des textes ?
Merci d'avoir relancé, en effet il semble que OpenCalais ait été remplacé par une autre terminologie : PermID et Refinitiv (et non OpenCalais, que je ne retrouve plus) https://permid.org/
J'avais obtenu une clé API pour OpenCalais en avril 2019 mais les liens du mail ne fonctionnent plus, vérifiés à l'instant à l'occasion de votre message, je crois donc qu'il y a eu un changement de nom. (ne sachant comment installer l'API dans Spip, je m'étais arrêtée là à l'époque)
Autant que je m'en souvienne il n'y avait pas de plugin OpenCalais pour Spip et Seenthis est sous une ancienne version (mais robuste) de Spip.
En essayant la démo de la tag machine de refinitiv https://permid.org/onecalaisViewer
je n'ai que de mauvais résultats où seuls apparaissent les noms propres géographiques ou de célébrités ou de grosses entreprises.
Je crois que ce n'est pas adapté au français.
La démo en tout cas.
Wikipedia évoque une autre ressource ciblant mieux la langue française : Wikimeta, qui utilise les ressources de DBpedia en tant que liens documentaires, mais les sites wikimeta et dbpedia sont HS également.
Ces technologies ne semblent pas libérées pour le grand public.
Après ces premières recherches, et pour un site fortement thématique (spécialisé),
je crains que des outils généralistes mal maintenus ne soient pas d'une grande aide
et je me dis qu'il est préférable de faire soi même sa tambouille si jamais ça en vaut la peine.
Ça semble être une reconnaissance de motifs pour les noms propres encore.
Mais je suis plutôt contre le star system car on sait on nous entraîne le système.
C'est le génie des marges, l'expérience des inconnus et les savoir faire pionniers du terrain
qui m'intéressent.
Les tags sont une alternative à la simple recherche.
Ils sont intéressants quand ils sont posés avec de la sémantique
= de manière plus smart que ce que fait une recherche même avec regexp locale.
Pour cela, des réseaux de relations entre termes en précise certains
et les renforcent ou les atténuent,
au moins pour un nombre limité de tags prédéfinis signifiants dans un domaine donné.
Ton readme mène à la page de démo de textrazor qui est opérationnelle pour le français aussi https://www.textrazor.com/demo
Ils utilisent un réseau de renforcement sous la forme de régles prolog https://www.textrazor.com/rules
Ça semble donner des résultats bien utiles pour des textes généralistes
mais moins satisfaisants pour des textes spécialisés.
Ya un forfait gratuit pour moins de 500 de requêtes par jour.
(500 articles par jour, faut les écrire !)
Ça mériterait d'être exploré.
Cherchant à me renseigner sur Open Calais je n'ai trouvé que des urls périphériques,
les liens plus "à la source" trouvés étant morts : http://www.opencalais.com , www.opencalais.com/opencalais-api/ , x.com
mais l'API semble bien en place : https://api.thomsonreuters.com/permid/calais
donc ça existe mais ça semble s'être "refermé".
Est-ce que quelque chose m'échappe ?
Seenthis s'en sert-il encore vraiment ?