moteur de recherche pdf

bonjour

Je suis à la recherche d’un moteur de recherche qui peut lire le contenu des pdf présents dans un site.

il existe une fonction avec l’utilisation ponctuelle de Google qui fait ce travail

ci dessous le script que j’ai trouvé, qu’en pensez vous?

Est ce possible d’intégrer cela sur une page EscaL?

<form method=get action="http://www.google.com/search">
  <h3 align="center"><span class="Style2">Rechercher sur le site :</span><br />
    <input type=hidden name=ie value=windows-1252 />
    <input type="text" size="20" name="q" VALUE="" />
    <input type=hidden name=sitesearch value="votresite.net" />
    <input type=hidden name=hl value=fr />
    <input type="submit" name="mmt" VALUE="OK" />

Pierre
Strasbourg

Bonjour,

Si tous les « documents » d’un site web (sous spip ou autre) sont correctement conçus et renseignés (image, pdf, texte, vidéo, …), ils seront faciles à « référencer » … et dans ce cas il offriront chacun un « titre », un « descriptif », H1, H2, … sous-titres, titre de paragraphes, alt+, etc …" Quand ce minimum est réalisé, n’importe quel moteur de recherche peut les trouver facilement.

Que cela soit QWANT, GG, BING, etc … l’obligation est donc de « renseigner » chaque document PDF

Normalement le système intégré de recherche dans escal fonctionne parfaitement pour les trouver ensuite.

@+

Bonjour

Je ne comprend pas bien la question

Je suis à la recherche d’un moteur de recherche qui peut lire le contenu des pdf présents dans un site.

un moteur de recherche ne lie pas mais recherche

toutefois comme dit par jaseur le moteur de recherche intégré sera trouvé un fichier pdf sur le site sans probléme

si c’est pour le lire dans un article , il faut integrer ton pdf avec le plugin pdf.js

pas bien compris la question, mais

firefox préférences applications PDF Utiliser le visionneur de document par défaut

Le 04/03/2019 à 13:14, escalamilcar@free.fr a écrit :

Bonjour

Je ne comprend pas bien la question

Je suis à la recherche d'un moteur de recherche qui peut lire le contenu des pdf présents dans un site.

un moteur de recherche ne lie pas mais recherche

toutefois comme dit par jaseur le moteur de recherche intégré sera trouvé un fichier pdf sur le site sans probléme

si c'est pour le lire dans un article , il faut integrer ton pdf avec le plugin pdf.js

Le 04/03/2019 à 12:03, Pierre S. a écrit :

bonjour

Je suis à la recherche d'un moteur de recherche qui peut lire le contenu des pdf présents dans un site.

il existe une fonction avec l'utilisation ponctuelle de Google qui fait ce travail

ci dessous le script que j'ai trouvé, qu'en pensez vous?

Est ce possible d'intégrer cela sur une page EscaL?

<form method=get action="http://www.google.com/search&quot;&gt;&lt;h3 align="center"><span class="Style2">Rechercher sur le site :</span><br /><input type=hidden name=ie value=windows-1252 /><input type="text" size="20" name="q" VALUE="" /><input type=hidden name=sitesearch value="votresite.net" /><input type=hidden name=hl value=fr /><input type="submit" name="mmt" VALUE="OK" /> Pierre Strasbourg

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal

--

amicalement (^ö^)
secretaire@debian-facile.org
------------------------------------
site: https://chezlagrenouille.fr
chatons:https://www.le-pic.org/

Merci pour vos réponses mais :

j'ai un site avec pdf.js , les pdf s'ouvrent en même temps que la page, mais le moteur de recherche ne lis pourtant pas le contenu de ces pdf.

Donc ma question reste la même,

Si je mets ce script (en html) dans une fenêtre latérale (article 1) est ce que cela met en péril le site?

Ce script ouvre automatiquement une page web avec les réponses google

Pierre

Strasbourg

As-tu plusieurs liens en exemples vers des PDF différents ?

Le 04/03/2019 à 14:00, Pierre S. a écrit :

Merci pour vos réponses mais :

j'ai un site avec pdf.js , les pdf s'ouvrent en même temps que la page, mais le moteur de recherche ne lis pourtant pas le contenu de ces pdf.

Donc ma question reste la même,

Si je mets ce script (en html) dans une fenêtre latérale (article 1) est ce que cela met en péril le site?

Ce script ouvre automatiquement une page web avec les réponses google

Pierre

Strasbourg

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal

As-tu testé ce plugin

Recherche avancée sous SPIP ?

https://contrib.spip.net/Recherche-avancee-sous-SPIP

non, je n'ai pas testé Compatibilité SPIP 1.9.2 <https://contrib.spip.net/SPIP-1-9-2&gt;
Pierre
Strasbourg

Le 04/03/2019 à 14:08, JASEUR BOREAL a écrit :

As-tu testé ce plugin

  Recherche avancée sous SPIP ?

Recherche avancée sous SPIP - SPIP-Contrib

Le 04/03/2019 à 14:00, Pierre S. a écrit :

Merci pour vos réponses mais :

j'ai un site avec pdf.js , les pdf s'ouvrent en même temps que la page, mais le moteur de recherche ne lis pourtant pas le contenu de ces pdf.

Donc ma question reste la même,

Si je mets ce script (en html) dans une fenêtre latérale (article 1) est ce que cela met en péril le site?

Ce script ouvre automatiquement une page web avec les réponses google

Pierre

Strasbourg

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal

Il y a aussi :

(suite) Suffit pas qu’un fichier PDF existe pour qu’il soit trouvé !

Je pense qu’avant d’ajouter un moteur de recherche ou un script dans un site spip, il est plus efficace et utile d’améliorer le minimum du travail de référencement de chaque document PDF, et de chaque page le contenant !

Liste de quelques points à respecter https://www.codeur.com/blog/seo-pdf/ pour favoriser l’indexation et le bon positionnement de fichiers PDF en ligne et ainsi favoriser leurs trouvailles par n’importe quel système de moteur de recherche.

Optimiser le référencement naturel de fichiers PDF : https://www.bevisible.fr/wp-content/cache/wp-rocket/www.bevisible.fr/optimisation-referencement-naturel-fichiers-pdf/index.html_gzip- Optimiser le nom du fichier PDF

  • Optimisation SEO du texte du document PDF : contenu et structure.
  • Utilisation des métadonnées du document PDF pour le référencement naturel (correspondent aux propriétés du documents et sont éditables avec le logiciel de création du PDF).
  • Optimisation de la taille du document
  • Pensez à la balise alt. L’utilisation de la balise alt (ou « texte alternatif ») fait partie du b-a ba du référencement des images. L****e texte alternatif peut aussi être renseigné pour les images contenus dans un PDF, apportant un coup de pouce SEO au document. La plupart des outils permettent de créer des PDF donnant la possibilité d’éditer la balise alt d’une image.
  • Optimisation des hyperliens qui pointent vers le document PDF.

acefglonfdobjlok.png

Pas si simple en fait : pour que fulltext puisse indexer les pdf, il faut un extracteur au niveau du serveur, comme pdftotexte.
Mais s'il n'y en a pas, je ne sais pas comment l'ajouter.

JC

Le 04/03/2019 à 15:31, JASEUR BOREAL a écrit :

Le 04/03/2019 à 15:06, JASEUR BOREAL a écrit :

Il y a aussi : Fulltext - SPIP-Contrib

    Indexation du contenu textuel des documents avec "FULLTEXT"

Ce plugin propose en outre l’indexation (optionnelle) du contenu textuel des documents joints aux articles et/ou rubriques.

Il stocke pour cela dans la table |spip_documents| une version texte du document, obtenue à l’aide d’un «extracteur». Cet extracteur peut être un exécutable système lancé depuis le plugin, ou du code purement PHP.

Les formats supportés à partir de la version 0.6.2 du plugin sont :

  * *Le PDF, à condition que le fichier ne soit pas protégé contre la
    copie*
  * Le DOC, PPT, et XLS
  * Le DOCX, PPTX et XLSX (nécessite PHP 5.2 au minimum, ainsi que
    l’option -enable-zip)
  * Le ODT (nécessite PHP 5.2 au minimum, ainsi que l’option -enable-zip)

Le 04/03/2019 à 14:48, Pierre S. a écrit :

non, je n'ai pas testé Compatibilité SPIP 1.9.2 <https://contrib.spip.net/SPIP-1-9-2&gt;
Pierre
Strasbourg

Le 04/03/2019 à 14:08, JASEUR BOREAL a écrit :

As-tu testé ce plugin

  Recherche avancée sous SPIP ?

Recherche avancée sous SPIP - SPIP-Contrib

Le 04/03/2019 à 14:00, Pierre S. a écrit :

Merci pour vos réponses mais :

j'ai un site avec pdf.js , les pdf s'ouvrent en même temps que la page, mais le moteur de recherche ne lis pourtant pas le contenu de ces pdf.

Donc ma question reste la même,

Si je mets ce script (en html) dans une fenêtre latérale (article 1) est ce que cela met en péril le site?

Ce script ouvre automatiquement une page web avec les réponses google

Pierre

Strasbourg

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal

_______________________________________________
Spip-avec-escal@rezo.net -https://listes.rezo.net/mailman/listinfo/spip-avec-escal

_______________________________________________
Spip-avec-escal@rezo.net -https://listes.rezo.net/mailman/listinfo/spip-avec-escal

_______________________________________________
Spip-avec-escal@rezo.net -https://listes.rezo.net/mailman/listinfo/spip-avec-escal

_______________________________________________
Spip-avec-escal@rezo.net - https://listes.rezo.net/mailman/listinfo/spip-avec-escal