[spip-dev] indexation de pièces jointes

Le plug pour le SWF et le PPT sont maintenant fonctionnel, et il semble possible d'indexer du PDF sans lib externe.
Ce travail, c'est bon pour une contrib, ou c'est pour Spip core? Le PDF/RTF/SXW en standard, c'est suffisant pour diffuser?

M.

Mathieu Lecarme wrote:

Le plug pour le SWF et le PPT sont maintenant fonctionnel, et il
semble possible d'indexer du PDF sans lib externe.
Ce travail, c'est bon pour une contrib, ou c'est pour Spip core? Le
PDF/RTF/SXW en standard, c'est suffisant pour diffuser?

Moi, je le vois bien dans SPIP core.
Mais en attendant, tu peux faire une contrib rapide avec dans des <cadre> le
diff et en fichier joints un zip avec l'ensemble des fichiers modifiés.
+ bien sûr le principe général pour rajouter une extension.

@+

Le plug pour le SWF et le PPT sont maintenant fonctionnel, et il semble
possible d'indexer du PDF sans lib externe.

Tu utilises quoi, pour parser le PDF ?

a+

Antoine.

Antoine wrote:

Le plug pour le SWF et le PPT sont maintenant fonctionnel, et il semble
possible d'indexer du PDF sans lib externe.
   
Tu utilises quoi, pour parser le PDF ?

aspirines, preg et gzuncompress.
ya un chti exemple sur phpclasses.org et un truc qui semble plus complet : FPDI free PDF document importer ▷ setasign.com.
Le principe et de décompresser les bouts compressés, puis de balancer les tonnes de merdes qui entoure le texte (typo, positionements ...)
Reste un texte lisible.

M.