Bonjour,
Il y a certains sites que l’on récupère en syndication et qui renvoient une erreur 403 parce qu’ils sont crawlés depuis l’hébergeur et non depuis un navigateur client.
Est-ce qu’il y aurait possibilité d’ajouter dans le plugin Sites un champ « Header » sur chaque syndication à associer à la requête de récupération du flux ?
Merci
Ça n’est pas spécifique à la syndication, mais tu peux jouer avec _INC_DISTANT_USER_AGENT
pour ça.
Bonjour,
Merci, cette info est super.
Malheureusement ça ne suffit pas pour scraper Indeed…
Et les flux RSS sur les sites d’offres d’emploi ont quasiment disparu.