htaccess et problèmes d'indexation Google

Bonjour,

Depuis plusieurs mois, j’ai de gros problèmes d’indexation sur Google et la Search Consol me retourne des erreurs serveurs (5xx), ainsi que le message suivant lorsque je demande une indexation : « Lors du test en direct, des problèmes d’indexation ont été détectés au niveau de l’URL »

Aussi, sur 12 sites qui tournent, tous à jour, et sans configuration particulière, Google me dit qu’il est impossible de récupérer le sitemap alors que si j’appelle sitemap.xml, il sort sans problème.

Au fil des mois, et des dernières semaines, j’ai de moins en moins de pages listées avec la commande « site: » et beaucoup de mes pages d’accueil ne sont pas indexées.

Je ne comprends plus rien, certains de ces sites étaient très bien positionnés il y a encore 2 ans… Je m’arrache les cheveux sans comprendre ce que je fais mal ?!!

Je commence à me demander si les 2 lignes que j’ai ajoutées il y a longtemps, et qui ne posaient pas de problème pour rediriger le http sur le https, ne seraient pas devenues obsolètes…
RewriteCond %{HTTPS} !=on
RewriteRule ^ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

Et aussi, si je ne devrais pas avoir des lignes concernant le domaine et sa version en www ? (Ce qui n’est actuellement pas le cas).

Comme je ne comprends pas grand chose à ces questions htaccess, sauf pour rediriger une page qui n’existe plus, je vous demande de l’aide pour savoir d’une part, si d’autres ont les mêmes problèmes que moi ces derniers temps, et d’autre part, si mes lignes sont correctes ou si elles sont devenues contre-productives aujourd’hui.

D’avance merci pour vos éclairages.
Bonne soirée

Bonjour,

Une piste déjà évoquée :

Bonjour Graphie et merci pour ta réponse rapide !
Pas trop compris pour l’espace sur le sitemap qui provoquerait une erreur, je n’en vois pas…

De ce que je comprends, il suffirait que je créeé le fichier ecran_securite_options.php avec simplement cette ligne pour écraser la config initiale ?

<?php define('_ECRAN_SECURITE_LOAD', 0); … Et ce, sans écrire : ?>

pour fermer le code, comme sur le fichier inital ecran_securite.php qui ne ferme pas non plus ?

Et pas de risque avec cette config à zéro ?
En revanche, ça n’est pas ça qui va régler « impossible de lire le sitemap », si ?

– Second point :

Comme Google référence de façon aléatoire mes pages www ou sans www, en privilégiant l’une ou l’autre à son bon vouloir, faudrait-il quelque chose dans le htaccess qui le force à prendre systématiquement l’une ou l’autre version pour éviter les doublons qu’il n’aime pas ?

Merci pour vos éclairages ! C’est tellement désespérant de voir mes sites qui étaient pas mal placés, être déclassés ou totalement désindexés depuis quelques mises à jours de spip, je n’arrive pas à comprendre ce qu’il se passe !

PS : par rapport à l’article consulté, je n’ai qu’un site qui utilise le couteau suisse et le même problème sur quasi tous mes sites, de façon aléatoire au niveau des pages acceptées ou refusées.

1- [Résolu] Ecran de sécurité, Bing et autres GoogleBots... - #4 par Philbzh
2- un possibilité pour avoir uniquement le sous-domaine www : dans le .htaccess :

rewritecond %{http_host} ^mon-site.fr [nc]
rewriterule ^(.*)$ https://www.mon-site.fr/$1 [r=301,nc]

Pour le 2 j’utilise plutôt ces règles Apache redirect www to non-www and HTTP to HTTPS — Simone Carletti :slight_smile:

Ok super ! Merci infiniment ! :pray:

Donc je laisse mes 2 lignes en vigueur pour le https :

RewriteCond %{HTTPS} !=on
RewriteRule ^ https://%{HTTP_HOST}%{REQUEST_URI} [L,R=301]

J’ajoute sans conflit pour le www :

rewritecond %{http_host} ^mon-site.fr [nc]
rewriterule ^(.*)$ https://www.mon-site.fr/$1 [r=301,nc]

Et hop ? :smiley:

Plus le réglage dans ecran_securite_options.php et je croise les doigts :laughing:
Je fais tout ça sur l’ensemble de mes sites et je reviendrai par ici faire un retour sur le résultat !
Très bonne journée :slightly_smiling_face:

Et utiliser la une meta url canonical pour indiquer que la « vraie » adresse est celle avec www, par exemple <link rel="canonical" href="https://www.example.com/..." />

cf Spécifier une URL canonique avec rel="canonical" et d'autres méthodes | Google Search Central  |  Documentation  |  Google for Developers

Merci Jean-Luc pour cette précision !

Je pensais que la ligne par défaut dans les squelettes suffisait ? Tu parles bien de placer ça dans le head du squelette concerné ? Ce que je laisse bien sûr dans mes squelettes personnalisés :
[<link rel="canonical" href="(#URL_ARTICLE|url_absolue)" />]
et pour les rubriques :
[<link rel="canonical" href="(#URL_RUBRIQUE|url_absolue)" />]

Donc à partir du moment ou l’adresse du site est définie en www dans la config générale, ça devrait être ok, c’est bien ce que me ressort le code source en tout cas, et malgré cette définition déjà présente, il semble que Google s’en foute car il chosit souvent d’indexer certaines de mes pages sans le www et je ne comprends pas pourquoi :disappointed: