(HS) Spip et Google

Salut,

Je suis en train de travailler sur un site auquel on accède pour le moment
via index_nl.php3 ou index_fr.php3.
J'ai mis un index blanc pour le moment.

Hors, je viens de constater que tout est indexé sur google!!

Comment arrive t'il à trouver mes pages et comment empêcher qu'il indexe le
site tant qu'il n'est pas termniné?

Merci
A+
Denis

Je suis en train de travailler sur un site auquel on accède pour le moment
via index_nl.php3 ou index_fr.php3.
J'ai mis un index blanc pour le moment.
comment empêcher qu'il indexe le
site tant qu'il n'est pas termniné?

Voir : http://www.abondance.com/docs/robots.html

On 22/07, Denis - wrote:

| Comment arrive t'il à trouver mes pages et comment empêcher qu'il indexe le
| site tant qu'il n'est pas termniné?

Regarde dans les logs de ton serveur WWW, tu sauras par quelle page il est
entré la première fois, et de quelle page il venait.

Pour empêcher d'indexer le site, cela dépend. Si ton site est à la racine
d'un domaine (adresse de type http://domaine/), tu peux utiliser un fichier
robots.txt (tu trouveras de la doc chez Google). Sinon, rajoute un champ dans
l'entête de ton fichier, disant:

   <meta name="robots" contents="noindex,nofollow">

(cf. aussi doc sur le site de Google)

  Sam

Denis - wrote:

Salut,

Je suis en train de travailler sur un site auquel on accède pour le moment
via index_nl.php3 ou index_fr.php3.
J'ai mis un index blanc pour le moment.

Hors, je viens de constater que tout est indexé sur google!!

Comment arrive t'il à trouver mes pages et comment empêcher qu'il indexe le
site tant qu'il n'est pas termniné?

Il ne les "trouve" pas, il récupère les liens depuis d'autres pages.
Par exemple, peut-être que tu as donné un lien sur une liste de
diffusion (celle-ci ?) qui est archivée sur le Web, donc indexée
par Google...

Si ton site est en nom de domaine propre, tu peux ajouter dans le
répertoire racine un fichier robots.txt contenant :

User-agent: *
Disallow: /

Ca s'appliquera à tout le nom de domaine. Pense à enlever le fichier
le jour où ton site deviendra public :wink:

Sinon, tu peux aussi ajouter un tag <META> dans l'en-tête de tes
pages HTML. Attention, il faudra le faire dans toutes les pages
(pas seulement le sommaire) :

<meta name="robots" content="no index, no follow">

a+

Antoine.

Merci à tous pour les infos...

Il ne les "trouve" pas, il récupère les liens depuis d'autres pages.
Par exemple, peut-être que tu as donné un lien sur une liste de
diffusion (celle-ci ?) qui est archivée sur le Web, donc indexée
par Google...

Cà doit effectivement de là que vient la faille :slight_smile:

Donc si on a un problème sur son site en test, google le rend public !

Caramba, encore démasqué...

Heureusement, il indexe le site en premier mais le compte rendu des erreurs
vient juste après :slight_smile:

A+
Denis