Fwd: informations personnelles indexées sur Google

Bonjour,

Je vous transfère l’email que j’avais envoyé à l’adresse spip-dev-owner@rezo.net ainsi qu’aux gestionnaires de la liste car je n’avais pas eu de réponse.
Une autre solution, plus simple pour corriger le problème serait de configurer le serveur web pour afficher une page d’erreur HTTP 403 Forbidden.

Merci de faire le nécessaire pour corriger cela.

---------- Forwarded message ---------
From: baptx <baptx.is@gmail.com>
Date: Thu, 29 Apr 2021 at 13:22
Subject: Re: informations personnelles indexées sur Google
To: <spip-dev-owner@rezo.net>
Cc: <suske@brubel.net>, <bruno@eliaz.fr>, <nicod@lerebooteux.fr>, <eric@smellup.net>, <cy.altern@gmail.com>

Bonjour, avez-vous des nouvelles ?

On Wed, 21 Apr 2021 at 19:54, baptx <baptx.is@gmail.com> wrote:

Bonjour,

Un de vos projets réutilisait une application open source que j’avais fait mais je ne souhaitais pas que mon nom apparaisse publiquement donc j’ai demandé à ce que mon nom soit remplacé par un lien vers mon profil en ligne.

J’avais remarqué qu’un commit de votre projet apparaît en page 2 de Google lorsque l’on cherche mon nom : https://git.spip.net/spip-contrib-extensions/jeux/commit/6cab3238b6870639b33567ca887a2029cdc1c541
Pouvez-vous corriger cela ? (par exemple en supprimant le commit de l’historique ou en configurant le fichier robots.txt)

Je suppose qu’il est possible de supprimer un commit de l’historique vu que des mots de passe ou informations personnelles peuvent être divulguées sur Internet par erreur.
Lorsque j’avais créé le dépôt sur GitHub, j’avais justement choisi le nom de branche « main » au lieu de « master » pour que le code source ne soit pas indexé sur les moteurs de recherches mais je ne pensais pas qu’une copie allait être faite publiquement ailleurs (sans utiliser la fonction « fork » de GitHub).

Merci.

Baptiste

Sur les sites utilisant SPIP et qu’on maîtrise entièrement, aucun mail n’est en clair : c’est choisi.
Sur discourse comme sur gitea, pourquoi devrait on subir autre chose ?
Tout ce qui peut éviter l’affichage en clair des mails est cohérent avec ce choix et doit être mis en œuvre.

Salut, le plus simple serait de voir ça directement avec l’auteur du commit en question, donc @Pat :slight_smile:

oui enfin là je mets mon grain de sel parce que je me suis retrouvé impacté aussi.
L’histoire donc :

  • quelqu’un publie un bout de script avec son nom en clair en guise de crédits sous licence MIT
  • le bout de script JS est repris dans un plugin SPIP en conservant les crédits et la licence tels quels, c’est bien la moindre des politesses
  • des années plus tard l’auteur vient dire "hé je savais pas que ce serait sur internet et que ça serait réutilisé, pouvez vous enlever mon nom des crédits et le remplacer par une URL vers mon site. Laquelle URL contient explicitement le dit nom qu’on est censé enlever, et renvoie sur une page avec le nom et le prénom de l’auteur plus un bouton « Hire me »
  • l’auteur du plugin SPIP s’execute, je m’execute aussi sur la copie github de la zone après X relances parce que ça commence à m’agacer Requete de l'auteur · Cerdic/spip-zone-plugins@61e6659 · GitHub

Et là ensuite la personne concernée vient donc nous dire "AH mais le commit est indexé pour Google, donc ça résoud pas le problème, pouvez vous « enlever le commit et mon nom de l’historique de votre git ».

Donc là il me semble qu’on touche les limites de ce qu’on est raisonablement censé faire non ?
Ou il faut aussi désindexer git.spip.net ?

Je sais pas, je pose la question, et surtout que tout ça découle quand même d’un bout de code publié par l’auteur initial avec son nom en guise de crédits…

C’est pas comme si on était allé chercher l’identité de quelqu’un à son insu

3 J'aime

Je sais pas, je pose la question, et surtout que tout ça découle quand même d’un bout de code publié par l’auteur initial avec son nom en guise de crédits…

C’est pas comme si on était allé chercher l’identité de quelqu’un à son insu

+1 pour ne rien faire de plus, faut pas abuser…


RastaPopoulos

1 J'aime

Pas mieux, halte au sketch donc :smiley:

1 J'aime

Bonjour, je ne vois pas ce que je peux faire de plus à ce stade…
Pat

théoriquement on peut effacer (depuis la gestion du serveur) des commits qui ne sont plus liés a aucun tags ou branche, mais vu le sketch, j’ai envfie de dire merde…

Si c’est à moi que tu t’adresses Maïeul, ce n’est pas une opération qui me semble anodine, je passe mon tour. Et pas sûr que j’ai accès d’ailleurs…

non je m’adressais à tout le monde et à personne à la fois (de toute facon tu n’aurais pas pu le faire, seuls les personnes avec les accès serveur peuvent le faire), et je disais que oui, il fallait passer notre tour en general.

ben surtout là ça avance à rien car ce sont des commits dans l’historique. Il faudrait donc réécrire l’historique des commits, ce qui casserait les checkout chez tout le monde et créerait des conflits partout

Bonjour, je viens de voir les réponses maintenant seulement car elles étaient cachées par les filtres Gmail.

Voici une autre solution qui me semble meilleure, que j’ai proposé par la suite par email :
« You can prevent a page from appearing in Google Search by including a noindex meta tag in the page’s HTML code, or by returning a noindex header in the HTTP request. »

Merci d’utiliser au moins cette solution, qui serait donc la plus simple à appliquer.

Baptiste

Pouvez-vous corriger le problème avec le header / tag meta noindex (voir une autre solution parmi les 4 proposées) ou m’indiquer l’adresse email du webmaster à contacter ?
Sans action de votre part, cela pourra être considéré comme un non respect des droits CNIL et RGPD.
J’ai également remarqué que cette conversation commencée par email à l’adresse spip-dev@rezo.net est affichée publiquement sur le web à l’adresse Fwd: informations personnelles indexées sur Google. Il serait préférable de demander le consentement en expliquant cela puis en cliquant sur un lien de confirmation (il me semble que c’est aussi le problème mentionné par @JLuc au début de cette conversation en parlant d’affichage en clair des mails).

Bonjour

Votre problème concerne la présence d’un résultat sur un moteur de recherche en particulier, cela concerne donc le droit à déréférencer un contenu comme expliqué sur Les droits pour maîtriser vos données personnelles ! | CNIL
Je vous invite alors à utiliser le service associé : https://www.google.com/webmasters/tools/legal-removal-
request?complaint_type=rtbf&visit_id=637395617535732069-1998796211&hl=fr&rd=1

Il est à noter que le problème semble propre à ce moteur de recherche car cette page n’apparaît pas sur d’autres outils de recherche et n’est donc pas en soit liée directement à la page cible incriminée.

Concernant la forge en elle même nous avons respecté votre demande en retirant votre nom sur la page.

Je me permets de compléter en indiquant que d’autres sites s’appuyant directement sur github diffusent également des informations personnelles concernant votre code initial. (et sont trouvables via moteur de recherche).

Cordialement,

Bonjour, pouvez-vous préciser de quels sites il s’agit ou via quel moteur de recherche vous avez trouvé mes informations ? Je n’ai que trouvé mes informations indexées sur Google (lien vers le site SPIP).

Bonjour, après avoir effectué une demande de suppression de résultats auprès de Google, ils m’ont répondu qu’il faut que je contacte le webmaster du site web et si le problème n’est pas réglé, que j’effectue une réclamation auprès de la CNIL.
Merci donc de corriger le problème avec le header / tag meta noindex ou une autre solution parmi les 4 proposées proposées précédemment. Cela permettra au moins aux résultats de ne plus être indexés dans le cas où cela est trop compliqué pour vous de supprimer les données personnelles entièrement.

Voici les 3 liens actuellement indexés (lien différent si on utilise une version de Google dans une langue différente ou si l’on était connecté à un compte Google) :

https://git.spip.net/spip-contrib-extensions/jeux/commit/6cab3238b6870639b33567ca887a2029cdc1c541.diff

Certains de ces liens n’étaient pas encore indexés il y a quelques mois, il faudrait donc que tous les liens commençant par Demande de l'auteur initial, au 05/03/2021 (suite) · 6cab3238b6 - jeux - SPIP on GIT ne soient plus indexés.