WhatsApp : des liens d’invitation à des groupes privés retrouvables sur Google

WhatsApp : des liens d’invitation à des groupes privés retrouvables sur Google

Le 24 février 2020 à 08h39

Le 24 février 2020 à 08h39

Commentaires (14)

votre avatar

La chaise, l’écran et l’entre-deux. L’histoire de l’humanité.

votre avatar

Pourtant c’est simple de mettre un robots.txt :

https://chat.whatsapp.com/robots.txt (même pas de 404, mais une page pourrie)

votre avatar

Je crois que tu n’as pas compris (ou alors c’est moi)



Des participants à ces groupes privés publient les liens d’invitations sur des pages WEB.

Une fois ces pages indéxées par Google, les liens sont trouvables via Google et permettent d’accéder à des groupes privés.



robots.txt n’a rien à voir dans l’histoire.

votre avatar

Le soucis c’est qu’un lien de ce type devrait être accompagné d’un mot de passe.

votre avatar

Ben si, si y avait un robots.txt correctement configuré pour refuser toute indexation, alors Google ne l’indexerait pas et aucun lien ne serait trouvable via une recherche.

votre avatar

Le robots.txt ne concerne que le site sur lequel il est hébergé. Même si https://chat.whatsapp.com/robots.txt interdisait tout crawl/indexation, ça n’empêcherait pas n’importe quel autre site de publier un lien sur une de ses pages vers une URL d’invitation. Et du coup cette autre page sur cet autre site sera indexée avec ce lien pour contenu.

votre avatar

Disons que ça aide un peu.



En tout cas, j’ai l’impression que Google a fait le ménage…

votre avatar

Une des questions reste de déterminer ce qu’est un canal de communication privé. Par exemple, si j’envoie par mail un lien à un contact, est-ce que ce message est privé ? Si moi ou mon interlocuteur à une boite mail hébergée par Google, est-ce que Google ne va pas tenter d’indexer le contenu de mon message ?



Il me semble qu’il y a peut être aussi un problème de frontière entre ce qui relève de la vie privé ou non. Et que cette frontière est toujours plus poussée par les GAFAM. Mark nous l’a bien expliqué, il rêve d’un monde sans vie privé, c’est-à-dire un monde où Facebook pourrait indexer toutes les données que nous produisons, sans limite ni contrainte.

votre avatar

Google va peut-être indexer ton mail, mais je doute très fortement que son contenu soit publiquement accessible ensuite, donc c’est un bon moyen. Sinon, il suffit simplement de réinitialiser le lien après quelques temps, pour couper les potentiels accès indésirés.



En tout cas, ça confirme bien que ces liens ont été indexés uniquement parce qu’ils étaient présents publiquement sur le web. Je croyais au départ à une faille du serveur qui publiait les liens aux quatre vents.

votre avatar







Kenairod a écrit :



Le robots.txt ne concerne que le site sur lequel il est hébergé. Même si https://chat.whatsapp.com/robots.txt interdisait tout crawl/indexation, ça n’empêcherait pas n’importe quel autre site de publier un lien sur une de ses pages vers une URL d’invitation. Et du coup cette autre page sur cet autre site sera indexée avec ce lien pour contenu.







Le problème est qu’on va trouver les informations en cherchant “bidule site:chat.whatsapp.com”. Donc oui, c’est bien un problème de robots.txt.



Je pense de plus que parfois l’indexation part de mails Gmail (à vérifier), donc pas de page purement publique.


votre avatar

Ah oui effectivement je pensais pas que ça ressortait comme ça x)

votre avatar

L’investigation de Motherboard est vraiment fénéante pour le coup. On a reussi a se faire inviter, il semble y’a voir des trucs un peu sensibles, mais en fait sait pas trop et on a pas poussé plus loin. Ils auraient pu refourguer l’affaire à d’autres groupes journalistiques pour creuser plus loin, mais non. Mais quelle nulité.

votre avatar







John Livingston a écrit :



Le problème est qu’on va trouver les informations en cherchant “bidule site:chat.whatsapp.com”. Donc oui, c’est bien un problème de robots.txt.



Je pense de plus que parfois l’indexation part de mails Gmail (à vérifier), donc pas de page purement publique.





J’ai déjà constaté le passage du bot Google sur un site en dev (sur sous domaine, 0 liens en ligne) après l’envoie de l’URL dans une boite Gmail…

Je ne crois pas qu’ils s’en cache mais c’est lourd cette façon de faire.


votre avatar

ce genre de lien devrait surtout être à usage unique et périssable 

WhatsApp : des liens d’invitation à des groupes privés retrouvables sur Google

Fermer