Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Un fichier de 44,7 Go de données déclaré contenir une grande partie du code source de Yandex, le quatrième plus gros moteur de recherche au monde, a été posté en ligne le 25 janvier. Or, il s’avère que l’engin russe a très largement copié les technologies de Google (en plus, à la marge, de celles d’autres plateformes américaines). Selon l’analyse effectuée par l’ingénieur logiciel Arseniy Shestakov, la fuite concerne une large part des services proposés par l’entreprise : son moteur de recherche, son système de cartes géographiques, un service de taxi similaire à celui d’Uber, celui de sa marketplace, etc.

Pour les experts en SEO, les documents sont riches d’enseignement puisqu’ils fournissent des détails sur pas moins de 1 922 éléments susceptibles d’influencer le ranking d’une page dans le moteur de recherche russe – ainsi que, potentiellement, dans son pendant américain. Selon un autre ingénieur, Ben Wills, ça n’est qu’une petite partie des plus de 17 000 facteurs qui peuvent jouer dans la classification des résultats fournis par le moteur de recherche.

Yandex a nié avoir été hackée auprès de Bleeping Computer : l’entreprise a expliqué que les données diffusées avaient plus probablement été publiées par un ancien employé.

Commentaires (23)


En quoi ce leak indique comment fonctionne Google ?
Et si c’est le cas, comment Yandex auraient eu les informations du fonctionnement du code de Google ?


dans ce thread, le ga dit




They are quite similar:




  • there is RankBrain analogue - MatrixNet;

  • they are using PageRank (almost the same as in Google);

  • a lot of text algorithms are the same.

  • there are a lot of ex-googlers in Yandex;

  • Yanex was build as Google clone;

  • SEO specialists in Russia are using almost same white hat SEO tactics for Yandex and for Google



Of course there are a lot of differences, but the approach and the majority of ranking factors seem to be similar.
In practice: comparing Google vs Yandex search results they are a ~70% match.




Il avance aucune source apres…


Si c’est le cas, probablement des fuites d’employés / espions. La série “The Americans” montre très bien ce genre de pratiques. Encore une fois, SI c’est le cas.



Kwacep a dit:


En quoi ce leak indique comment fonctionne Google ? Et si c’est le cas, comment Yandex auraient eu les informations du fonctionnement du code de Google ?




C’est tellement proche de Google qu’on peut suspecter qu’à la base, il y a eu espionnage industriel de Google par Yandex, et donc la fuite Yandex devient indirectement une fuite Google.


“Yandex a nié avoir été hackée …”
Nier l’évidence semble être devenu un réflexe compulsif en Russie…


Tu as coupé bien court. C’est suivi de : les données diffusées avaient plus probablement été publiées par un ancien employé.



Est-ce que tu dis que la NSA a été hackée suite aux révélations de Snowden ?


fred42

Tu as coupé bien court. C’est suivi de : les données diffusées avaient plus probablement été publiées par un ancien employé.



Est-ce que tu dis que la NSA a été hackée suite aux révélations de Snowden ?


C’est un soucis de sémantique.



Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe.
Le résultat est le même, les données sont sur internet.


misocard

C’est un soucis de sémantique.



Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe.
Le résultat est le même, les données sont sur internet.


Sauf qu’il est bien plus difficile de se protéger contre un employé qui a le droit d’accéder à des données.
Tu peux être très bien protégé contre les accès externes, mais il faut des sondes en interne qui t’alerte si quelqu’un accède à beaucoup plus de données que nécessaire à son travail journalier.



Il me semble que Snowden a accumulé ses infos sur un certain temps.


fred42

Sauf qu’il est bien plus difficile de se protéger contre un employé qui a le droit d’accéder à des données.
Tu peux être très bien protégé contre les accès externes, mais il faut des sondes en interne qui t’alerte si quelqu’un accède à beaucoup plus de données que nécessaire à son travail journalier.



Il me semble que Snowden a accumulé ses infos sur un certain temps.


Je suis d’accord.



Je pense que quand Yandex a dit que ce n’était pas du hack ça ne voulait pas dire que les données n’étaient celles de leur moteur, juste que ça ne venait pas d’une attaque extérieure.



C’est pour ça que je parle de sémantique, quand GruntZ dit qu’ils nient, je suppose qu’il a assumé que Yandex voulait dire que les données n’étaient pas celles de leur moteur.


misocard

C’est un soucis de sémantique.



Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe.
Le résultat est le même, les données sont sur internet.


Vous me prêtez une analyse bien plus profonde que l’humour acerbe de ma remarque, car j’ai cité trop long.
J’aurais dû m’arrêter à “Yandex a nié …” car vous vous êtes focalisé sur le “… avoir été hacké”.
:ouioui: :humour:



Toutefois, ma compréhension du terme “hack” recouvre une utilisation non prévue de quelque chose; d’ailleurs, on le traduit souvent par “détournement”.
Vu sous cet angle, un organe comme la NSA aurait du prévoir des moyens pour éviter ou détecter l’apparition d’un Snowden dans ses rangs, et/ou empêcher les conséquences de son retournement (il avait une conscience, des états d’âmes et du courage, la suite était logique).



Une faille interne reste une faille, même si ce n’est plus le DSI qui saute, mais le DRH.


Un lien avec une compilation des découvertes faites actuellement dans le code :
https://searchengineland.com/yandex-leak-learnings-392393


Bientôt un Qwant qui fonctionne ?


Il y a un fichier skynet.tar.bz2 qu’est-ce que ça peut bien être ?


Un employé qui veut se venger… Avec tous les licenciements annoncés par les GAFAM, les fuites risquent de se multiplier.


C’est Yandex pas Google … (Yandex c’est le moteur de recherche Russe).



Si j’ai bien compris, on parle de google par ce que Yandex lui a volé sa méthode de fonctionnement (voir littéralement son code, mais je ne veux pas trop m’avancer)


misocard

C’est Yandex pas Google … (Yandex c’est le moteur de recherche Russe).



Si j’ai bien compris, on parle de google par ce que Yandex lui a volé sa méthode de fonctionnement (voir littéralement son code, mais je ne veux pas trop m’avancer)


Je pense que tu as loupé le sens du message de JnnT. En effet, avec le nombre de licenciements dans la tech, combien vont exfiltrer des données (secrets commerciaux, industriels, code, roadmap …) pour aller se monnayer une place à la concurrence ?



Côté cybersécurité/CISO, tout ce qui est “Insider Risk” commence à être de plus en plus un sujet actualité, pour limiter -entre autres- ce genre de scénarios.


+1



v1nce a dit:


Bientôt un Qwant qui fonctionne ?




Interdit de tacler au dessus du genou ! :francais:


Wow! Eux a mon avis ils sont mal barrés


Ah bon ? pourquoi ça ?


fred42

Ah bon ? pourquoi ça ?


Guerre en Ukraine, difficulté financière envers le kremlin et censure.
J’utilisais leur service fut un temps et il était fantastiques. C’est vraiment dommage.



Myifee a dit:


En effet, avec le nombre de licenciements dans la tech, combien vont exfiltrer des données (secrets commerciaux, industriels, code, roadmap …) pour aller se monnayer une place à la concurrence ?



D’autant que ces charrettes de licenciements dans la tech, on peut les interpréter comme une façon pour les GAFAM de faire pression sur leurs employés demandant une augmentation de salaire dans un contexte d’inflation. Du genre “N’oubliez pas que vous êtes sur un siège éjectable”. Ce sont des féroces. Réponse du berger à la bergère : “Si vous me virez, ça peut vous coûter (beaucoup) plus cher que de m’augmenter.”




Que Yandex ait ou pas procédé à des licenciements, je n’ai rien vu passer. Je suis juste un utilisateur satisfait de leur navigateur très proche de Chrome. S’ils ont plagié Google chez Yandex, j’approuve.



v1nce a dit:


Il y a un fichier skynet.tar.bz2 qu’est-ce que ça peut bien être ?




C’est dans un courriel adressé à Sarah O’connor ?


Fermer