Connexion
Abonnez-vous

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Le 31 janvier 2023 à 05h53

Un fichier de 44,7 Go de données déclaré contenir une grande partie du code source de Yandex, le quatrième plus gros moteur de recherche au monde, a été posté en ligne le 25 janvier. Or, il s’avère que l’engin russe a très largement copié les technologies de Google (en plus, à la marge, de celles d’autres plateformes américaines). Selon l’analyse effectuée par l’ingénieur logiciel Arseniy Shestakov, la fuite concerne une large part des services proposés par l’entreprise : son moteur de recherche, son système de cartes géographiques, un service de taxi similaire à celui d’Uber, celui de sa marketplace, etc.

Pour les experts en SEO, les documents sont riches d’enseignement puisqu’ils fournissent des détails sur pas moins de 1 922 éléments susceptibles d’influencer le ranking d’une page dans le moteur de recherche russe – ainsi que, potentiellement, dans son pendant américain. Selon un autre ingénieur, Ben Wills, ça n’est qu’une petite partie des plus de 17 000 facteurs qui peuvent jouer dans la classification des résultats fournis par le moteur de recherche.

Yandex a nié avoir été hackée auprès de Bleeping Computer : l’entreprise a expliqué que les données diffusées avaient plus probablement été publiées par un ancien employé.

Le 31 janvier 2023 à 05h53

Commentaires (23)

Vous devez être abonné pour pouvoir commenter.

Abonnez-vous
votre avatar

En quoi ce leak indique comment fonctionne Google ?
Et si c’est le cas, comment Yandex auraient eu les informations du fonctionnement du code de Google ?

votre avatar

dans ce thread, le ga dit




They are quite similar:




  • there is RankBrain analogue - MatrixNet;

  • they are using PageRank (almost the same as in Google);

  • a lot of text algorithms are the same.

  • there are a lot of ex-googlers in Yandex;

  • Yanex was build as Google clone;

  • SEO specialists in Russia are using almost same white hat SEO tactics for Yandex and for Google



Of course there are a lot of differences, but the approach and the majority of ranking factors seem to be similar.
In practice: comparing Google vs Yandex search results they are a ~70% match.


Il avance aucune source apres…

votre avatar

Si c’est le cas, probablement des fuites d’employés / espions. La série “The Americans” montre très bien ce genre de pratiques. Encore une fois, SI c’est le cas.

votre avatar

Kwacep a dit:


En quoi ce leak indique comment fonctionne Google ? Et si c’est le cas, comment Yandex auraient eu les informations du fonctionnement du code de Google ?


C’est tellement proche de Google qu’on peut suspecter qu’à la base, il y a eu espionnage industriel de Google par Yandex, et donc la fuite Yandex devient indirectement une fuite Google.

votre avatar

“Yandex a nié avoir été hackée …”
Nier l’évidence semble être devenu un réflexe compulsif en Russie…

votre avatar

Tu as coupé bien court. C’est suivi de : les données diffusées avaient plus probablement été publiées par un ancien employé.



Est-ce que tu dis que la NSA a été hackée suite aux révélations de Snowden ?

votre avatar

C’est un soucis de sémantique.



Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe.
Le résultat est le même, les données sont sur internet.

votre avatar

Sauf qu’il est bien plus difficile de se protéger contre un employé qui a le droit d’accéder à des données.
Tu peux être très bien protégé contre les accès externes, mais il faut des sondes en interne qui t’alerte si quelqu’un accède à beaucoup plus de données que nécessaire à son travail journalier.



Il me semble que Snowden a accumulé ses infos sur un certain temps.

votre avatar

Je suis d’accord.



Je pense que quand Yandex a dit que ce n’était pas du hack ça ne voulait pas dire que les données n’étaient celles de leur moteur, juste que ça ne venait pas d’une attaque extérieure.



C’est pour ça que je parle de sémantique, quand GruntZ dit qu’ils nient, je suppose qu’il a assumé que Yandex voulait dire que les données n’étaient pas celles de leur moteur.

votre avatar

Vous me prêtez une analyse bien plus profonde que l’humour acerbe de ma remarque, car j’ai cité trop long.
J’aurais dû m’arrêter à “Yandex a nié …” car vous vous êtes focalisé sur le “… avoir été hacké”.
:ouioui: :humour:



Toutefois, ma compréhension du terme “hack” recouvre une utilisation non prévue de quelque chose; d’ailleurs, on le traduit souvent par “détournement”.
Vu sous cet angle, un organe comme la NSA aurait du prévoir des moyens pour éviter ou détecter l’apparition d’un Snowden dans ses rangs, et/ou empêcher les conséquences de son retournement (il avait une conscience, des états d’âmes et du courage, la suite était logique).



Une faille interne reste une faille, même si ce n’est plus le DSI qui saute, mais le DRH.

votre avatar

Un lien avec une compilation des découvertes faites actuellement dans le code :
https://searchengineland.com/yandex-leak-learnings-392393

votre avatar

Bientôt un Qwant qui fonctionne ?

votre avatar

Il y a un fichier skynet.tar.bz2 qu’est-ce que ça peut bien être ?

votre avatar

Un employé qui veut se venger… Avec tous les licenciements annoncés par les GAFAM, les fuites risquent de se multiplier.

votre avatar

C’est Yandex pas Google … (Yandex c’est le moteur de recherche Russe).



Si j’ai bien compris, on parle de google par ce que Yandex lui a volé sa méthode de fonctionnement (voir littéralement son code, mais je ne veux pas trop m’avancer)

votre avatar

Je pense que tu as loupé le sens du message de JnnT. En effet, avec le nombre de licenciements dans la tech, combien vont exfiltrer des données (secrets commerciaux, industriels, code, roadmap …) pour aller se monnayer une place à la concurrence ?



Côté cybersécurité/CISO, tout ce qui est “Insider Risk” commence à être de plus en plus un sujet actualité, pour limiter -entre autres- ce genre de scénarios.

votre avatar

+1

votre avatar

v1nce a dit:


Bientôt un Qwant qui fonctionne ?


Interdit de tacler au dessus du genou ! :francais:

votre avatar

Wow! Eux a mon avis ils sont mal barrés

votre avatar

Ah bon ? pourquoi ça ?

votre avatar

Guerre en Ukraine, difficulté financière envers le kremlin et censure.
J’utilisais leur service fut un temps et il était fantastiques. C’est vraiment dommage.

votre avatar

Myifee a dit:


En effet, avec le nombre de licenciements dans la tech, combien vont exfiltrer des données (secrets commerciaux, industriels, code, roadmap …) pour aller se monnayer une place à la concurrence ?



D’autant que ces charrettes de licenciements dans la tech, on peut les interpréter comme une façon pour les GAFAM de faire pression sur leurs employés demandant une augmentation de salaire dans un contexte d’inflation. Du genre “N’oubliez pas que vous êtes sur un siège éjectable”. Ce sont des féroces. Réponse du berger à la bergère : “Si vous me virez, ça peut vous coûter (beaucoup) plus cher que de m’augmenter.”


Que Yandex ait ou pas procédé à des licenciements, je n’ai rien vu passer. Je suis juste un utilisateur satisfait de leur navigateur très proche de Chrome. S’ils ont plagié Google chez Yandex, j’approuve.

votre avatar

v1nce a dit:


Il y a un fichier skynet.tar.bz2 qu’est-ce que ça peut bien être ?


C’est dans un courriel adressé à Sarah O’connor ?

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Fermer