Publié dans Internet

23

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Les données de Yandex dans la nature… avec une série d’indications sur le fonctionnement de Google

Un fichier de 44,7 Go de données déclaré contenir une grande partie du code source de Yandex, le quatrième plus gros moteur de recherche au monde, a été posté en ligne le 25 janvier. Or, il s’avère que l’engin russe a très largement copié les technologies de Google (en plus, à la marge, de celles d’autres plateformes américaines). Selon l’analyse effectuée par l’ingénieur logiciel Arseniy Shestakov, la fuite concerne une large part des services proposés par l’entreprise : son moteur de recherche, son système de cartes géographiques, un service de taxi similaire à celui d’Uber, celui de sa marketplace, etc.

Pour les experts en SEO, les documents sont riches d’enseignement puisqu’ils fournissent des détails sur pas moins de 1 922 éléments susceptibles d’influencer le ranking d’une page dans le moteur de recherche russe – ainsi que, potentiellement, dans son pendant américain. Selon un autre ingénieur, Ben Wills, ça n’est qu’une petite partie des plus de 17 000 facteurs qui peuvent jouer dans la classification des résultats fournis par le moteur de recherche.

Yandex a nié avoir été hackée auprès de Bleeping Computer : l’entreprise a expliqué que les données diffusées avaient plus probablement été publiées par un ancien employé.

23

Tiens, en parlant de ça :

De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Couic !

11:01Société numérique 3
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

Qui va fact-checker les bases de données ?

10:04DroitInternet 1

Le poing Dev – round 6

23:00Next 99
De vieux ciseaux posés sur une surface en bois

Plus de 60 % des demandes de suppression reçues par Google émanent de Russie

Société numérique 3
Une vieille boussole posée sur un plan en bois

La Commission européenne et Google proposent deux bases de données de fact-checks

DroitInternet 1

#LeBrief : des fichiers Google Drive disparaissent, FreeBSD 14, caméras camouflées, OnePlus 12

0

Le poing Dev – round 6

Next 99

Produits dangereux sur le web : nouvelles obligations en vue pour les marketplaces

Droit 5
consommation de l'ia

Usages et frugalité : quelle place pour les IA dans la société de demain ?

IA et algorithmes 12

La NASA établit une liaison laser à 16 millions de km, les essais continuent

Sciences et espace 17
Concept de CPU

Semi-conducteurs : un important accord entre l’Europe et l’Inde

Hardware 6

#LeBrief : PS5 Slim en France, Valeo porte plainte contre NVIDIA, pertes publicitaires X/Twitter

0
Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

651e édition des LIDD : Liens Intelligents Du Dimanche

Internet 30
Bannière de Flock avec des bomes sur un fond rouge

#Flock, le grand remplacement par les intelligences artificielles

Flock 34
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #9 : LeBrief 2.0, ligne édito, dossiers de fond

Next 63
Pilule rouge et bleue avec des messages codés

Encapsulation de clés et chiffrement d’enveloppes

Sécurité 31
Empreinte digital sur une capteur

Empreintes digitales : les capteurs Windows Hello loin d’être exemplaires

Sécurité 20

#LeBrief : succès du test d’Ariane 6, réparer plutôt que remplacer, Broadcom finalise le rachat de VMware

0

Hébergeurs, éditeurs, espaces de conversation ? La difficile régulation des réseaux sociaux

Réseaux sociauxSociété numérique 23
Puces en silicium

Silicium : un matériau indispensable et omniprésent, mais critique

HardwareSciences et espace 25
Panneau solaire bi-face Sunology Play

Panneaux solaires en autoconsommation : on décortique le kit Play de Sunology

Hardware 26
The eyes and ears of the army, Fort Dix, N.J.

Un think tank propose d’autoriser les opérations de « hack back »

Sécurité 12

#LeBrief : Ariane 6 sur le banc de test, arrestation algorithmique, entraînement d’IA par des mineurs

0
Illustration Back to the future Job

OpenAI : récit d’une semaine de folie

IA et algorithmesSociété numérique 41
Drapeaux de l’Union européenne

AI Act : la France, l’Allemagne et l’Italie ne veulent pas réguler les modèles « de fondation »

DroitIA et algorithmes 4
Disques durs Western Digital Ultrastar DC HC680 de 26 à 28 To

Western Digital : scission en 2024, des HDD 24 To CMR et 28 To SMR dès maintenant

Hardware 14

#LeBrief : Firefox 120, SoC Dimensity 8300, amendes des géants du Net

0
Smartphone OnePlus 12

Le OnePlus 12 sera présenté le 5 décembre

Hardware 26

Logo de Google sur un ordinateur portable

Des fichiers disparaissent mystérieusement de certains comptes Google Drive

Logiciel 15

Caméra camouflée dans un faux détecteur de fumée et quatre exemples d'utilisation (appartement, usine, magasin, restaurant

À la Samaritaine, des caméras camouflées en détecteurs de fumée

Droit 10

Rachat d’iRobot : la Commission détaille ses craintes à Amazon

Droit 9

Logo de FreeBSD sur fond rouge

FreeBSD 14 disponible en version finale

Logiciel 1

Commentaires (23)


Kwacep Abonné
Il y a 10 mois

En quoi ce leak indique comment fonctionne Google ?
Et si c’est le cas, comment Yandex auraient eu les informations du fonctionnement du code de Google ?


zyhou Abonné
Il y a 10 mois

dans ce thread, le ga dit




They are quite similar:




  • there is RankBrain analogue - MatrixNet;

  • they are using PageRank (almost the same as in Google);

  • a lot of text algorithms are the same.

  • there are a lot of ex-googlers in Yandex;

  • Yanex was build as Google clone;

  • SEO specialists in Russia are using almost same white hat SEO tactics for Yandex and for Google



Of course there are a lot of differences, but the approach and the majority of ranking factors seem to be similar.
In practice: comparing Google vs Yandex search results they are a ~70% match.




Il avance aucune source apres…


jonjbar Abonné
Il y a 10 mois

Si c’est le cas, probablement des fuites d’employés / espions. La série “The Americans” montre très bien ce genre de pratiques. Encore une fois, SI c’est le cas.


alex.d. Abonné
Il y a 10 mois

Kwacep a dit:


En quoi ce leak indique comment fonctionne Google ? Et si c’est le cas, comment Yandex auraient eu les informations du fonctionnement du code de Google ?




C’est tellement proche de Google qu’on peut suspecter qu’à la base, il y a eu espionnage industriel de Google par Yandex, et donc la fuite Yandex devient indirectement une fuite Google.


GruntZ Abonné
Il y a 10 mois

“Yandex a nié avoir été hackée …”
Nier l’évidence semble être devenu un réflexe compulsif en Russie…


fred42 Abonné
Il y a 10 mois

Tu as coupé bien court. C’est suivi de : les données diffusées avaient plus probablement été publiées par un ancien employé.



Est-ce que tu dis que la NSA a été hackée suite aux révélations de Snowden ?


misocard Abonné
Il y a 10 mois

fred42

Tu as coupé bien court. C’est suivi de : les données diffusées avaient plus probablement été publiées par un ancien employé.

Est-ce que tu dis que la NSA a été hackée suite aux révélations de Snowden ?

C’est un soucis de sémantique.



Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe.
Le résultat est le même, les données sont sur internet.


fred42 Abonné
Il y a 10 mois

misocard

C’est un soucis de sémantique.

Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe. Le résultat est le même, les données sont sur internet.

Sauf qu’il est bien plus difficile de se protéger contre un employé qui a le droit d’accéder à des données.
Tu peux être très bien protégé contre les accès externes, mais il faut des sondes en interne qui t’alerte si quelqu’un accède à beaucoup plus de données que nécessaire à son travail journalier.



Il me semble que Snowden a accumulé ses infos sur un certain temps.


misocard Abonné
Il y a 10 mois

fred42

Sauf qu’il est bien plus difficile de se protéger contre un employé qui a le droit d’accéder à des données. Tu peux être très bien protégé contre les accès externes, mais il faut des sondes en interne qui t’alerte si quelqu’un accède à beaucoup plus de données que nécessaire à son travail journalier.

Il me semble que Snowden a accumulé ses infos sur un certain temps.

Je suis d’accord.



Je pense que quand Yandex a dit que ce n’était pas du hack ça ne voulait pas dire que les données n’étaient celles de leur moteur, juste que ça ne venait pas d’une attaque extérieure.



C’est pour ça que je parle de sémantique, quand GruntZ dit qu’ils nient, je suppose qu’il a assumé que Yandex voulait dire que les données n’étaient pas celles de leur moteur.


GruntZ Abonné
Il y a 10 mois

misocard

C’est un soucis de sémantique.

Ça reste une brèche de sécurité, mais c’est une brèche interne et non externe. Le résultat est le même, les données sont sur internet.

Vous me prêtez une analyse bien plus profonde que l’humour acerbe de ma remarque, car j’ai cité trop long.
J’aurais dû m’arrêter à “Yandex a nié …” car vous vous êtes focalisé sur le “… avoir été hacké”.
:ouioui: :humour:



Toutefois, ma compréhension du terme “hack” recouvre une utilisation non prévue de quelque chose; d’ailleurs, on le traduit souvent par “détournement”.
Vu sous cet angle, un organe comme la NSA aurait du prévoir des moyens pour éviter ou détecter l’apparition d’un Snowden dans ses rangs, et/ou empêcher les conséquences de son retournement (il avait une conscience, des états d’âmes et du courage, la suite était logique).



Une faille interne reste une faille, même si ce n’est plus le DSI qui saute, mais le DRH.


bmot Abonné
Il y a 10 mois

Un lien avec une compilation des découvertes faites actuellement dans le code :
https://searchengineland.com/yandex-leak-learnings-392393


v1nce
Il y a 10 mois

Bientôt un Qwant qui fonctionne ?


v1nce
Il y a 10 mois

Il y a un fichier skynet.tar.bz2 qu’est-ce que ça peut bien être ?


JnnT
Il y a 10 mois

Un employé qui veut se venger… Avec tous les licenciements annoncés par les GAFAM, les fuites risquent de se multiplier.


misocard Abonné
Il y a 10 mois

C’est Yandex pas Google … (Yandex c’est le moteur de recherche Russe).



Si j’ai bien compris, on parle de google par ce que Yandex lui a volé sa méthode de fonctionnement (voir littéralement son code, mais je ne veux pas trop m’avancer)


Myifee Abonné
Il y a 10 mois

misocard

C’est Yandex pas Google … (Yandex c’est le moteur de recherche Russe).

Si j’ai bien compris, on parle de google par ce que Yandex lui a volé sa méthode de fonctionnement (voir littéralement son code, mais je ne veux pas trop m’avancer)

Je pense que tu as loupé le sens du message de JnnT. En effet, avec le nombre de licenciements dans la tech, combien vont exfiltrer des données (secrets commerciaux, industriels, code, roadmap …) pour aller se monnayer une place à la concurrence ?



Côté cybersécurité/CISO, tout ce qui est “Insider Risk” commence à être de plus en plus un sujet actualité, pour limiter -entre autres- ce genre de scénarios.


Ricard
Il y a 10 mois

+1


domFreedom
Il y a 10 mois

v1nce a dit:


Bientôt un Qwant qui fonctionne ?




Interdit de tacler au dessus du genou ! :francais:


Buoux
Il y a 10 mois

Wow! Eux a mon avis ils sont mal barrés


fred42 Abonné
Il y a 10 mois

Ah bon ? pourquoi ça ?


Buoux
Il y a 10 mois

fred42

Ah bon ? pourquoi ça ?

Guerre en Ukraine, difficulté financière envers le kremlin et censure.
J’utilisais leur service fut un temps et il était fantastiques. C’est vraiment dommage.


JnnT
Il y a 10 mois

Myifee a dit:


En effet, avec le nombre de licenciements dans la tech, combien vont exfiltrer des données (secrets commerciaux, industriels, code, roadmap …) pour aller se monnayer une place à la concurrence ?



D’autant que ces charrettes de licenciements dans la tech, on peut les interpréter comme une façon pour les GAFAM de faire pression sur leurs employés demandant une augmentation de salaire dans un contexte d’inflation. Du genre “N’oubliez pas que vous êtes sur un siège éjectable”. Ce sont des féroces. Réponse du berger à la bergère : “Si vous me virez, ça peut vous coûter (beaucoup) plus cher que de m’augmenter.”




Que Yandex ait ou pas procédé à des licenciements, je n’ai rien vu passer. Je suis juste un utilisateur satisfait de leur navigateur très proche de Chrome. S’ils ont plagié Google chez Yandex, j’approuve.


wanou Abonné
Il y a 10 mois

v1nce a dit:


Il y a un fichier skynet.tar.bz2 qu’est-ce que ça peut bien être ?




C’est dans un courriel adressé à Sarah O’connor ?