Les commits publics de GitHub recèlent « au moins 10 millions de secrets »

Le 23 août 2023 à 06h46

2 min

Logiciel

Mackenzie Jackson et Dwayne McDaniel, deux chercheurs en cybersécurité de la société spécialisée GitGuardian, estiment que les commits publics de GitHub recèlent « au moins 10 millions de secrets », soit 67 % de plus que l'an passé, relève SC Magazine.

Par « secrets », ils entendent « tout ce qui permet d'accéder à un autre système ou de déchiffrer des données », qu'il s'agisse de paires nom d'utilisateur/mot de passe, de jetons d'API, d'URL de connexion à une base de données ou de cookies de session de navigateur.

Intervenant à la conférence BSides de Las Vegas, ils ont expliqué que « un utilisateur de GitHub sur 10 a partagé un secret en 2022 », mais également que « 5,5 commits sur 1 000 contenaient un secret », soit 50 % de plus que l'an passé. Les clés d'API de Google, représentant 9,7 % du total, auraient été le secret le plus souvent divulgué en 2022.

Les chercheurs de GitGuardian, qui ont décompilé 50 000 applications Android du Google Play Store, ont également découvert que près de la moitié d'entre elles exposaient des informations d'identification en clair.

Jackson a expliqué qu'il était très simple de vérifier si les applications mobiles contenaient des secrets codés en dur. Il faut d'abord télécharger une application mobile sur un ordinateur, à l'aide d'un logiciel comme GPlayDL (pour Android) ou ipatool (pour iOS).

L'application Android peut être décompilée à l'aide d'un outil appelé JADX ; pour les applications iOS, il suffit de changer le type de fichier .ipa en .zip et de décompresser les fichiers, puis d'utiliser l'application de GitGuardian, GGShield, pour rechercher des informations d'identification.

Sébastien Gavois

Le 23 août 2023 à 06h46

Commentaires (30)

Trooppper

Le 23/08/2023 à 07h10

« un utilisateur de GitHub sur 10 a partagé un secret en 2022 »

50 000 applications Android du Google Play Store, ont également découvert que près de la moitié d’entre elles

Oui mais vous comprenez, c’est la faute aux chefs de projets qui n’y comprennent rien, aux spécifications mal branlées, aux prestas, aux timings serrés, au chat de la voisine, au climat…
Ah bah non, en fait : 1 dev sur 10 au moins est inconsistant, et plus encore pour les devs android…

tpeg5stan

Le 23/08/2023 à 08h37

Un grand classique, hélas.

Je dis probablement une bêtise : il n’y a pas moyen d’utiliser ggshield « à l’envers » pour détecter si ce qui va être pushé pour détecter automatiquement si un mot de passe/une clé en clair s’y trouve ?

De la même façon que sur les courriels on me suggère d’ajouter la pièce jointe au cas où je l’aurais oubliée.

anagrys Abonné

Le 23/08/2023 à 09h05

Il existe des outils pour contrôler le code, qui peuvent être soit appelés avant les push, soit intégrés dans le pipeline de build, voir ajoutés comme plugin dans le repo Git (ça doit exister sur GitHub, mais il faut peut-être la version licenciée…?).

De la même manière, basé sur le ReadMe de GGShield, il peut être intégré dans les pipelines CI/CD.
Évidemment, tout ça suppose d’avoir une chaîne CI/CD, au minimum… pour le type qui a son repo public et qui package avec click droit > package depuis son IDE, on ne peut pas faire grand chose…

nicobuq Abonné

Le 23/08/2023 à 10h46

Les IPA d’iOS sont en effet des fichiers ZIP.
Les APK d’Android sont aussi des fichiers ZIP. Le renommage enn .zip permet de les décompresser.

fred42 Abonné

Le 23/08/2023 à 10h51

C’est marrant, moi, je n’ai pas besoin de les renommer pour les décompresser.

Sachifus Abonné

Le 23/08/2023 à 12h02

Tu as peut-être une association de fichiers en place avec ton logiciel d’archivage/désarchivage ?

eglyn Abonné

Le 23/08/2023 à 12h11

oui, ou clic droit, 7zip –> extraire, ça marche sur n’importe quel type d’extension de fichier compressé :)

fred42 Abonné

Le 23/08/2023 à 14h02

Peut-être que je n’ai pas un système d’exploitation qui s’appuie sur une règle ridicule de nommage des noms de fichiers pour savoir avec quoi ouvrir un fichier.

Vekin

Le 23/08/2023 à 14h33

Même sous Windows, il n’est pas forcément nécessaire de le renommer pour l’ouvrir comme un ZIP. On peut très bien ouvrir directement un DOCX ou un APK dans 7-Zip, par exemple.

fred42 Abonné

Le 23/08/2023 à 14h46

Oui, je sais.

Mais ce qui m’énerve sur ce sujet, c’est que NXI n’est même plus capable d’avoir un esprit critique sur une manip inutile même sur Windows (le renommage de fichier) avant de le décompresser. Maintenant, on recopie simplement les manips données par d’autre. Heureusement que la manip décrite ne détruit pas le contenu d’un disque !

On peut en déduire cependant que ce n’est pas Vincent qui a écrit la brève.

Jeanprofite

Le 23/08/2023 à 14h26

Fred42 veux juste affirmer la «supériorité» de Linux sur Windows (ou la sienne ou les deux :-)

127.0.0.1

Le 23/08/2023 à 12h43

Les commits publics de GitHub recèlent « au moins 10 millions de secrets »

il y a donc eu au moins 10 millions de piratage de systèmes sensibles.
Ou pas.

Si ca se trouve c’est encore une étude publiée par des chercheurs/sociétés de cybersécurité en mal de visibilité. Bref, de la pub.

Mackenzie Jackson et Dwayne McDaniel, deux chercheurs en cybersécurité de la société spécialisée GitGuardian, estiment que …

ah, tiens donc…

the_frogkiller Abonné

Le 23/08/2023 à 12h47

(quote:2148371:127.0.0.1)
il y a donc eu au moins 10 millions de piratage de systèmes sensibles. Ou pas.

Si ca se trouve c’est encore une étude publiée par des chercheurs/sociétés de cybersécurité en mal de visibilité. Bref, de la pub.

ah, tiens donc…

Personne n’a dit cela. C’est un risque supplemo. Et Heureusement que dans la plupart des cas ce n’est pas suffisant d’avoir le loggin/mot de pass d’une bdd par exemple pour y avoir accès…

OniriCorpe Abonné

Le 23/08/2023 à 14h58

Les chercheurs de GitGuardian, qui ont décompilé 50 000 applications Android du Google Play Store, ont également découvert que près de la moitié d’entre elles exposaient des informations d’identification en clair.

C’est pas strictement en clair s’il a fallu décompiler pour voir l’info :“)

127.0.0.1

Le 23/08/2023 à 15h41

fred42 a dit:

Peut-être que je n’ai pas un système d’exploitation qui s’appuie sur une règle ridicule de nommage des noms de fichiers pour savoir avec quoi ouvrir un fichier.

Puis il découvrit horrifié que sur son OS fétiche le mime-type d’un package se basait en fait sur l’extension du fichier.

  <mime-type type="application/vnd.android.package-archive">
    <_comment>Android package</_comment>
    <sub-class-of type="application/x-java-archive"/>
    <glob pattern="*.apk"/>
  </mime-type>

fred42 Abonné

Le 23/08/2023 à 16h07

Sauf que ce n’est pas si simple que cela :

renomme un toto. apk en toto et tu l’ouvriras sans souci en double cliquant dessus. La recherche de “magic” est passée par là.

SebGF Abonné

Le 23/08/2023 à 16h24

Oui, les commits contiennent des secrets, c’est malheureusement la réalité. Des clés privées, des tokens, des passwords dans du code terraform, j’en passe et des meilleurs, tout ça peut finir malencontreusement dans le commit quand le dev ne fait pas attention.

Et oui, je parle de toi, l’adepte du git add -A qui vérifie pas avant ce qu’il ajoute à l’historique. 🫵

(presque) Blague à part (ça c’est quand même une réalité observée), c’est aussi pour ça que les solutions techniques sont de plus en plus développées et déployées.. Avec les outils comme GitLeaks, les solutions des hébergeurs comme GitHub et GitLab (qui sont même capables de révoquer automatiquement ou notifier le partenaire de la fuite - ex un clé AWS, une notif est envoyée pour signaler la fuite à Amazon) qui bloquent le push, etc.

Et les tokens dans les artifacts, c’est malheureusement une mauvaise pratique assez répandue aussi…

N’étant pas dev de formation, je ne sais pas si dans les cursus de développement on apprend les rudiments de la sécurité informatique. Mais en tous cas, mon constat est que ça ne doit pas être le cas quand j’observe toutes les mauvaises pratiques que je peux voir au quotidien.

SebGF Abonné

Le 23/08/2023 à 16h28

fred42 a dit:

Sauf que ce n’est pas si simple que cela :

renomme un toto. apk en toto et tu l’ouvriras sans souci en double cliquant dessus. La recherche de “magic” est passée par là.

Ca dépend des DE sous Linux, mais généralement ils regardent d’abord leur association extension=logiciel pour ouvrir un fichier avant de recourir au magic byte.

Si tu veux faire l’essai : dans le DE associe un éditeur texte A pour .txt et un éditeur de texte B pour markdown (.md). Techniquement ce sont tout deux des fichiers texte ASCII mais l’association du DE aura la priorité sur le choix du logiciel.

ex : chez moi .txt sera ouvert par VSCodium, .md par Ghostwriter.

fred42 Abonné

Le 23/08/2023 à 16h36

Ça dépend peu des DE, les principaux appliquent les spécifications de freedesktop.org

Par contre, ça dépend des logiciels installés.

jotak Abonné

Le 23/08/2023 à 23h26

J’ai des secrets (fake) dans mes tests unitaires, est-ce que je fais partie de ces “1 développeur sur 10” mauvais élève selon eux?

SebGF Abonné

Le 24/08/2023 à 06h23

J’imagine que c’est pour tester des valeurs passées ?

Dans tous les cas il y en a où cela est “justifié” par la finalité du projet. Typiquement, on ne va pas considérer OWASP comme mauvais élève pour avoir créé des projets volontairement vulnérables à des fins de démonstration de pratiques à risques.

Genre Terragoat où les fichiers variables contiennent des credentials AWS ou Azure valides sur le papier (mais révoqués) et autres applications extrêmement vulnérables.

Evidemment, la personne qui souhaite déployer ces applis … Bah have fun. Mais dans ce cas là autant publier ses credentials Cloud sur son profil facebook ou linkedin si le but est de gagner plein de copains Eurasiatiques qui viennent squatter la sub et faire péter les scores du billing

Trooppper

Le 24/08/2023 à 06h05

jotak a dit:

J’ai des secrets (fake) dans mes tests unitaires, est-ce que je fais partie de ces “1 développeur sur 10” mauvais élève selon eux?

C’est quoi l’interet ? Vraie question ?

jotak Abonné

Le 24/08/2023 à 14h19

Il peut y avoir plein de raisons… Par exemple, pour tester une communication en mtls, il va falloir fournir des fakes certifs/clés

fred42 Abonné

Le 24/08/2023 à 14h31

Oui, mais c’est quoi l’intérêt de les mettre sur un GitHub public ?

jotak Abonné

Le 24/08/2023 à 16h31

Je saisis peut-être pas bien la question : pour du code open-source sur github, le repo va contenir les tests unitaires (ou autres), et doit pouvoir fonctionner en autonomie.
Pour répondre à @SebGF: si comme tu proposes les tests dépendent d’un gestionnaire de secrets ça complexifie la mise en place de l’environnement (y compris sur chaque machine de dev qui voudrait lancer localement les tests) et je ne suis pas sûr de voir le bénéfice au final

Précision : je ne parle pas d’un environnement de test persistant, mais bien d’un environnement qu’on setup et shutdown à la volée pour le test

SebGF Abonné

Le 24/08/2023 à 16h55

OK je vois c’est juste un jeu de test exécuté sur une instance éphémère. Après comme tu l’as dit, les données sont fausses et inexploitables.

Cela dit, les infos de type credential (même fausses) peuvent dans ce cas être passées par injection au moment de l’exec (passées au container via environment par exemple) sur le poste de dev et ainsi éviter de commit ces valeurs aussi inutiles soient-elles. Et ce même sans passer par un gestionnaire de secrets.

maddanny

Le 24/08/2023 à 13h44

fred42 a dit:

Mais ce qui m’énerve sur ce sujet, c’est que NXI n’est même plus capable d’avoir un esprit critique sur une manip inutile même sur Windows (le renommage de fichier) avant de le décompresser.

eh ben, tu as des vrais problèmes dans la vie !
Je trouve l’explication très utile pour les débutants sur un site qui s’adresse à tout le monde :)

SebGF Abonné

Le 24/08/2023 à 15h21

jotak a dit:

Il peut y avoir plein de raisons… Par exemple, pour tester une communication en mtls, il va falloir fournir des fakes certifs/clés

Il ne serait pas possible de les injecter lors du pipeline de test depuis un gestionnaire de secrets ?

Trooppper

Le 24/08/2023 à 15h58

jotak a dit:

Il peut y avoir plein de raisons… Par exemple, pour tester une communication en mtls, il va falloir fournir des fakes certifs/clés

Ok je comprends bien l’interet de tests unitaires.
Mais quel intérêt de les laisser ? Dans ma branche on appelle ca du code mort, et c’est interdit. J’imaginais que c’etait une bonne pratique partout.

jotak Abonné

Le 24/08/2023 à 17h50

C’est du code de test, donc pas du code mort (?)

Catégories

Nous Suivre

À propos

Les commits publics de GitHub recèlent « au moins 10 millions de secrets »

Commentaires (30)