N'empêche, réussir à vendre pour 26 milliards de dollars de skins, statistiques d'armes et autres mouvements de danse virtuels (enfin j'imagine que c'est ce dont il s'agit), chapeau bas... Le niveau de rentabilité doit être dingue ! Je sais, il faut créer le jeu au départ (mais Fortnite n'est pas forcément une vitrine technologique ni une révolution en terme de game art...) faire tourner quelques serveurs, et surtout payer la pub (probablement le budget principal), mais quand même, il doit rester pas mal de sous à la fin. L'économie de la vanité (et non celle du divertissement, on peut s'amuser sur Fortnite sans rien payer si je comprends bien) est veille comme le monde, mais on atteint ici un niveau sidérant.
À part verser dans un crétin complotisme, il n'y a pas de lien entre direct entre la régulation de surveillance États-unienne, et l'implantation d'entreprises qui ont du pognon à ne plus savoir quoi faire à des endroits économiquement porteurs d'avenir, quand bien même ces entreprises sont abondamment subventionnées, comme le sont les grandes de tout pays ayant un modèle capitalisme libéral, dont la France.
Par contre, il est toujours bon de rappeler que ces endroits sont éminemment visés par ces lois de surveillance États-unienne, rappelons-le à toutes fins utiles, à portée extra-territoriale.
J'ai entendu de manière constante les neuneus entreprises françaises répéter que l'emplacement géographique français était une garantie en regard du RGPD. Et quand bien même quelques-uns s'égosillaient à rappeler le contraire, la populace continue de boire à cet abreuvoir.
Nos données dans des entreprises immatures, en l'absence de régulation par destruction des services publics issue de l'idéologique libéraliste, passent ainsi par des technologies, services et maintenant centres de données appartenant à des structure ayant un pied chez nos meilleurs ennemis, qui vont pouvoir continuer à allègrement nous espionner pour leur intérêt… qui n'est jamais le nôtre, rappelons-le au cas où des crétins iraient à dire que ça n'est pas si grave.
Je like avec un bémol sur "ennemis". Je dirai "concurrents très fortement soutenus par un système economico judiciaire intégré, idéologique et prédateur". Il ne tient qu'à nous de nous en protéger, via nos lois et les rapports de force technologiques dont nous sommes encore capables. Nous avons des législateurs, des universités et des banques, donc c'est théoriquement possible. Ne reste qu'à les faire collaborer dans le sens des intérêts européens... Nous en sommes loin, tant ces mondes sont souvent antagonistes sur le vieux continent, alors qu'ils sont très intégrés aux USA.
Heu, c'est évident pour tout le monde sauf moi la désignation "code d'infrastructure"? Ou "tâche d'infrastructure"? Ça cible quoi /quel niveau ? Le réseau lui même, les serveurs, les bdd (ou les projets de génie civil :-))?
Au début de l'article, je ne comprenais pas. Je croyais que l'intention était satirique:"Terorgram" ,ca me faisait penser aux nazis sur la face cachée de la lune comme dans un bon gros nanard du dimanche... L'impression persiste à la lecture, avec des protagonistes décérébrés faisant moultes références à la culture populaire entre Conan le barbare, Rambo, idiocracie et divers mangas. Et puis force est de constater que non, je me suis trompé. Un article de J. M. Manach en plus, c'est rarement de la godriole. C'est désespérant.
Et dire qu'une part tres significative de la population s'apprête à voter pour des partis dont l'imaginaire est largement partagé avec celui de ces "saints" (le grand remplacement étant publiquement revendiqué par certains de leurs représentants)... Je comprends pourquoi, mais ça ne pardonne pas. Nous nous en mordrons tous les doigts, moi compris pour n'avoir pas fait assez pour convaincre mes concitoyens de réfléchir autrement.
D'ailleurs, les "saints" me font penser que la distinction entre terrorisme religieux et idéologique évoquée en début d'article n'est absolument pas pertinente : l'imaginaire et le schéma dialectique sont pour grande partie identiques. (En tant qu'athé je considère que toute religion, même modérée et en accord avec les normes temporelles, est une idéologie politique. Mais c'est une opinion qui est loin de faire consensus, donc je limite l'analogie au champ de l'extrémisme politique et religieux)
C'est étrange, j'avais l'impression que les forces de l'ordre et le renseignement américain avaient beaucoup plus de l'attitude pour contrôler ce qu'ils veulent, quand ils le veulent. A la lecture de cet article, je me demande dans quelle mesure, ce n'est pas pas au contraire plus restrictif qu'en France par exemple. À l'étranger, ils font ce qu'ils veulent, mais sur leur sol ça a l'air bien cadré. Je n'arrive pas à me faire un avis. Un "simple" enquêteur et je France semble pouvoir faire pas mal de choses (cf. d'autres articles sur le sujet sur Next cette année).
Juste un commentaire sur le début de l'article : D'une, le satellite geostationnaire pour la data, c'est un peu has-been non ? Les constellations récentes sont en orbite basse avec une latence beaucoup plus faible. Après, est-ce qu'il y a beaucoup de données passant d'un satellite à l'autre pour faire de la longue distance, je ne crois pas. Le sat le plus proche communique probablement au relais terrestre le plus proche, et on repasse par câble.
De deux, il est à mon humble avis inconcevable aujourd'hui de faire passer une part significative du trafic par satellite. La bande passante totale d'une constellation est probablement bien plus fiable que celle d'un unique câble transatlantique récent (si ça a un sens, je ne suis pas sûr. C'est plutôt la bande passante de satellites de l'éphémèride à un temps T à un endroit donné qui compte).
Quelle débauche de technologie, alors qu'on peine à assurer les services de base à Mayotte (eau potable, déchet, énergie, sans parler de la scolarisation, de la santé ou encore l'accès à la justice) . J'entends que la surpopulation de l'île en grande partie due à à l'immigration irrégulière fait partie du problème, mais tout de même. Avec cet argent, combien de pompes, de kilomètres de tuyaux, de générateurs, d'écoles etc... Je ne dis pas qu'il ne faut rien faire pour réguler les arrivées, mais c'est tout de même obscène. Et puis, la prochaine étape c'est quoi ? Des mines sur les plages et des tourelles mitrailleuses sur l'ensemble de frontières extérieures de l' Europe ? Si les écarts de développement ne se réduisent pas, j'ai bien peur que nous y viendrons, et de notre vivant à nous commentateurs du soir.
Juste pour comprendre: Pourquoi une brève parue vendredi dernier réapparaît dans le Brief de ce lundi ? Il y a eu une mise à jour ? Si oui, ce serait bien de l'indiquer explicitement.
Un plugin WordPress peut valoir cession de la propriété intellectuelle du contenu d'un site ? C'est compatible avec le droit français ce genre de clause ? Si oui, j'en suis très étonné.
Sinon, de manière générale, les développeurs d'IA crawlent tout ce qu'ils trouvent pour alimenter leurs modèles non ? Du coup ils achètent donc des pseudo droits à divers partenaires uniquement pour diminuer leur exposition à des plaintes non ?
Je me rappelle plus, l'usine va faire exclusivement des batteries pour VE ou pas?
Sinon le terme gigafactory me fait tellement marrer, à chaque fois j'ai l'impression que c'est un gosse qui a trouvé le nom
Oui, très bien, mais entre l'extraction et la fabrication de batteries, il y a le raffinage. En gros l'étape la plus énergievore et qui produit le plus de coproduits (c.a.d des déchets pour la plupart). Au delà de la ressource minière, c'est c'est surtout sur le raffinage que nos amis chinois ont un quasi monopole. Et nous, on va raffiner où ?
que nenni : https://www.syntec.fr/convention-collective/obligations-militaires/#article-11-3
donc tous tes employeurs étaient hors des clous !
Franchement, je suis très étonné de lire ça. Merci pour le lien. Encien cadre d'un groupe de plusieurs milliers de personnes, dont un très large proportion de Cadres, c'était seconde pour tout le monde, quelque soit le trajet, sauf pour les pontes (train ou avion multi escales jusqu'à LlAutre bout du monde, et on voyageais beaucoup avant le Covid).
Incroyable. 3 million par jour. Est-ce que dans le csv, il est indiqué pour chaque cas: 1. s'il y a eu intervention humaine (si oui, ça peut être intéressant de voir si c'est signicatif, ou si comme je l'imagine l'écrasante majorité est purement du fait d'algorithmes) 2. s'il y des méta-données qui permettent de reconstruire un tant soit peu le contenu (titre, mots-clés, liens divers)
Sinon, l'intégration d'une vue Power-Bi, c'est facile à faire ? Si oui, sans 36 trackers Microsoft?
Hâte de découvrir vos prochains articles sur le sujet si les données sont intéressantes et réellement exploitables.
La décision vaut-elle jurisprudence pour la France ? Cf les multiples articles publiés ici sur la conservation des données biométriques par les ministères de l'intérieur et de la justice. Ça devrait être applicable à tout registre judiciaire en comportant, a fortiori pour des personnes non condamnées, voire simples témoins, ou même les victimes dans les affaires pénales.
Ça me rappelle les divers jeux concours de mon enfance (90s),pour lesquels on trouvait plusieurs présentoirs à la sortie des supermarchés, avec des formulaires à remplir (ou encore ceux des paquets de céréales pour recevoir des goodies à 3 centimes). Je comprend aujourd'hui que le business modèle était sûrement déjà celui le ciblage publicitaire (par courrier). Quelqu'un saurait confirmer ?
Je viens de jeter un œil : L'exécutable Windows fait plus de 200Mo ! Je n'ai pas regardé les sources, mais qu'est-ce qui peut bien justifier une telle obésité ?
Mais du coup, si ou parle bien ici de 2/3/4G, Starlink négocie / achette des licences pour des bande de fréquence pour chaque pays couvert ? Si oui, chaque satellite change de fréquence d'émission toutes les quelques minutes d'un pays à l'autre ?
Sur une réquisition validée par un juge, certainement. Puisque les écoutes sont déjà autorisées et pratiquées, je pense que c'est même déjà activement utilisé.
Et bien justement, en lisant l'article sur l'ex flic/ripoux Haurus cité dans l'article, j'ai l'impression que ce n'est pas si simple. Si l'enquêteur a déjà des cibles (sim ou EMAI), pas de problème. Mais rechercher des correspondances de trajectoires dans l'intégralité des donnés opérateurs toutes antennes confondues, je n'ai pas l'impression que ce soit possible (via la PNIJ en tout cas, c'est bien sûr possible théoriquement).
Le
18/12/2023 à
18h
34
Et en sinon France, ce serait légal pour les forces de l'ordre et/ou la justice de faire une telle demande? Sans aller jusqu'à la géo-localisation, les autorités peuvent elles demander aux opérateurs téléphoniques l'ensemble des SIM qui correspondent (via bornage) par exemple à l'itinéraire d'un suspect reconstitué sur la base d'autres indications?
La simulation Nano-GPT est très impressionnante (sur la forme, animations 3D pertinentes, explications textuelles en parallèle). C'est bien expliqué, compréhensible si on a un bagage de maths post bac (je ne prétend pas avoir tout compris). Mais il ne s'agit ici que de l'interrogation du modèle, pas de l'entrainement qui semble être le nerf de la guerre : En bref, on constate que pour un simple tri alphabétique de 5 caractères, des milliers de multiplications, quelques centaines de passage à l'exponentielle et au logarithme sont nécessaire (même si j'imagine qu'ils ont des implémentations simplifiés et très efficaces pour ces fonctions), ce qui doit nécessiter des dizaines de milliers de fois plus de cycles de processeurs qu'une simple implémentation d'un algo de tri basique.
L'exemple est certes trivial, mais ca nous rappelle quand même que pour le bien de tous (bilan énergétique global entre autres), mieux vos apprendre les maths, apprendre à coder des choses simples correspondant à nos usages de bases, plutôt que de demander une réponse prémâchée à un oracle dont on ne sait pas grand chose.
En somme, il faudrait réserver leur usage à l'analyse de donnée inapprochables par méthodes d'analyse conventionnelles (mon petit doit me dit que moins de 0.1% de la population a de tels besoins), voire éventuellement (c'est triste) aux travaux créatifs...
Genre, le truc qu'on vient de réglementer et qui s'est fortement réduit ? (à tel point qu'une petite partie du réchauffement récent peut être attribué à la réduction du souffre dans l'atmosphère).
Si on se consentre sur l'impact en équivalent CO2, le transport maritime est imbattable. Le rapport poid puissance d'un navire est sans commune mesure avec tous autre moyen de transport. À la tonne kilomètres, il n'y a pas photo. Reste que paradoxalement, si le transport maritime est l'un des "moins urgent" à decarboner car déjà comparativement vertueux, c'est l'un des plus simple pour un passage à l'échelle industrielle (on peut emporter de très grosses batteries pas trop chères, au sodium par exemple, au sodium de plusieurs dizaines de milliers de tonnes si besoin. Le segment motorisation de forte puissance existe déjà.)
C'est vachement bien la CNIL tout de même. Dommage qu'elle ne puisse emmetre que des recommandations. J'imagine assez bien qu'un ministre de poid puisse demander à son administration de s'asseoir dessus. En gros, il faudrait que la CNIL ait un réel pouvoir normatif, à tout le moins sur la donnée gérée par des entités publiques.
Actuellement, ça ne semble pas trop le cas. Par exemple Aluminium Dunkerque et OVH sont installés à côté de la centrale nucléaire (mais vraiment juste à côté), pas du tout là où il y a du solaire ou des éoliennes.
Peut importe (ou alors marginalemant) où le consommateur est implanté. Le réseau étant très fortement interconecté, tu peux être implanté à côté d'un réacteur nucléaire, et avoir un contrat "au surplus", la puissance de base étant consommée par d'autres (les habitants par exemple).
Très bien le dessin bonus, très bien vu. Sur la forme, le style est différent, ça me fait penser à Sempé pour les personnages, à Blain pour le décor (le parquet n’est qu’un simple zigzag, efficace, une épure pour ne pas surcharger). Sinon J’aime aussi cette sobriété monochrome, plus proche du dessin de presse.
Ça va probablement dans le bon sens, mais selon le rapport annuel 2022 ici. A comparer à 12000 plaintes. J’imagine aisément que la majorité des plaintes se concentrent sur un petit nombre de gros acteurs, et que toutes les plaintes ne sont pas forcément légitimes. Mais tout de même, je ne sais pas quels sont les moyens humains et financiers de la CNIL, mais ça reste très faible. Il faut investir (au delà de du bien fondé de l’action de la CNIL pour la protection des citoyens, ça rapporte 100M€ par ans, soit probablement bien plus que ce que ça ne coûte)
Mon humble avis, c’est que techniquement, c’est très compliqué de s’assurer que telle ou telle donnée, ou référence aux dites données ne font pas partie d’un jeu de donnée, sans pouvoir qualifier très précisément la donnée, ce que les aillants droit ne souhaitent pas faire. Au delà de ça, je crois comprendre qu’il est techniquement impossible, sur un modèle déjà entraîné, de retirer ou exclure une part des informations pour générer des résultats (la donnée en elle même n’existant plus que sous forme de vecteur statistiques inintelligible pour l’humain.). Comme les modèles sont itératifs, les anciens nourrissant ou servant à calibrer les nouveaux, ce problème semble insoluble sauf à repartir d’une page blanche à chaque requête de retrait, ce qui, étant donnés les coûts d’entraînement, est insoutenable économiquement. Du coup, la seule solution restante, c’est le post traitement des résultats (avec une autre IA ? ) pour qualifier statistiquement la similitude avec des données sous copyright. Ce sera évidemment sujet à interprétation.–> Beaucoup d’argent à venir pour les futurs cabinets d’avocat spécialisés ?
Depuis le boom médiatique de l’IA avec l’émergence des produits grand public type Chat GPT. ce que je ne comprends pas, c’est en quoi c’est fondamentalement différent de ce qui était dispo avant, depuis une dizaine d’années avec les assistants vocaux (Siri, Google assistant et Alexa, voire Cortana)? Je comprend que certaines de leur fonctions phares sont codées en dur (“joue tel titre” , “éteint la lumière” etc.). Mais pour toutes les autres, l’aspect pseudo conversationnel, c’était bien déjà basé sur du deeplearning et reinforced learning non? A part la taille des modèles, qu’est ce qui provoque le changement de paradigme ? Pourquoi Apple et Amazon sont considérés en retard sur leur concurrents. Tout le monde utilise bien peu ou prou les mêmes méthodes, et l’algorithmique derrière est un sujet académique qui bien que très complexe est globalement non secret non?
Ça fait beaucoup de questions, mais je crois que j’ai une bonne chance de trouver quelqu’un qui sait à peu près de quoi il parle ici.
+1 Si les journalistes sont charrette (ou gueule de bois si la soirée s’est éternisée) , j’invite modestement mes comparses impatiens qui auraient pris le temps de regarder à nous faire quelques bullets points (en toute subjectivité) en commentaire , car pour l’instant, le lecteur lambda mais fidèle que je suis ne sais RIEN… Merci par avance pour votre impactitude.
Super article. Merci pour tous les liens. J’ai lu celui d’Olivier Rioul, super intéressant (j’imagine que c’est le b.a. ba pour tout étudiant en informatique ou télécom, mais c’est neuf pour moi). Reste à lire tous les autres…
Au delà de l’aspect politique, je suis très surpris que ces ONG / sociétés se targent d’avoir développé des solutions d’IA permettant la détection automatique de contenu illicite. Si comme la plus part des modèles actuels, ces IA sont assises sur des formes de deeplearning ou apprentissage renforcé, il faut des bases d’entraînement et de test. Or dans la plus part des pays occidentaux, la simple possession d’image à caractère pédopornographique est interdite. Comment font-ils (s’il le font vraiment)?
Pour revenir au simulateur, l’ADEME précise un certain nombre d’hypothèses de transport, notemment le taux de remplissage moyen des camions entre les différents plateformes logistiques: entre 15 et 20%… Ça me paraît très bas (sauf éventuellement pour l’étape de livraison à domicile). Il aurait été intéressant d’avoir un résumé final de la part de chaque composante (transport routier, emballage, stockage) dans le bilan carbone complet.
Je sais que l’utilisation d’un IA nécessite boucoup moins de computations que celles nécessaires à son entraînement. N’empêche, résoudre un CaptaCha (ou équivalent), ça ne doit pas être négligeable en coût (pour faire du scraping ou du deni de service à coup de dizaines de milliers de requêtes par secondes ). Pour moi, la question pertinente, ce n’est pas est-ce qu’une IA peut résoudre rapidement un vulgaire test de CaptaCha, on se doute bien qu’elle sait déjà le faire très rapidement étant données les tâches bien plus complexe qu’elle “résout”. Mais est-ce à coût marginal ?
OK, mais le bornage à une antenne X ou Y n’est pas un élément de facturation n’est-ce pas ?
Le
11/08/2023 à
19h
15
Pour les traces Email je comprends (Google logue toutes les IPs d’utilisation ? sur 10ans ?) mais pour les bornages je suis étonné que les opérateurs conserve tous les bornage sur des durées pareille. Ça en fait des données par terminal et par opérateur ! Quelqu’un sait si c’est pareil en France ? J’en étais resté aux seules fadettes (liste des numéros appelés).
Enfin quelqu’un qui tient ce genre de propos! Je suis pour le local dans l’absolu, et je suis convaincu qu’une forme de décroissance s’imposera tôt ou tard (soit par le consommateur épris de sobriété, soit par la loi si nous trouvons un consensus dans un monde merveilleux, soit à terme par la guerre). Mais produire près de chez soit, OK, si et seulement si l’impact global n’est pas significativement plus sévère. Un champ, une mine, un parc éolien, c’est délocalisable, mais jamais à rendement égal. En imaginant la paix dans le monde et un gouvernement mondial avec les mêmes normes enviromentales et sociales partout, pas sûr qu’il soit pertinent de réduire significativement les transports, mais plutôt de spécialiser les productions sur les critères géographiques et physiques donnés. Un peu comme aujourd’hui en somme mais en beaucoup mieux.
Idem, merci pour le lien. Je ne connaissais pas ce Ploum, et c’est très rafraîchissant ! Je conseille la retranscription de sa dernière “conférence” ici. Ça résume bien sa pensé.
Je suis étrangement peu impressionné. Soit on ne voit que le tout petit sommet de l’iceberg, soit ce Xandr est très en retard. Ou alors c’est un marché spécifique pour l’achat de pannel pour des usages spécifiques au 20 ème siècle. Ce que je veux dire par là c’est que j’imagine très aisément que Google, par exemple, possède pour chacuns des utilisateurs, un vecteur de dimmenssion X contenant des milliers de sous paramètres qui part inférence peuvent lui permettre de faire un ciblage très largement plus fin que des grandes catégories (par exemple métier lieux visités les x derniers mois intérêt pour les meubles art déco possède un smartphone de moins de plus de 2 ans utilise un VPN possède un compte utilisateur sur le site Tartempion adore Maria Carrey a déménagé il y a moins de 2 mois grand mère à moustache * je m’arrête là). En tout cas, je ne vois rien qui techniquement empêcherait gg d’obtenir ce genre de dataset pour un utilisateur moyen de ces services, soit une grande partie de la population européenne. Ce que je comprends, c’est que google ne vend pas ces données, mais il peut proposer un ciblage publicitaire de ce niveau là, n’est ce pas ?
Idem, félicitations pour cet article. Mme Saliou nous offre depuis son arrivée une sélection de sujets qui donne tout son sel à la ligne éditoriale déjà si particulière de NextImpact. Merci.
Une question: En France, un particulier ou une personne morale qui achèterait auprès d’un brocker par exemple des données nominatives de géo-localisation liées à un lieu de culte et/ou un centre d’accueil LGBT, serait il condamnable du simple fait de l’interdiction de constituer (si j’ai bien compris) des bases de données basées sur l’orientation sexuelle ou religieuse ?
ce jeu d’apprentissage est uniquement basée sur ce qu’on trouve sur le Net, qui lui même est fortement non représentatif de la réalité,
Comme le note Carbier, l’IA génère une représentation de nos représentations (au final, en exagérant un peu, le Web n’est le support que d’une seule activité humaine: la communication). Sur une liste de biais principalement visuels types (couleur de peau, sexe apparant), il m’apparaît relativement simple techniquement de totalement débiaiser. Dans les banques de données taguées humainement ou par un autre modèle, j’imagine que sexe et couleur de peau sont des attributs systématiquement renseignés ou renseignables. Du coup ou pourrait “forcer” Le générateur à produire des images 51%/49% femme /homme ou en proportion des couleurs de peaux mondiale tant que le prompt de l’utilisateur ne les specifie pas. La seule chose à modifier serait l’interpretateur de prompt utilisateur, relativement simple à faire sur quelques biais de base.
C’est un choix technique à faire (voire législatif demain pour les plateformes B2C ?) et donc c’est politique.
Je ne dis pas qu’il faut le faire (dessine moi un pygmé-> voici un indien avec une lance et une toje). C’est assez utile par exemple pour prendre conscience de nos biais de représentation, qui pour la quasi totalité nous restent inaccessibles.
Je ne suis pas sûr que ça soit un problème. Je pense que, au-delà de l’aspect intéressant de l’exercice, identifier qu’un texte provient d’une IA ne sert à rien. Et idem pour les montages photos / vidéos.
Tout ça était déjà possible auparavant. Il suffit de se souvenir de https://fakirpresse.info/moi-journaliste-fantome-au-service-des-lobbies pour voir que la production par un humain n’est pas un critère de qualité. La seule chose qu’on change, c’est le prix : ça devient encore moins cher de générer du pipeau et des images bidonnées. Mais que ça soit bidonné par une IA ou un humain, ça reste juste des articles ou images bidons. Ça fait effectivement une différence pour la vidéo, mais pour le texte ou les photos ce n’était déjà pas très cher.
La période va être un peu compliquée dans les prochains temps, le temps que les gens comprennent qu’une photo ou une vidéo n’a plus aucune valeur de preuve – je pense d’ailleurs que les vendeurs de solutions vidéo de « sécurité » devraient travailler sur des signatures cryptographiques pour authentifier leurs vidéos). Mais après ça, on s’adaptera. Il y aura même peut-être des effets positifs (le chantage à la sextape dans un monde de deepfakes, ça doit marcher beaucoup moins bien…)
Excellent contre-point. Merci pour l’article ! Quand à Olivia Grégoire, c’est étonnant qu’elle ne se soit pas fait allumé par la vraie presse (ou alors j’ai loupé un épisode).
Au delà de l’intérêt et de la démarche, largement discutable (en terme de réponse proportionnée à un problème bien réel qui n’a pas attendu les NTC pour exister), je m’interroge sur la faisabilité technique. Internet étant ce qu’il est, comment serait-il possible d’empêcher concrètement un échange chiffré de bout en bout ? Sauf à analyser en temps réel tout les flux de données transitant par L’UE, en supposant qu’on puisse détecter instantanément toute donnée chiffrée, la seule solution serait d’instaurer une gigantesque blacklist européenne blanquant tout échange depuis ou vers les dites IP / serveur ? J’ai bon ? Même avec l’ip v6, on serait rapidement dépourvu non ?
@Jean-Marc, Le “Hasard ou coïncidence” semble sarcastique. Tu sous-entends que qu’Idemia aurait pu, très fortuitement bien sûr, assister directement le ministère pour la rédaction du CCTP ? C’est assez courant, mais en l’espèce, dans les procédures de marché public en France, c’est autorisé sous réserve d’exclusion automatique de “l’aidant”, dont le rôle d’AMO est ainsi constitué de fait, pour le dit marché qu’il a participé à spécifier.
Bien sûr, ceux qui montent le marché coté ministère peuvent faire du sourcing auprès d’un panel de soumissionnaires potentiels, de manière formalisée (RFI par exemple) ou non, c’est légal. Mais demander à un attributaire pressenti de fournir des specifications techniques pour que ce dernier soit (seul) dans les cordes et que tout roule, c’est à minima amoral.
Sinon, pour les marchés de travaux publics, au delà d’un certain montant, à minima 3 soumissionnaires doivent remettre des offres conformes pour que l’appel d’offre puisse aboutir à une attribution de marché. D’après ce qu’indique le début de l’article, ca risque d’être difficile ici non ? J’imagine que le ministère de l’intérieur bénéficie de procédures d’attribution plus souples que d’autres maîtres d’ouvrages. A creuser ?
Très Intéressant. Merci Glandos. Mais en pratique, un Hash sur une machine moderne, n’est-il pas limité par la vitesse de lecture des données sur disque ou SSD plutôt que l’algo lui même sur CPU ou GPU ? (C’est une vrai question).
J’avais cru comprendre qu’un Hash, c’était en gros des sommes de bits particulières calculées modulo un très grand nombre premier. La somme pouvait se faire en temps réel au cours de lecture séquentielle des données, restait quelques divisions, qui si grand soit le nombre à diviser, ne nécessitent que “quelques” cycles d’horloges, soit bien moins que le temps de lire un gros fichiers à hasher (sauf pour un très petit fichier).
J’avais du mal comprendre apparemment. Tu saurais m’expliquer ?
161 commentaires
Epic condamnée à 1,1 million d’euros pour avoir poussé les enfants à acheter dans Fortnite
14/05/2024
Le 14/05/2024 à 20h 06
N'empêche, réussir à vendre pour 26 milliards de dollars de skins, statistiques d'armes et autres mouvements de danse virtuels (enfin j'imagine que c'est ce dont il s'agit), chapeau bas... Le niveau de rentabilité doit être dingue ! Je sais, il faut créer le jeu au départ (mais Fortnite n'est pas forcément une vitrine technologique ni une révolution en terme de game art...) faire tourner quelques serveurs, et surtout payer la pub (probablement le budget principal), mais quand même, il doit rester pas mal de sous à la fin.L'économie de la vanité (et non celle du divertissement, on peut s'amuser sur Fortnite sans rien payer si je comprends bien) est veille comme le monde, mais on atteint ici un niveau sidérant.
Les États-Unis auraient étendu l’obligation de surveillance (FISA) aux data centers
13/05/2024
Le 13/05/2024 à 21h 30
Microsoft dévoile Infra Copilot, spécialisé dans le code d’infrastructure
29/04/2024
Le 29/04/2024 à 20h 59
Heu, c'est évident pour tout le monde sauf moi la désignation "code d'infrastructure"? Ou "tâche d'infrastructure"? Ça cible quoi /quel niveau ? Le réseau lui même, les serveurs, les bdd (ou les projets de génie civil :-))?Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts
24/04/2024
Le 24/04/2024 à 23h 26
Au début de l'article, je ne comprenais pas. Je croyais que l'intention était satirique:"Terorgram" ,ca me faisait penser aux nazis sur la face cachée de la lune comme dans un bon gros nanard du dimanche... L'impression persiste à la lecture, avec des protagonistes décérébrés faisant moultes références à la culture populaire entre Conan le barbare, Rambo, idiocracie et divers mangas. Et puis force est de constater que non, je me suis trompé. Un article de J. M. Manach en plus, c'est rarement de la godriole. C'est désespérant.Et dire qu'une part tres significative de la population s'apprête à voter pour des partis dont l'imaginaire est largement partagé avec celui de ces "saints" (le grand remplacement étant publiquement revendiqué par certains de leurs représentants)... Je comprends pourquoi, mais ça ne pardonne pas. Nous nous en mordrons tous les doigts, moi compris pour n'avoir pas fait assez pour convaincre mes concitoyens de réfléchir autrement.
D'ailleurs, les "saints" me font penser que la distinction entre terrorisme religieux et idéologique évoquée en début d'article n'est absolument pas pertinente : l'imaginaire et le schéma dialectique sont pour grande partie identiques. (En tant qu'athé je considère que toute religion, même modérée et en accord avec les normes temporelles, est une idéologie politique. Mais c'est une opinion qui est loin de faire consensus, donc je limite l'analogie au champ de l'extrémisme politique et religieux)
Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat
15/04/2024
Le 15/04/2024 à 23h 16
C'est étrange, j'avais l'impression que les forces de l'ordre et le renseignement américain avaient beaucoup plus de l'attitude pour contrôler ce qu'ils veulent, quand ils le veulent. A la lecture de cet article, je me demande dans quelle mesure, ce n'est pas pas au contraire plus restrictif qu'en France par exemple. À l'étranger, ils font ce qu'ils veulent, mais sur leur sol ça a l'air bien cadré. Je n'arrive pas à me faire un avis. Un "simple" enquêteur et je France semble pouvoir faire pas mal de choses (cf. d'autres articles sur le sujet sur Next cette année).Le réchauffement climatique redessine la carte des câbles sous-marins pour Internet
04/04/2024
Le 04/04/2024 à 17h 02
Juste un commentaire sur le début de l'article :D'une, le satellite geostationnaire pour la data, c'est un peu has-been non ? Les constellations récentes sont en orbite basse avec une latence beaucoup plus faible. Après, est-ce qu'il y a beaucoup de données passant d'un satellite à l'autre pour faire de la longue distance, je ne crois pas. Le sat le plus proche communique probablement au relais terrestre le plus proche, et on repasse par câble.
De deux, il est à mon humble avis inconcevable aujourd'hui de faire passer une part significative du trafic par satellite. La bande passante totale d'une constellation est probablement bien plus fiable que celle d'un unique câble transatlantique récent (si ça a un sens, je ne suis pas sûr. C'est plutôt la bande passante de satellites de l'éphémèride à un temps T à un endroit donné qui compte).
Mayotte va ériger un « rideau de fer » de technologies civilo-militaires de surveillance
19/03/2024
Le 19/03/2024 à 22h 49
Quelle débauche de technologie, alors qu'on peine à assurer les services de base à Mayotte (eau potable, déchet, énergie, sans parler de la scolarisation, de la santé ou encore l'accès à la justice) . J'entends que la surpopulation de l'île en grande partie due à à l'immigration irrégulière fait partie du problème, mais tout de même. Avec cet argent, combien de pompes, de kilomètres de tuyaux, de générateurs, d'écoles etc... Je ne dis pas qu'il ne faut rien faire pour réguler les arrivées, mais c'est tout de même obscène.Et puis, la prochaine étape c'est quoi ? Des mines sur les plages et des tourelles mitrailleuses sur l'ensemble de frontières extérieures de l' Europe ? Si les écarts de développement ne se réduisent pas, j'ai bien peur que nous y viendrons, et de notre vivant à nous commentateurs du soir.
Altice va vendre Altice Media (BFM, RMC) à CMA CGM, pour 1,55 milliard d’euros
15/03/2024
Le 18/03/2024 à 12h 32
Juste pour comprendre: Pourquoi une brève parue vendredi dernier réapparaît dans le Brief de ce lundi ? Il y a eu une mise à jour ? Si oui, ce serait bien de l'indiquer explicitement.GPU et IA (générative) : des annonces tous azimuts sur la HBM3E
11/03/2024
Le 11/03/2024 à 16h 18
Il faudrait Jacquouille vienne visiter le 21 ème siècle : 2To/s et par puce, c'est dingue ![Màj] Vente des contenus d’Automattic à MidJourney et OpenAI : JetPack non concerné
29/02/2024
Le 28/02/2024 à 22h 11
Un plugin WordPress peut valoir cession de la propriété intellectuelle du contenu d'un site ? C'est compatible avec le droit français ce genre de clause ? Si oui, j'en suis très étonné.Sinon, de manière générale, les développeurs d'IA crawlent tout ce qu'ils trouvent pour alimenter leurs modèles non ? Du coup ils achètent donc des pseudo droits à divers partenaires uniquement pour diminuer leur exposition à des plaintes non ?
Lithium de France obtient un quatrième permis pour creuser en Alsace
22/02/2024
Le 23/02/2024 à 08h 15
Licenciements : les employés se filment, les managers protestent
21/02/2024
Le 22/02/2024 à 10h 29
Suivre au quotidien la modération des très grandes plateformes listées par le DSA
06/02/2024
Le 06/02/2024 à 19h 55
Incroyable. 3 million par jour. Est-ce que dans le csv, il est indiqué pour chaque cas:1. s'il y a eu intervention humaine (si oui, ça peut être intéressant de voir si c'est signicatif, ou si comme je l'imagine l'écrasante majorité est purement du fait d'algorithmes)
2. s'il y des méta-données qui permettent de reconstruire un tant soit peu le contenu (titre, mots-clés, liens divers)
Sinon, l'intégration d'une vue Power-Bi, c'est facile à faire ? Si oui, sans 36 trackers Microsoft?
Hâte de découvrir vos prochains articles sur le sujet si les données sont intéressantes et réellement exploitables.
CJUE : la police ne peut pas conserver les données biométriques de tous les condamnés
31/01/2024
Le 01/02/2024 à 07h 59
La décision vaut-elle jurisprudence pour la France ? Cf les multiples articles publiés ici sur la conservation des données biométriques par les ministères de l'intérieur et de la justice. Ça devrait être applicable à tout registre judiciaire en comportant, a fortiori pour des personnes non condamnées, voire simples témoins, ou même les victimes dans les affaires pénales.Le courtier en données Tagadamedia écope d’une amende de 75 000 euros par la CNIL
30/01/2024
Le 30/01/2024 à 21h 26
Ça me rappelle les divers jeux concours de mon enfance (90s),pour lesquels on trouvait plusieurs présentoirs à la sortie des supermarchés, avec des formulaires à remplir (ou encore ceux des paquets de céréales pour recevoir des goodies à 3 centimes). Je comprend aujourd'hui que le business modèle était sûrement déjà celui le ciblage publicitaire (par courrier).Quelqu'un saurait confirmer ?
Le CEPD propose un outil d’audit de sites web
30/01/2024
Le 30/01/2024 à 10h 15
Je viens de jeter un œil : L'exécutable Windows fait plus de 200Mo ! Je n'ai pas regardé les sources, mais qu'est-ce qui peut bien justifier une telle obésité ?2024, début du direct-to-cell pour Starlink
05/01/2024
Le 06/01/2024 à 13h 56
Mais du coup, si ou parle bien ici de 2/3/4G, Starlink négocie / achette des licences pour des bande de fréquence pour chaque pays couvert ?Si oui, chaque satellite change de fréquence d'émission toutes les quelques minutes d'un pays à l'autre ?
Google ne répondra plus aux demandes légales de géolocalisation inversée
18/12/2023
Le 19/12/2023 à 22h 46
Le 18/12/2023 à 18h 34
Et en sinon France, ce serait légal pour les forces de l'ordre et/ou la justice de faire une telle demande?Sans aller jusqu'à la géo-localisation, les autorités peuvent elles demander aux opérateurs téléphoniques l'ensemble des SIM qui correspondent (via bornage) par exemple à l'itinéraire d'un suspect reconstitué sur la base d'autres indications?
653e édition des LIDD : Liens Intelligents Du Dimanche
17/12/2023
Le 17/12/2023 à 20h 20
La simulation Nano-GPT est très impressionnante (sur la forme, animations 3D pertinentes, explications textuelles en parallèle). C'est bien expliqué, compréhensible si on a un bagage de maths post bac (je ne prétend pas avoir tout compris). Mais il ne s'agit ici que de l'interrogation du modèle, pas de l'entrainement qui semble être le nerf de la guerre :En bref, on constate que pour un simple tri alphabétique de 5 caractères, des milliers de multiplications, quelques centaines de passage à l'exponentielle et au logarithme sont nécessaire (même si j'imagine qu'ils ont des implémentations simplifiés et très efficaces pour ces fonctions), ce qui doit nécessiter des dizaines de milliers de fois plus de cycles de processeurs qu'une simple implémentation d'un algo de tri basique.
L'exemple est certes trivial, mais ca nous rappelle quand même que pour le bien de tous (bilan énergétique global entre autres), mieux vos apprendre les maths, apprendre à coder des choses simples correspondant à nos usages de bases, plutôt que de demander une réponse prémâchée à un oracle dont on ne sait pas grand chose.
En somme, il faudrait réserver leur usage à l'analyse de donnée inapprochables par méthodes d'analyse conventionnelles (mon petit doit me dit que moins de 0.1% de la population a de tels besoins), voire éventuellement (c'est triste) aux travaux créatifs...
Voitures électriques : dans la jungle, terrible jungle, des bornes de recharge publiques
06/12/2023
Le 07/12/2023 à 22h 50
Reste que paradoxalement, si le transport maritime est l'un des "moins urgent" à decarboner car déjà comparativement vertueux, c'est l'un des plus simple pour un passage à l'échelle industrielle (on peut emporter de très grosses batteries pas trop chères, au sodium par exemple, au sodium de plusieurs dizaines de milliers de tonnes si besoin. Le segment motorisation de forte puissance existe déjà.)
La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes
05/12/2023
Le 06/12/2023 à 17h 54
C'est vachement bien la CNIL tout de même. Dommage qu'elle ne puisse emmetre que des recommandations. J'imagine assez bien qu'un ministre de poid puisse demander à son administration de s'asseoir dessus.En gros, il faudrait que la CNIL ait un réel pouvoir normatif, à tout le moins sur la donnée gérée par des entités publiques.
Hébergeurs, éditeurs, espaces de conversation ? La difficile régulation des réseaux sociaux
23/11/2023
Le 25/11/2023 à 15h 25
Rien à voir avec l'article, mais à partir de ce point du fil de commentaires, le texte déborde à droite du cadre (Webkit, Android).Silicium : un matériau indispensable et omniprésent, mais critique
23/11/2023
Le 23/11/2023 à 22h 27
#Flock fait son petit commerce et refourgue, lui aussi, sa came
18/11/2023
Le 18/11/2023 à 14h 50
Très bien le dessin bonus, très bien vu.
Sur la forme, le style est différent, ça me fait penser à Sempé pour les personnages, à Blain pour le décor (le parquet n’est qu’un simple zigzag, efficace, une épure pour ne pas surcharger). Sinon J’aime aussi cette sobriété monochrome, plus proche du dessin de presse.
Retour des humains sur la Lune : Artemis I décollait il y a un an, Artemis II doit décoller dans un an
17/11/2023
Le 17/11/2023 à 09h 43
LOL, la combinaison est développé en partenariat avec Prada !! Le sponsoring n’a de limite que notre imagination désormais.
La CNIL inflige 10 « sanctions simplifiées » suite à de « nombreuses plaintes »
08/11/2023
Le 08/11/2023 à 17h 21
Ça va probablement dans le bon sens, mais selon le rapport annuel 2022 ici. A comparer à 12000 plaintes. J’imagine aisément que la majorité des plaintes se concentrent sur un petit nombre de gros acteurs, et que toutes les plaintes ne sont pas forcément légitimes. Mais tout de même, je ne sais pas quels sont les moyens humains et financiers de la CNIL, mais ça reste très faible.
Il faut investir (au delà de du bien fondé de l’action de la CNIL pour la protection des citoyens, ça rapporte 100M€ par ans, soit probablement bien plus que ce que ça ne coûte)
L’outil pour retirer des données personnelles de l’entraînement des IA de Meta ne fonctionne pas
30/10/2023
Le 30/10/2023 à 09h 27
Mon humble avis, c’est que techniquement, c’est très compliqué de s’assurer que telle ou telle donnée, ou référence aux dites données ne font pas partie d’un jeu de donnée, sans pouvoir qualifier très précisément la donnée, ce que les aillants droit ne souhaitent pas faire.
Au delà de ça, je crois comprendre qu’il est techniquement impossible, sur un modèle déjà entraîné, de retirer ou exclure une part des informations pour générer des résultats (la donnée en elle même n’existant plus que sous forme de vecteur statistiques inintelligible pour l’humain.).
Comme les modèles sont itératifs, les anciens nourrissant ou servant à calibrer les nouveaux, ce problème semble insoluble sauf à repartir d’une page blanche à chaque requête de retrait, ce qui, étant donnés les coûts d’entraînement, est insoutenable économiquement.
Du coup, la seule solution restante, c’est le post traitement des résultats (avec une autre IA ? ) pour qualifier statistiquement la similitude avec des données sous copyright. Ce sera évidemment sujet à interprétation.–> Beaucoup d’argent à venir pour les futurs cabinets d’avocat spécialisés ?
Apple investirait 1 milliard de dollars par an pour revenir dans la course à l’IA
24/10/2023
Le 24/10/2023 à 12h 30
Depuis le boom médiatique de l’IA avec l’émergence des produits grand public type Chat GPT. ce que je ne comprends pas, c’est en quoi c’est fondamentalement différent de ce qui était dispo avant, depuis une dizaine d’années avec les assistants vocaux (Siri, Google assistant et Alexa, voire Cortana)?
Je comprend que certaines de leur fonctions phares sont codées en dur (“joue tel titre” , “éteint la lumière” etc.). Mais pour toutes les autres, l’aspect pseudo conversationnel, c’était bien déjà basé sur du deeplearning et reinforced learning non?
A part la taille des modèles, qu’est ce qui provoque le changement de paradigme ?
Pourquoi Apple et Amazon sont considérés en retard sur leur concurrents. Tout le monde utilise bien peu ou prou les mêmes méthodes, et l’algorithmique derrière est un sujet académique qui bien que très complexe est globalement non secret non?
Ça fait beaucoup de questions, mais je crois que j’ai une bonne chance de trouver quelqu’un qui sait à peu près de quoi il parle ici.
Réduire son empreinte environnementale numérique, « c’est comme le tri sélectif : il faut le faire, point barre »
23/10/2023
Le 23/10/2023 à 15h 08
Merci de m’avoir appris quelque chose aujourd’hui. L’article wiki est très accessible (en français)
Replay de la soirée de Next
17/10/2023
Le 17/10/2023 à 13h 29
+1
Si les journalistes sont charrette (ou gueule de bois si la soirée s’est éternisée) , j’invite modestement mes comparses impatiens qui auraient pris le temps de regarder à nous faire quelques bullets points (en toute subjectivité) en commentaire , car pour l’instant, le lecteur lambda mais fidèle que je suis ne sais RIEN… Merci par avance pour votre impactitude.
Les modèles de langage sont de redoutables outils de compression sans perte
03/10/2023
Le 03/10/2023 à 20h 13
Super article. Merci pour tous les liens. J’ai lu celui d’Olivier Rioul, super intéressant (j’imagine que c’est le b.a. ba pour tout étudiant en informatique ou télécom, mais c’est neuf pour moi). Reste à lire tous les autres…
Les discrets lobbyistes états-uniens de la proposition de surveillance des messageries chiffrées
28/09/2023
Le 29/09/2023 à 14h 12
Au delà de l’aspect politique, je suis très surpris que ces ONG / sociétés se targent d’avoir développé des solutions d’IA permettant la détection automatique de contenu illicite. Si comme la plus part des modèles actuels, ces IA sont assises sur des formes de deeplearning ou apprentissage renforcé, il faut des bases d’entraînement et de test. Or dans la plus part des pays occidentaux, la simple possession d’image à caractère pédopornographique est interdite. Comment font-ils (s’il le font vraiment)?
Deezer augmente ses tarifs
25/09/2023
Le 25/09/2023 à 20h 42
Tu peux nous en dire un peu plus ? La BNF ?
ADEME : un simulateur pour « mesurer l’impact carbone de la livraison de colis »
22/09/2023
Le 22/09/2023 à 14h 54
Pour revenir au simulateur, l’ADEME précise un certain nombre d’hypothèses de transport, notemment le taux de remplissage moyen des camions entre les différents plateformes logistiques: entre 15 et 20%… Ça me paraît très bas (sauf éventuellement pour l’étape de livraison à domicile).
Il aurait été intéressant d’avoir un résumé final de la part de chaque composante (transport routier, emballage, stockage) dans le bilan carbone complet.
Firefox 117 disponible avec peu de nouveautés
30/08/2023
Le 30/08/2023 à 13h 23
Intéressant comme syntaxe, ça allège beaucoup le CSS de fait. Savez vous si Webkit et Blink supportent également le CSS nesting?
CAPTCHA : les machines « prouvent » plus rapidement qu’elles sont des humains
22/08/2023
Le 22/08/2023 à 16h 23
Je sais que l’utilisation d’un IA nécessite boucoup moins de computations que celles nécessaires à son entraînement. N’empêche, résoudre un CaptaCha (ou équivalent), ça ne doit pas être négligeable en coût (pour faire du scraping ou du deni de service à coup de dizaines de milliers de requêtes par secondes ). Pour moi, la question pertinente, ce n’est pas est-ce qu’une IA peut résoudre rapidement un vulgaire test de CaptaCha, on se doute bien qu’elle sait déjà le faire très rapidement étant données les tâches bien plus complexe qu’elle “résout”. Mais est-ce à coût marginal ?
Un tueur en série confondu par ses traces numériques, téléphoniques et bancaires
11/08/2023
Le 12/08/2023 à 07h 06
OK, mais le bornage à une antenne X ou Y n’est pas un élément de facturation n’est-ce pas ?
Le 11/08/2023 à 19h 15
Pour les traces Email je comprends (Google logue toutes les IPs d’utilisation ? sur 10ans ?) mais pour les bornages je suis étonné que les opérateurs conserve tous les bornage sur des durées pareille. Ça en fait des données par terminal et par opérateur ! Quelqu’un sait si c’est pareil en France ? J’en étais resté aux seules fadettes (liste des numéros appelés).
Waymo met en pause son développement de camions autonomes
28/07/2023
Le 28/07/2023 à 16h 39
Enfin quelqu’un qui tient ce genre de propos! Je suis pour le local dans l’absolu, et je suis convaincu qu’une forme de décroissance s’imposera tôt ou tard (soit par le consommateur épris de sobriété, soit par la loi si nous trouvons un consensus dans un monde merveilleux, soit à terme par la guerre). Mais produire près de chez soit, OK, si et seulement si l’impact global n’est pas significativement plus sévère. Un champ, une mine, un parc éolien, c’est délocalisable, mais jamais à rendement égal. En imaginant la paix dans le monde et un gouvernement mondial avec les mêmes normes enviromentales et sociales partout, pas sûr qu’il soit pertinent de réduire significativement les transports, mais plutôt de spécialiser les productions sur les critères géographiques et physiques donnés. Un peu comme aujourd’hui en somme mais en beaucoup mieux.
Pourquoi 69 % des RSSI français auraient-ils interdit l’utilisation de WhatsApp ?
20/07/2023
Le 21/07/2023 à 11h 25
?? C’est vraiment possible ça ? Courant ? Légal ?
Wix va renforcer son arsenal avec un générateur de site basé sur l’IA
19/07/2023
Le 19/07/2023 à 16h 57
Idem, merci pour le lien. Je ne connaissais pas ce Ploum, et c’est très rafraîchissant ! Je conseille la retranscription de sa dernière “conférence” ici. Ça résume bien sa pensé.
Comment l’industrie de l’adtech segmente et cible les internautes
10/07/2023
Le 10/07/2023 à 21h 40
Je suis étrangement peu impressionné. Soit on ne voit que le tout petit sommet de l’iceberg, soit ce Xandr est très en retard. Ou alors c’est un marché spécifique pour l’achat de pannel pour des usages spécifiques au 20 ème siècle.
Ce que je veux dire par là c’est que j’imagine très aisément que Google, par exemple, possède pour chacuns des utilisateurs, un vecteur de dimmenssion X contenant des milliers de sous paramètres qui part inférence peuvent lui permettre de faire un ciblage très largement plus fin que des grandes catégories (par exemple métier lieux visités les x derniers mois intérêt pour les meubles art déco possède un smartphone de moins de plus de 2 ans utilise un VPN possède un compte utilisateur sur le site Tartempion adore Maria Carrey a déménagé il y a moins de 2 mois grand mère à moustache * je m’arrête là). En tout cas, je ne vois rien qui techniquement empêcherait gg d’obtenir ce genre de dataset pour un utilisateur moyen de ces services, soit une grande partie de la population européenne.
Ce que je comprends, c’est que google ne vend pas ces données, mais il peut proposer un ciblage publicitaire de ce niveau là, n’est ce pas ?
Aux États-Unis, l’avortement révélateur des problématiques de vie privée et de désinformation
27/06/2023
Le 27/06/2023 à 16h 33
Idem, félicitations pour cet article. Mme Saliou nous offre depuis son arrivée une sélection de sujets qui donne tout son sel à la ligne éditoriale déjà si particulière de NextImpact. Merci.
Une question: En France, un particulier ou une personne morale qui achèterait auprès d’un brocker par exemple des données nominatives de géo-localisation liées à un lieu de culte et/ou un centre d’accueil LGBT, serait il condamnable du simple fait de l’interdiction de constituer (si j’ai bien compris) des bases de données basées sur l’orientation sexuelle ou religieuse ?
Les modèles d’IA génératifs renforcent les biais humains
14/06/2023
Le 14/06/2023 à 12h 20
Comme le note Carbier, l’IA génère une représentation de nos représentations (au final, en exagérant un peu, le Web n’est le support que d’une seule activité humaine: la communication). Sur une liste de biais principalement visuels types (couleur de peau, sexe apparant), il m’apparaît relativement simple techniquement de totalement débiaiser. Dans les banques de données taguées humainement ou par un autre modèle, j’imagine que sexe et couleur de peau sont des attributs systématiquement renseignés ou renseignables. Du coup ou pourrait “forcer” Le générateur à produire des images 51%/49% femme /homme ou en proportion des couleurs de peaux mondiale tant que le prompt de l’utilisateur ne les specifie pas. La seule chose à modifier serait l’interpretateur de prompt utilisateur, relativement simple à faire sur quelques biais de base.
C’est un choix technique à faire (voire législatif demain pour les plateformes B2C ?) et donc c’est politique.
Je ne dis pas qu’il faut le faire (dessine moi un pygmé-> voici un indien avec une lance et une toje). C’est assez utile par exemple pour prendre conscience de nos biais de représentation, qui pour la quasi totalité nous restent inaccessibles.
Comment tenter d’identifier les textes émanant d’intelligences artificielles génératives ?
31/05/2023
Le 02/06/2023 à 11h 29
Excellent contre-point. Merci pour l’article ! Quand à Olivia Grégoire, c’est étonnant qu’elle ne se soit pas fait allumé par la vraie presse (ou alors j’ai loupé un épisode).
L’Espagne voudrait que l’Europe interdise le chiffrement de bout en bout
24/05/2023
Le 24/05/2023 à 15h 06
Au delà de l’intérêt et de la démarche, largement discutable (en terme de réponse proportionnée à un problème bien réel qui n’a pas attendu les NTC pour exister), je m’interroge sur la faisabilité technique. Internet étant ce qu’il est, comment serait-il possible d’empêcher concrètement un échange chiffré de bout en bout ? Sauf à analyser en temps réel tout les flux de données transitant par L’UE, en supposant qu’on puisse détecter instantanément toute donnée chiffrée, la seule solution serait d’instaurer une gigantesque blacklist européenne blanquant tout échange depuis ou vers les dites IP / serveur ? J’ai bon ? Même avec l’ip v6, on serait rapidement dépourvu non ?
MTop Slim, le capteur biométrique nomade qui répond aux désidératas du ministère de l’Intérieur
14/04/2023
Le 14/04/2023 à 19h 43
@Jean-Marc,
Le “Hasard ou coïncidence” semble sarcastique.
Tu sous-entends que qu’Idemia aurait pu, très fortuitement bien sûr, assister directement le ministère pour la rédaction du CCTP ? C’est assez courant, mais en l’espèce, dans les procédures de marché public en France, c’est autorisé sous réserve d’exclusion automatique de “l’aidant”, dont le rôle d’AMO est ainsi constitué de fait, pour le dit marché qu’il a participé à spécifier.
Bien sûr, ceux qui montent le marché coté ministère peuvent faire du sourcing auprès d’un panel de soumissionnaires potentiels, de manière formalisée (RFI par exemple) ou non, c’est légal. Mais demander à un attributaire pressenti de fournir des specifications techniques pour que ce dernier soit (seul) dans les cordes et que tout roule, c’est à minima amoral.
Sinon, pour les marchés de travaux publics, au delà d’un certain montant, à minima 3 soumissionnaires doivent remettre des offres conformes pour que l’appel d’offre puisse aboutir à une attribution de marché. D’après ce qu’indique le début de l’article, ca risque d’être difficile ici non ? J’imagine que le ministère de l’intérieur bénéficie de procédures d’attribution plus souples que d’autres maîtres d’ouvrages. A creuser ?
Comment vérifier l’intégrité d’un fichier via son empreinte SHA256 ?
14/04/2023
Le 14/04/2023 à 19h 14
Très Intéressant. Merci Glandos.
Mais en pratique, un Hash sur une machine moderne, n’est-il pas limité par la vitesse de lecture des données sur disque ou SSD plutôt que l’algo lui même sur CPU ou GPU ? (C’est une vrai question).
J’avais cru comprendre qu’un Hash, c’était en gros des sommes de bits particulières calculées modulo un très grand nombre premier. La somme pouvait se faire en temps réel au cours de lecture séquentielle des données, restait quelques divisions, qui si grand soit le nombre à diviser, ne nécessitent que “quelques” cycles d’horloges, soit bien moins que le temps de lire un gros fichiers à hasher (sauf pour un très petit fichier).
J’avais du mal comprendre apparemment. Tu saurais m’expliquer ?
Semi-conducteurs : les restrictions ciblant la Chine pénalisent aussi TSMC et Taïwan
12/04/2023
Le 12/04/2023 à 11h 09
Le terme “indigénisation” dans le contexte m’apparait assez obscure. Quelqu’un pour intuiter le sens recherché dans cette phrase ?