ImpactID
est avec nous depuis le 20 juin 2017 ❤️
Oups.
On dirait que quelqu'un ici aime garder ses petits secrets, comme si de par hasard il y avait quelque chose à cacher...
Désolé, ô lectrice de passage, cher lecteur égaré, pas de révélation sensationnelle pour le moment sur ce profil.
Repassez plus tard ?
108 commentaires
Terrorgram, la fabrique de terroristes d’extrême-droite, à coups de mèmes et de shitposts
Le 24/04/2024Le 24/04/2024 à 23h 26
Au début de l'article, je ne comprenais pas. Je croyais que l'intention était satirique:"Terorgram" ,ca me faisait penser aux nazis sur la face cachée de la lune comme dans un bon gros nanard du dimanche... L'impression persiste à la lecture, avec des protagonistes décérébrés faisant moultes références à la culture populaire entre Conan le barbare, Rambo, idiocracie et divers mangas. Et puis force est de constater que non, je me suis trompé. Un article de J. M. Manach en plus, c'est rarement de la godriole. C'est désespérant.
Et dire qu'une part tres significative de la population s'apprête à voter pour des partis dont l'imaginaire est largement partagé avec celui de ces "saints" (le grand remplacement étant publiquement revendiqué par certains de leurs représentants)... Je comprends pourquoi, mais ça ne pardonne pas. Nous nous en mordrons tous les doigts, moi compris pour n'avoir pas fait assez pour convaincre mes concitoyens de réfléchir autrement.
D'ailleurs, les "saints" me font penser que la distinction entre terrorisme religieux et idéologique évoquée en début d'article n'est absolument pas pertinente : l'imaginaire et le schéma dialectique sont pour grande partie identiques. (En tant qu'athé je considère que toute religion, même modérée et en accord avec les normes temporelles, est une idéologie politique. Mais c'est une opinion qui est loin de faire consensus, donc je limite l'analogie au champ de l'extrémisme politique et religieux)
Aux USA, la surveillance des communications d’étrangers sans mandat (FISA) fait débat
Le 15/04/2024Le 15/04/2024 à 23h 16
C'est étrange, j'avais l'impression que les forces de l'ordre et le renseignement américain avaient beaucoup plus de l'attitude pour contrôler ce qu'ils veulent, quand ils le veulent. A la lecture de cet article, je me demande dans quelle mesure, ce n'est pas pas au contraire plus restrictif qu'en France par exemple. À l'étranger, ils font ce qu'ils veulent, mais sur leur sol ça a l'air bien cadré. Je n'arrive pas à me faire un avis. Un "simple" enquêteur et je France semble pouvoir faire pas mal de choses (cf. d'autres articles sur le sujet sur Next cette année).
Le réchauffement climatique redessine la carte des câbles sous-marins pour Internet
Le 04/04/2024Le 04/04/2024 à 17h 02
Juste un commentaire sur le début de l'article :
D'une, le satellite geostationnaire pour la data, c'est un peu has-been non ? Les constellations récentes sont en orbite basse avec une latence beaucoup plus faible. Après, est-ce qu'il y a beaucoup de données passant d'un satellite à l'autre pour faire de la longue distance, je ne crois pas. Le sat le plus proche communique probablement au relais terrestre le plus proche, et on repasse par câble.
De deux, il est à mon humble avis inconcevable aujourd'hui de faire passer une part significative du trafic par satellite. La bande passante totale d'une constellation est probablement bien plus fiable que celle d'un unique câble transatlantique récent (si ça a un sens, je ne suis pas sûr. C'est plutôt la bande passante de satellites de l'éphémèride à un temps T à un endroit donné qui compte).
Mayotte va ériger un « rideau de fer » de technologies civilo-militaires de surveillance
Le 19/03/2024Le 19/03/2024 à 22h 49
Quelle débauche de technologie, alors qu'on peine à assurer les services de base à Mayotte (eau potable, déchet, énergie, sans parler de la scolarisation, de la santé ou encore l'accès à la justice) . J'entends que la surpopulation de l'île en grande partie due à à l'immigration irrégulière fait partie du problème, mais tout de même. Avec cet argent, combien de pompes, de kilomètres de tuyaux, de générateurs, d'écoles etc... Je ne dis pas qu'il ne faut rien faire pour réguler les arrivées, mais c'est tout de même obscène.
Et puis, la prochaine étape c'est quoi ? Des mines sur les plages et des tourelles mitrailleuses sur l'ensemble de frontières extérieures de l' Europe ? Si les écarts de développement ne se réduisent pas, j'ai bien peur que nous y viendrons, et de notre vivant à nous commentateurs du soir.
Altice va vendre Altice Media (BFM, RMC) à CMA CGM, pour 1,55 milliard d’euros
Le 15/03/2024Le 18/03/2024 à 12h 32
Juste pour comprendre: Pourquoi une brève parue vendredi dernier réapparaît dans le Brief de ce lundi ? Il y a eu une mise à jour ? Si oui, ce serait bien de l'indiquer explicitement.
GPU et IA (générative) : des annonces tous azimuts sur la HBM3E
Le 11/03/2024Le 11/03/2024 à 16h 18
Il faudrait Jacquouille vienne visiter le 21 ème siècle : 2To/s et par puce, c'est dingue !
[Màj] Vente des contenus d’Automattic à MidJourney et OpenAI : JetPack non concerné
Le 29/02/2024Le 28/02/2024 à 22h 11
Un plugin WordPress peut valoir cession de la propriété intellectuelle du contenu d'un site ? C'est compatible avec le droit français ce genre de clause ? Si oui, j'en suis très étonné.
Sinon, de manière générale, les développeurs d'IA crawlent tout ce qu'ils trouvent pour alimenter leurs modèles non ? Du coup ils achètent donc des pseudo droits à divers partenaires uniquement pour diminuer leur exposition à des plaintes non ?
Lithium de France obtient un quatrième permis pour creuser en Alsace
Le 22/02/2024Le 23/02/2024 à 08h 15
Oui, très bien, mais entre l'extraction et la fabrication de batteries, il y a le raffinage. En gros l'étape la plus énergievore et qui produit le plus de coproduits (c.a.d des déchets pour la plupart). Au delà de la ressource minière, c'est c'est surtout sur le raffinage que nos amis chinois ont un quasi monopole. Et nous, on va raffiner où ?
Licenciements : les employés se filment, les managers protestent
Le 21/02/2024Le 22/02/2024 à 10h 29
Franchement, je suis très étonné de lire ça. Merci pour le lien. Encien cadre d'un groupe de plusieurs milliers de personnes, dont un très large proportion de Cadres, c'était seconde pour tout le monde, quelque soit le trajet, sauf pour les pontes (train ou avion multi escales jusqu'à LlAutre bout du monde, et on voyageais beaucoup avant le Covid).
Suivre au quotidien la modération des très grandes plateformes listées par le DSA
Le 06/02/2024Le 06/02/2024 à 19h 55
Incroyable. 3 million par jour. Est-ce que dans le csv, il est indiqué pour chaque cas:
1. s'il y a eu intervention humaine (si oui, ça peut être intéressant de voir si c'est signicatif, ou si comme je l'imagine l'écrasante majorité est purement du fait d'algorithmes)
2. s'il y des méta-données qui permettent de reconstruire un tant soit peu le contenu (titre, mots-clés, liens divers)
Sinon, l'intégration d'une vue Power-Bi, c'est facile à faire ? Si oui, sans 36 trackers Microsoft?
Hâte de découvrir vos prochains articles sur le sujet si les données sont intéressantes et réellement exploitables.
CJUE : la police ne peut pas conserver les données biométriques de tous les condamnés
Le 31/01/2024Le 01/02/2024 à 07h 59
La décision vaut-elle jurisprudence pour la France ? Cf les multiples articles publiés ici sur la conservation des données biométriques par les ministères de l'intérieur et de la justice. Ça devrait être applicable à tout registre judiciaire en comportant, a fortiori pour des personnes non condamnées, voire simples témoins, ou même les victimes dans les affaires pénales.
Le courtier en données Tagadamedia écope d’une amende de 75 000 euros par la CNIL
Le 30/01/2024Le 30/01/2024 à 21h 26
Ça me rappelle les divers jeux concours de mon enfance (90s),pour lesquels on trouvait plusieurs présentoirs à la sortie des supermarchés, avec des formulaires à remplir (ou encore ceux des paquets de céréales pour recevoir des goodies à 3 centimes). Je comprend aujourd'hui que le business modèle était sûrement déjà celui le ciblage publicitaire (par courrier).
Quelqu'un saurait confirmer ?
Le CEPD propose un outil d’audit de sites web
Le 30/01/2024Le 30/01/2024 à 10h 15
Je viens de jeter un œil : L'exécutable Windows fait plus de 200Mo ! Je n'ai pas regardé les sources, mais qu'est-ce qui peut bien justifier une telle obésité ?
2024, début du direct-to-cell pour Starlink
Le 05/01/2024Le 06/01/2024 à 13h 56
Mais du coup, si ou parle bien ici de 2/3/4G, Starlink négocie / achette des licences pour des bande de fréquence pour chaque pays couvert ?
Si oui, chaque satellite change de fréquence d'émission toutes les quelques minutes d'un pays à l'autre ?
Google ne répondra plus aux demandes légales de géolocalisation inversée
Le 18/12/2023Le 19/12/2023 à 22h 46
Et bien justement, en lisant l'article sur l'ex flic/ripoux Haurus cité dans l'article, j'ai l'impression que ce n'est pas si simple. Si l'enquêteur a déjà des cibles (sim ou EMAI), pas de problème. Mais rechercher des correspondances de trajectoires dans l'intégralité des donnés opérateurs toutes antennes confondues, je n'ai pas l'impression que ce soit possible (via la PNIJ en tout cas, c'est bien sûr possible théoriquement).
Le 18/12/2023 à 18h 34
Et en sinon France, ce serait légal pour les forces de l'ordre et/ou la justice de faire une telle demande?
Sans aller jusqu'à la géo-localisation, les autorités peuvent elles demander aux opérateurs téléphoniques l'ensemble des SIM qui correspondent (via bornage) par exemple à l'itinéraire d'un suspect reconstitué sur la base d'autres indications?
653e édition des LIDD : Liens Intelligents Du Dimanche
Le 17/12/2023Le 17/12/2023 à 20h 20
La simulation Nano-GPT est très impressionnante (sur la forme, animations 3D pertinentes, explications textuelles en parallèle). C'est bien expliqué, compréhensible si on a un bagage de maths post bac (je ne prétend pas avoir tout compris). Mais il ne s'agit ici que de l'interrogation du modèle, pas de l'entrainement qui semble être le nerf de la guerre :
En bref, on constate que pour un simple tri alphabétique de 5 caractères, des milliers de multiplications, quelques centaines de passage à l'exponentielle et au logarithme sont nécessaire (même si j'imagine qu'ils ont des implémentations simplifiés et très efficaces pour ces fonctions), ce qui doit nécessiter des dizaines de milliers de fois plus de cycles de processeurs qu'une simple implémentation d'un algo de tri basique.
L'exemple est certes trivial, mais ca nous rappelle quand même que pour le bien de tous (bilan énergétique global entre autres), mieux vos apprendre les maths, apprendre à coder des choses simples correspondant à nos usages de bases, plutôt que de demander une réponse prémâchée à un oracle dont on ne sait pas grand chose.
En somme, il faudrait réserver leur usage à l'analyse de donnée inapprochables par méthodes d'analyse conventionnelles (mon petit doit me dit que moins de 0.1% de la population a de tels besoins), voire éventuellement (c'est triste) aux travaux créatifs...
Voitures électriques : dans la jungle, terrible jungle, des bornes de recharge publiques
Le 06/12/2023Le 07/12/2023 à 22h 50
Si on se consentre sur l'impact en équivalent CO2, le transport maritime est imbattable. Le rapport poid puissance d'un navire est sans commune mesure avec tous autre moyen de transport. À la tonne kilomètres, il n'y a pas photo.
Reste que paradoxalement, si le transport maritime est l'un des "moins urgent" à decarboner car déjà comparativement vertueux, c'est l'un des plus simple pour un passage à l'échelle industrielle (on peut emporter de très grosses batteries pas trop chères, au sodium par exemple, au sodium de plusieurs dizaines de milliers de tonnes si besoin. Le segment motorisation de forte puissance existe déjà.)
La CNIL préconise l’utilisation des API pour le partage de données personnelles entre organismes
Le 05/12/2023Le 06/12/2023 à 17h 54
C'est vachement bien la CNIL tout de même. Dommage qu'elle ne puisse emmetre que des recommandations. J'imagine assez bien qu'un ministre de poid puisse demander à son administration de s'asseoir dessus.
En gros, il faudrait que la CNIL ait un réel pouvoir normatif, à tout le moins sur la donnée gérée par des entités publiques.
Hébergeurs, éditeurs, espaces de conversation ? La difficile régulation des réseaux sociaux
Le 23/11/2023Le 25/11/2023 à 15h 25
Rien à voir avec l'article, mais à partir de ce point du fil de commentaires, le texte déborde à droite du cadre (Webkit, Android).
Silicium : un matériau indispensable et omniprésent, mais critique
Le 23/11/2023Le 23/11/2023 à 22h 27
Peut importe (ou alors marginalemant) où le consommateur est implanté. Le réseau étant très fortement interconecté, tu peux être implanté à côté d'un réacteur nucléaire, et avoir un contrat "au surplus", la puissance de base étant consommée par d'autres (les habitants par exemple).
#Flock fait son petit commerce et refourgue, lui aussi, sa came
Le 18/11/2023Le 18/11/2023 à 14h 50
Très bien le dessin bonus, très bien vu.
Sur la forme, le style est différent, ça me fait penser à Sempé pour les personnages, à Blain pour le décor (le parquet n’est qu’un simple zigzag, efficace, une épure pour ne pas surcharger). Sinon J’aime aussi cette sobriété monochrome, plus proche du dessin de presse.
Retour des humains sur la Lune : Artemis I décollait il y a un an, Artemis II doit décoller dans un an
Le 17/11/2023Le 17/11/2023 à 09h 43
LOL, la combinaison est développé en partenariat avec Prada !! Le sponsoring n’a de limite que notre imagination désormais.
La CNIL inflige 10 « sanctions simplifiées » suite à de « nombreuses plaintes »
Le 08/11/2023Le 08/11/2023 à 17h 21
Ça va probablement dans le bon sens, mais selon le rapport annuel 2022 ici. A comparer à 12000 plaintes. J’imagine aisément que la majorité des plaintes se concentrent sur un petit nombre de gros acteurs, et que toutes les plaintes ne sont pas forcément légitimes. Mais tout de même, je ne sais pas quels sont les moyens humains et financiers de la CNIL, mais ça reste très faible.
Il faut investir (au delà de du bien fondé de l’action de la CNIL pour la protection des citoyens, ça rapporte 100M€ par ans, soit probablement bien plus que ce que ça ne coûte)
L’outil pour retirer des données personnelles de l’entraînement des IA de Meta ne fonctionne pas
Le 30/10/2023Le 30/10/2023 à 09h 27
Mon humble avis, c’est que techniquement, c’est très compliqué de s’assurer que telle ou telle donnée, ou référence aux dites données ne font pas partie d’un jeu de donnée, sans pouvoir qualifier très précisément la donnée, ce que les aillants droit ne souhaitent pas faire.
Au delà de ça, je crois comprendre qu’il est techniquement impossible, sur un modèle déjà entraîné, de retirer ou exclure une part des informations pour générer des résultats (la donnée en elle même n’existant plus que sous forme de vecteur statistiques inintelligible pour l’humain.).
Comme les modèles sont itératifs, les anciens nourrissant ou servant à calibrer les nouveaux, ce problème semble insoluble sauf à repartir d’une page blanche à chaque requête de retrait, ce qui, étant donnés les coûts d’entraînement, est insoutenable économiquement.
Du coup, la seule solution restante, c’est le post traitement des résultats (avec une autre IA ? ) pour qualifier statistiquement la similitude avec des données sous copyright. Ce sera évidemment sujet à interprétation.–> Beaucoup d’argent à venir pour les futurs cabinets d’avocat spécialisés ?
Apple investirait 1 milliard de dollars par an pour revenir dans la course à l’IA
Le 24/10/2023Le 24/10/2023 à 12h 30
Depuis le boom médiatique de l’IA avec l’émergence des produits grand public type Chat GPT. ce que je ne comprends pas, c’est en quoi c’est fondamentalement différent de ce qui était dispo avant, depuis une dizaine d’années avec les assistants vocaux (Siri, Google assistant et Alexa, voire Cortana)?
Je comprend que certaines de leur fonctions phares sont codées en dur (“joue tel titre” , “éteint la lumière” etc.). Mais pour toutes les autres, l’aspect pseudo conversationnel, c’était bien déjà basé sur du deeplearning et reinforced learning non?
A part la taille des modèles, qu’est ce qui provoque le changement de paradigme ?
Pourquoi Apple et Amazon sont considérés en retard sur leur concurrents. Tout le monde utilise bien peu ou prou les mêmes méthodes, et l’algorithmique derrière est un sujet académique qui bien que très complexe est globalement non secret non?
Ça fait beaucoup de questions, mais je crois que j’ai une bonne chance de trouver quelqu’un qui sait à peu près de quoi il parle ici.
Réduire son empreinte environnementale numérique, « c’est comme le tri sélectif : il faut le faire, point barre »
Le 23/10/2023Le 23/10/2023 à 15h 08
Merci de m’avoir appris quelque chose aujourd’hui. L’article wiki est très accessible (en français)
Replay de la soirée de Next
Le 17/10/2023Le 17/10/2023 à 13h 29
+1
Si les journalistes sont charrette (ou gueule de bois si la soirée s’est éternisée) , j’invite modestement mes comparses impatiens qui auraient pris le temps de regarder à nous faire quelques bullets points (en toute subjectivité) en commentaire , car pour l’instant, le lecteur lambda mais fidèle que je suis ne sais RIEN… Merci par avance pour votre impactitude.
Les modèles de langage sont de redoutables outils de compression sans perte
Le 03/10/2023Le 03/10/2023 à 20h 13
Super article. Merci pour tous les liens. J’ai lu celui d’Olivier Rioul, super intéressant (j’imagine que c’est le b.a. ba pour tout étudiant en informatique ou télécom, mais c’est neuf pour moi). Reste à lire tous les autres…
Les discrets lobbyistes états-uniens de la proposition de surveillance des messageries chiffrées
Le 28/09/2023Le 29/09/2023 à 14h 12
Au delà de l’aspect politique, je suis très surpris que ces ONG / sociétés se targent d’avoir développé des solutions d’IA permettant la détection automatique de contenu illicite. Si comme la plus part des modèles actuels, ces IA sont assises sur des formes de deeplearning ou apprentissage renforcé, il faut des bases d’entraînement et de test. Or dans la plus part des pays occidentaux, la simple possession d’image à caractère pédopornographique est interdite. Comment font-ils (s’il le font vraiment)?
Deezer augmente ses tarifs
Le 25/09/2023Le 25/09/2023 à 20h 42
Tu peux nous en dire un peu plus ? La BNF ?
ADEME : un simulateur pour « mesurer l’impact carbone de la livraison de colis »
Le 22/09/2023Le 22/09/2023 à 14h 54
Pour revenir au simulateur, l’ADEME précise un certain nombre d’hypothèses de transport, notemment le taux de remplissage moyen des camions entre les différents plateformes logistiques: entre 15 et 20%… Ça me paraît très bas (sauf éventuellement pour l’étape de livraison à domicile).
Il aurait été intéressant d’avoir un résumé final de la part de chaque composante (transport routier, emballage, stockage) dans le bilan carbone complet.
Firefox 117 disponible avec peu de nouveautés
Le 30/08/2023Le 30/08/2023 à 13h 23
Intéressant comme syntaxe, ça allège beaucoup le CSS de fait. Savez vous si Webkit et Blink supportent également le CSS nesting?
CAPTCHA : les machines « prouvent » plus rapidement qu’elles sont des humains
Le 22/08/2023Le 22/08/2023 à 16h 23
Je sais que l’utilisation d’un IA nécessite boucoup moins de computations que celles nécessaires à son entraînement. N’empêche, résoudre un CaptaCha (ou équivalent), ça ne doit pas être négligeable en coût (pour faire du scraping ou du deni de service à coup de dizaines de milliers de requêtes par secondes ). Pour moi, la question pertinente, ce n’est pas est-ce qu’une IA peut résoudre rapidement un vulgaire test de CaptaCha, on se doute bien qu’elle sait déjà le faire très rapidement étant données les tâches bien plus complexe qu’elle “résout”. Mais est-ce à coût marginal ?
Un tueur en série confondu par ses traces numériques, téléphoniques et bancaires
Le 11/08/2023Le 12/08/2023 à 07h 06
OK, mais le bornage à une antenne X ou Y n’est pas un élément de facturation n’est-ce pas ?
Le 11/08/2023 à 19h 15
Pour les traces Email je comprends (Google logue toutes les IPs d’utilisation ? sur 10ans ?) mais pour les bornages je suis étonné que les opérateurs conserve tous les bornage sur des durées pareille. Ça en fait des données par terminal et par opérateur ! Quelqu’un sait si c’est pareil en France ? J’en étais resté aux seules fadettes (liste des numéros appelés).
Waymo met en pause son développement de camions autonomes
Le 28/07/2023Le 28/07/2023 à 16h 39
Enfin quelqu’un qui tient ce genre de propos! Je suis pour le local dans l’absolu, et je suis convaincu qu’une forme de décroissance s’imposera tôt ou tard (soit par le consommateur épris de sobriété, soit par la loi si nous trouvons un consensus dans un monde merveilleux, soit à terme par la guerre). Mais produire près de chez soit, OK, si et seulement si l’impact global n’est pas significativement plus sévère. Un champ, une mine, un parc éolien, c’est délocalisable, mais jamais à rendement égal. En imaginant la paix dans le monde et un gouvernement mondial avec les mêmes normes enviromentales et sociales partout, pas sûr qu’il soit pertinent de réduire significativement les transports, mais plutôt de spécialiser les productions sur les critères géographiques et physiques donnés. Un peu comme aujourd’hui en somme mais en beaucoup mieux.
Pourquoi 69 % des RSSI français auraient-ils interdit l’utilisation de WhatsApp ?
Le 20/07/2023Le 21/07/2023 à 11h 25
?? C’est vraiment possible ça ? Courant ? Légal ?
Wix va renforcer son arsenal avec un générateur de site basé sur l’IA
Le 19/07/2023Le 19/07/2023 à 16h 57
Idem, merci pour le lien. Je ne connaissais pas ce Ploum, et c’est très rafraîchissant ! Je conseille la retranscription de sa dernière “conférence” ici. Ça résume bien sa pensé.
Comment l’industrie de l’adtech segmente et cible les internautes
Le 10/07/2023Le 10/07/2023 à 21h 40
Je suis étrangement peu impressionné. Soit on ne voit que le tout petit sommet de l’iceberg, soit ce Xandr est très en retard. Ou alors c’est un marché spécifique pour l’achat de pannel pour des usages spécifiques au 20 ème siècle.
Ce que je veux dire par là c’est que j’imagine très aisément que Google, par exemple, possède pour chacuns des utilisateurs, un vecteur de dimmenssion X contenant des milliers de sous paramètres qui part inférence peuvent lui permettre de faire un ciblage très largement plus fin que des grandes catégories (par exemple métier lieux visités les x derniers mois intérêt pour les meubles art déco possède un smartphone de moins de plus de 2 ans utilise un VPN possède un compte utilisateur sur le site Tartempion adore Maria Carrey a déménagé il y a moins de 2 mois grand mère à moustache * je m’arrête là). En tout cas, je ne vois rien qui techniquement empêcherait gg d’obtenir ce genre de dataset pour un utilisateur moyen de ces services, soit une grande partie de la population européenne.
Ce que je comprends, c’est que google ne vend pas ces données, mais il peut proposer un ciblage publicitaire de ce niveau là, n’est ce pas ?
Aux États-Unis, l’avortement révélateur des problématiques de vie privée et de désinformation
Le 27/06/2023Le 27/06/2023 à 16h 33
Idem, félicitations pour cet article. Mme Saliou nous offre depuis son arrivée une sélection de sujets qui donne tout son sel à la ligne éditoriale déjà si particulière de NextImpact. Merci.
Une question: En France, un particulier ou une personne morale qui achèterait auprès d’un brocker par exemple des données nominatives de géo-localisation liées à un lieu de culte et/ou un centre d’accueil LGBT, serait il condamnable du simple fait de l’interdiction de constituer (si j’ai bien compris) des bases de données basées sur l’orientation sexuelle ou religieuse ?
Les modèles d’IA génératifs renforcent les biais humains
Le 14/06/2023Le 14/06/2023 à 12h 20
Comme le note Carbier, l’IA génère une représentation de nos représentations (au final, en exagérant un peu, le Web n’est le support que d’une seule activité humaine: la communication). Sur une liste de biais principalement visuels types (couleur de peau, sexe apparant), il m’apparaît relativement simple techniquement de totalement débiaiser. Dans les banques de données taguées humainement ou par un autre modèle, j’imagine que sexe et couleur de peau sont des attributs systématiquement renseignés ou renseignables. Du coup ou pourrait “forcer” Le générateur à produire des images 51%/49% femme /homme ou en proportion des couleurs de peaux mondiale tant que le prompt de l’utilisateur ne les specifie pas. La seule chose à modifier serait l’interpretateur de prompt utilisateur, relativement simple à faire sur quelques biais de base.
C’est un choix technique à faire (voire législatif demain pour les plateformes B2C ?) et donc c’est politique.
Je ne dis pas qu’il faut le faire (dessine moi un pygmé-> voici un indien avec une lance et une toje). C’est assez utile par exemple pour prendre conscience de nos biais de représentation, qui pour la quasi totalité nous restent inaccessibles.
Comment tenter d’identifier les textes émanant d’intelligences artificielles génératives ?
Le 31/05/2023Le 02/06/2023 à 11h 29
Excellent contre-point. Merci pour l’article ! Quand à Olivia Grégoire, c’est étonnant qu’elle ne se soit pas fait allumé par la vraie presse (ou alors j’ai loupé un épisode).
L’Espagne voudrait que l’Europe interdise le chiffrement de bout en bout
Le 24/05/2023Le 24/05/2023 à 15h 06
Au delà de l’intérêt et de la démarche, largement discutable (en terme de réponse proportionnée à un problème bien réel qui n’a pas attendu les NTC pour exister), je m’interroge sur la faisabilité technique. Internet étant ce qu’il est, comment serait-il possible d’empêcher concrètement un échange chiffré de bout en bout ? Sauf à analyser en temps réel tout les flux de données transitant par L’UE, en supposant qu’on puisse détecter instantanément toute donnée chiffrée, la seule solution serait d’instaurer une gigantesque blacklist européenne blanquant tout échange depuis ou vers les dites IP / serveur ? J’ai bon ? Même avec l’ip v6, on serait rapidement dépourvu non ?
MTop Slim, le capteur biométrique nomade qui répond aux désidératas du ministère de l’Intérieur
Le 14/04/2023Le 14/04/2023 à 19h 43
@Jean-Marc,
Le “Hasard ou coïncidence” semble sarcastique.
Tu sous-entends que qu’Idemia aurait pu, très fortuitement bien sûr, assister directement le ministère pour la rédaction du CCTP ? C’est assez courant, mais en l’espèce, dans les procédures de marché public en France, c’est autorisé sous réserve d’exclusion automatique de “l’aidant”, dont le rôle d’AMO est ainsi constitué de fait, pour le dit marché qu’il a participé à spécifier.
Bien sûr, ceux qui montent le marché coté ministère peuvent faire du sourcing auprès d’un panel de soumissionnaires potentiels, de manière formalisée (RFI par exemple) ou non, c’est légal. Mais demander à un attributaire pressenti de fournir des specifications techniques pour que ce dernier soit (seul) dans les cordes et que tout roule, c’est à minima amoral.
Sinon, pour les marchés de travaux publics, au delà d’un certain montant, à minima 3 soumissionnaires doivent remettre des offres conformes pour que l’appel d’offre puisse aboutir à une attribution de marché. D’après ce qu’indique le début de l’article, ca risque d’être difficile ici non ? J’imagine que le ministère de l’intérieur bénéficie de procédures d’attribution plus souples que d’autres maîtres d’ouvrages. A creuser ?
Comment vérifier l’intégrité d’un fichier via son empreinte SHA256 ?
Le 14/04/2023Le 14/04/2023 à 19h 14
Très Intéressant. Merci Glandos.
Mais en pratique, un Hash sur une machine moderne, n’est-il pas limité par la vitesse de lecture des données sur disque ou SSD plutôt que l’algo lui même sur CPU ou GPU ? (C’est une vrai question).
J’avais cru comprendre qu’un Hash, c’était en gros des sommes de bits particulières calculées modulo un très grand nombre premier. La somme pouvait se faire en temps réel au cours de lecture séquentielle des données, restait quelques divisions, qui si grand soit le nombre à diviser, ne nécessitent que “quelques” cycles d’horloges, soit bien moins que le temps de lire un gros fichiers à hasher (sauf pour un très petit fichier).
J’avais du mal comprendre apparemment. Tu saurais m’expliquer ?
Semi-conducteurs : les restrictions ciblant la Chine pénalisent aussi TSMC et Taïwan
Le 12/04/2023Le 12/04/2023 à 11h 09
Le terme “indigénisation” dans le contexte m’apparait assez obscure. Quelqu’un pour intuiter le sens recherché dans cette phrase ?
Firefox 112 peut afficher les mots de passe via un clic droit
Le 12/04/2023Le 12/04/2023 à 11h 04
Est-ce vraiment une bonne idée, l’accès au mdp en clair sur simple clic droit ? Ca ouvre la voie à diverse indiscretions “humaines”. Sur Chrome, l’accès aux mdp gestionnaire peut être subordonnée à une verification supplémentaire (empreinte digitale chez moi mais c’est configurable). J’imagine que cette fonctionnalité reste optionnelle.
Des recherches des années 50 à GPT-4 en passant par BERT, quelles évolutions amènent les grands modèles de langage ?
Le 05/04/2023Le 05/04/2023 à 07h 49
Merci pour cet article. Je l’aurais aimé plus long.
À noter que Nicolas Martin (ex. France Q) avait fait 2 superbes émission sur l’évolution des modèles de langage il y a 2 ans:
https://www.radiofrance.fr/franceculture/podcasts/la-methode-scientifique/parlez-vous-l-ordinateur-7914870
https://www.radiofrance.fr/franceculture/podcasts/la-methode-scientifique/traitement-automatique-des-langages-do-you-speak-computer-8285510.
Réseaux sociaux : il n’y a pas que Twitter dans la vie
Le 27/03/2023Le 28/03/2023 à 11h 45
Bel article. Merci.
Il y a qqch. que je ne comprends pas. Les derniers nombre d’utilisateurs mentionnés pour Mastodont (toutes instances confondues, j’avoue ne pas bien comprendre si l’inscription reste centralisée) et Truth Social sont respectivement de 1,4M et 8M. Il a assurément de nombreux nostalgiques de Trump, mais qu’il y en ait plus sur Mastodont (qui pourrait j’imagine accueillir ces nostalgiques sur une instance dédiée) m’interroge. Une idée d’explication ?