votre avatar Abonné

ImpactID

est avec nous depuis le 20 juin 2017 ❤️

161 commentaires

Le 14/05/2024 à 20h 06

N'empêche, réussir à vendre pour 26 milliards de dollars de skins, statistiques d'armes et autres mouvements de danse virtuels (enfin j'imagine que c'est ce dont il s'agit), chapeau bas... Le niveau de rentabilité doit être dingue ! Je sais, il faut créer le jeu au départ (mais Fortnite n'est pas forcément une vitrine technologique ni une révolution en terme de game art...) faire tourner quelques serveurs, et surtout payer la pub (probablement le budget principal), mais quand même, il doit rester pas mal de sous à la fin.
L'économie de la vanité (et non celle du divertissement, on peut s'amuser sur Fortnite sans rien payer si je comprends bien) est veille comme le monde, mais on atteint ici un niveau sidérant.

Le 13/05/2024 à 21h 30

À part verser dans un crétin complotisme, il n'y a pas de lien entre direct entre la régulation de surveillance États-unienne, et l'implantation d'entreprises qui ont du pognon à ne plus savoir quoi faire à des endroits économiquement porteurs d'avenir, quand bien même ces entreprises sont abondamment subventionnées, comme le sont les grandes de tout pays ayant un modèle capitalisme libéral, dont la France.

Par contre, il est toujours bon de rappeler que ces endroits sont éminemment visés par ces lois de surveillance États-unienne, rappelons-le à toutes fins utiles, à portée extra-territoriale.

J'ai entendu de manière constante les neuneus entreprises françaises répéter que l'emplacement géographique français était une garantie en regard du RGPD.
Et quand bien même quelques-uns s'égosillaient à rappeler le contraire, la populace continue de boire à cet abreuvoir.

Nos données dans des entreprises immatures, en l'absence de régulation par destruction des services publics issue de l'idéologique libéraliste, passent ainsi par des technologies, services et maintenant centres de données appartenant à des structure ayant un pied chez nos meilleurs ennemis, qui vont pouvoir continuer à allègrement nous espionner pour leur intérêt… qui n'est jamais le nôtre, rappelons-le au cas où des crétins iraient à dire que ça n'est pas si grave.

Je like avec un bémol sur "ennemis". Je dirai "concurrents très fortement soutenus par un système economico judiciaire intégré, idéologique et prédateur". Il ne tient qu'à nous de nous en protéger, via nos lois et les rapports de force technologiques dont nous sommes encore capables. Nous avons des législateurs, des universités et des banques, donc c'est théoriquement possible. Ne reste qu'à les faire collaborer dans le sens des intérêts européens... Nous en sommes loin, tant ces mondes sont souvent antagonistes sur le vieux continent, alors qu'ils sont très intégrés aux USA.

Le 29/04/2024 à 20h 59

Heu, c'est évident pour tout le monde sauf moi la désignation "code d'infrastructure"? Ou "tâche d'infrastructure"? Ça cible quoi /quel niveau ? Le réseau lui même, les serveurs, les bdd (ou les projets de génie civil :-))?

Le 24/04/2024 à 23h 26

Au début de l'article, je ne comprenais pas. Je croyais que l'intention était satirique:"Terorgram" ,ca me faisait penser aux nazis sur la face cachée de la lune comme dans un bon gros nanard du dimanche... L'impression persiste à la lecture, avec des protagonistes décérébrés faisant moultes références à la culture populaire entre Conan le barbare, Rambo, idiocracie et divers mangas. Et puis force est de constater que non, je me suis trompé. Un article de J. M. Manach en plus, c'est rarement de la godriole. C'est désespérant.

Et dire qu'une part tres significative de la population s'apprête à voter pour des partis dont l'imaginaire est largement partagé avec celui de ces "saints" (le grand remplacement étant publiquement revendiqué par certains de leurs représentants)... Je comprends pourquoi, mais ça ne pardonne pas. Nous nous en mordrons tous les doigts, moi compris pour n'avoir pas fait assez pour convaincre mes concitoyens de réfléchir autrement.

D'ailleurs, les "saints" me font penser que la distinction entre terrorisme religieux et idéologique évoquée en début d'article n'est absolument pas pertinente : l'imaginaire et le schéma dialectique sont pour grande partie identiques. (En tant qu'athé je considère que toute religion, même modérée et en accord avec les normes temporelles, est une idéologie politique. Mais c'est une opinion qui est loin de faire consensus, donc je limite l'analogie au champ de l'extrémisme politique et religieux)

Le 15/04/2024 à 23h 16

C'est étrange, j'avais l'impression que les forces de l'ordre et le renseignement américain avaient beaucoup plus de l'attitude pour contrôler ce qu'ils veulent, quand ils le veulent. A la lecture de cet article, je me demande dans quelle mesure, ce n'est pas pas au contraire plus restrictif qu'en France par exemple. À l'étranger, ils font ce qu'ils veulent, mais sur leur sol ça a l'air bien cadré. Je n'arrive pas à me faire un avis. Un "simple" enquêteur et je France semble pouvoir faire pas mal de choses (cf. d'autres articles sur le sujet sur Next cette année).

Le 04/04/2024 à 17h 02

Juste un commentaire sur le début de l'article :
D'une, le satellite geostationnaire pour la data, c'est un peu has-been non ? Les constellations récentes sont en orbite basse avec une latence beaucoup plus faible. Après, est-ce qu'il y a beaucoup de données passant d'un satellite à l'autre pour faire de la longue distance, je ne crois pas. Le sat le plus proche communique probablement au relais terrestre le plus proche, et on repasse par câble.

De deux, il est à mon humble avis inconcevable aujourd'hui de faire passer une part significative du trafic par satellite. La bande passante totale d'une constellation est probablement bien plus fiable que celle d'un unique câble transatlantique récent (si ça a un sens, je ne suis pas sûr. C'est plutôt la bande passante de satellites de l'éphémèride à un temps T à un endroit donné qui compte).

Le 19/03/2024 à 22h 49

Quelle débauche de technologie, alors qu'on peine à assurer les services de base à Mayotte (eau potable, déchet, énergie, sans parler de la scolarisation, de la santé ou encore l'accès à la justice) . J'entends que la surpopulation de l'île en grande partie due à à l'immigration irrégulière fait partie du problème, mais tout de même. Avec cet argent, combien de pompes, de kilomètres de tuyaux, de générateurs, d'écoles etc... Je ne dis pas qu'il ne faut rien faire pour réguler les arrivées, mais c'est tout de même obscène.
Et puis, la prochaine étape c'est quoi ? Des mines sur les plages et des tourelles mitrailleuses sur l'ensemble de frontières extérieures de l' Europe ? Si les écarts de développement ne se réduisent pas, j'ai bien peur que nous y viendrons, et de notre vivant à nous commentateurs du soir.

Le 18/03/2024 à 12h 32

Juste pour comprendre: Pourquoi une brève parue vendredi dernier réapparaît dans le Brief de ce lundi ? Il y a eu une mise à jour ? Si oui, ce serait bien de l'indiquer explicitement.

Le 11/03/2024 à 16h 18

Il faudrait Jacquouille vienne visiter le 21 ème siècle : 2To/s et par puce, c'est dingue !

Le 28/02/2024 à 22h 11

Un plugin WordPress peut valoir cession de la propriété intellectuelle du contenu d'un site ? C'est compatible avec le droit français ce genre de clause ? Si oui, j'en suis très étonné.

Sinon, de manière générale, les développeurs d'IA crawlent tout ce qu'ils trouvent pour alimenter leurs modèles non ? Du coup ils achètent donc des pseudo droits à divers partenaires uniquement pour diminuer leur exposition à des plaintes non ?

Le 23/02/2024 à 08h 15

Je me rappelle plus, l'usine va faire exclusivement des batteries pour VE ou pas?

Sinon le terme gigafactory me fait tellement marrer, à chaque fois j'ai l'impression que c'est un gosse qui a trouvé le nom :D

Oui, très bien, mais entre l'extraction et la fabrication de batteries, il y a le raffinage. En gros l'étape la plus énergievore et qui produit le plus de coproduits (c.a.d des déchets pour la plupart). Au delà de la ressource minière, c'est c'est surtout sur le raffinage que nos amis chinois ont un quasi monopole. Et nous, on va raffiner où ?

Le 22/02/2024 à 10h 29

que nenni : https://www.syntec.fr/convention-collective/obligations-militaires/#article-11-3

donc tous tes employeurs étaient hors des clous !

Franchement, je suis très étonné de lire ça. Merci pour le lien. Encien cadre d'un groupe de plusieurs milliers de personnes, dont un très large proportion de Cadres, c'était seconde pour tout le monde, quelque soit le trajet, sauf pour les pontes (train ou avion multi escales jusqu'à LlAutre bout du monde, et on voyageais beaucoup avant le Covid).

Le 06/02/2024 à 19h 55

Incroyable. 3 million par jour. Est-ce que dans le csv, il est indiqué pour chaque cas:
1. s'il y a eu intervention humaine (si oui, ça peut être intéressant de voir si c'est signicatif, ou si comme je l'imagine l'écrasante majorité est purement du fait d'algorithmes)
2. s'il y des méta-données qui permettent de reconstruire un tant soit peu le contenu (titre, mots-clés, liens divers)

Sinon, l'intégration d'une vue Power-Bi, c'est facile à faire ? Si oui, sans 36 trackers Microsoft?

Hâte de découvrir vos prochains articles sur le sujet si les données sont intéressantes et réellement exploitables.

Le 01/02/2024 à 07h 59

La décision vaut-elle jurisprudence pour la France ? Cf les multiples articles publiés ici sur la conservation des données biométriques par les ministères de l'intérieur et de la justice. Ça devrait être applicable à tout registre judiciaire en comportant, a fortiori pour des personnes non condamnées, voire simples témoins, ou même les victimes dans les affaires pénales.

Le 30/01/2024 à 21h 26

Ça me rappelle les divers jeux concours de mon enfance (90s),pour lesquels on trouvait plusieurs présentoirs à la sortie des supermarchés, avec des formulaires à remplir (ou encore ceux des paquets de céréales pour recevoir des goodies à 3 centimes). Je comprend aujourd'hui que le business modèle était sûrement déjà celui le ciblage publicitaire (par courrier).
Quelqu'un saurait confirmer ?

Le 30/01/2024 à 10h 15

Je viens de jeter un œil : L'exécutable Windows fait plus de 200Mo ! Je n'ai pas regardé les sources, mais qu'est-ce qui peut bien justifier une telle obésité ?

Le 06/01/2024 à 13h 56

Mais du coup, si ou parle bien ici de 2/3/4G, Starlink négocie / achette des licences pour des bande de fréquence pour chaque pays couvert ?
Si oui, chaque satellite change de fréquence d'émission toutes les quelques minutes d'un pays à l'autre ?

Le 19/12/2023 à 22h 46

Sur une réquisition validée par un juge, certainement. Puisque les écoutes sont déjà autorisées et pratiquées, je pense que c'est même déjà activement utilisé.

Et bien justement, en lisant l'article sur l'ex flic/ripoux Haurus cité dans l'article, j'ai l'impression que ce n'est pas si simple. Si l'enquêteur a déjà des cibles (sim ou EMAI), pas de problème. Mais rechercher des correspondances de trajectoires dans l'intégralité des donnés opérateurs toutes antennes confondues, je n'ai pas l'impression que ce soit possible (via la PNIJ en tout cas, c'est bien sûr possible théoriquement).

Le 18/12/2023 à 18h 34

Et en sinon France, ce serait légal pour les forces de l'ordre et/ou la justice de faire une telle demande?
Sans aller jusqu'à la géo-localisation, les autorités peuvent elles demander aux opérateurs téléphoniques l'ensemble des SIM qui correspondent (via bornage) par exemple à l'itinéraire d'un suspect reconstitué sur la base d'autres indications?

Le 17/12/2023 à 20h 20

La simulation Nano-GPT est très impressionnante (sur la forme, animations 3D pertinentes, explications textuelles en parallèle). C'est bien expliqué, compréhensible si on a un bagage de maths post bac (je ne prétend pas avoir tout compris). Mais il ne s'agit ici que de l'interrogation du modèle, pas de l'entrainement qui semble être le nerf de la guerre :
En bref, on constate que pour un simple tri alphabétique de 5 caractères, des milliers de multiplications, quelques centaines de passage à l'exponentielle et au logarithme sont nécessaire (même si j'imagine qu'ils ont des implémentations simplifiés et très efficaces pour ces fonctions), ce qui doit nécessiter des dizaines de milliers de fois plus de cycles de processeurs qu'une simple implémentation d'un algo de tri basique.

L'exemple est certes trivial, mais ca nous rappelle quand même que pour le bien de tous (bilan énergétique global entre autres), mieux vos apprendre les maths, apprendre à coder des choses simples correspondant à nos usages de bases, plutôt que de demander une réponse prémâchée à un oracle dont on ne sait pas grand chose.

En somme, il faudrait réserver leur usage à l'analyse de donnée inapprochables par méthodes d'analyse conventionnelles (mon petit doit me dit que moins de 0.1% de la population a de tels besoins), voire éventuellement (c'est triste) aux travaux créatifs...

Le 07/12/2023 à 22h 50

Genre, le truc qu'on vient de réglementer et qui s'est fortement réduit ? (à tel point qu'une petite partie du réchauffement récent peut être attribué à la réduction du souffre dans l'atmosphère).

Si on se consentre sur l'impact en équivalent CO2, le transport maritime est imbattable. Le rapport poid puissance d'un navire est sans commune mesure avec tous autre moyen de transport. À la tonne kilomètres, il n'y a pas photo.
Reste que paradoxalement, si le transport maritime est l'un des "moins urgent" à decarboner car déjà comparativement vertueux, c'est l'un des plus simple pour un passage à l'échelle industrielle (on peut emporter de très grosses batteries pas trop chères, au sodium par exemple, au sodium de plusieurs dizaines de milliers de tonnes si besoin. Le segment motorisation de forte puissance existe déjà.)

Le 06/12/2023 à 17h 54

C'est vachement bien la CNIL tout de même. Dommage qu'elle ne puisse emmetre que des recommandations. J'imagine assez bien qu'un ministre de poid puisse demander à son administration de s'asseoir dessus.
En gros, il faudrait que la CNIL ait un réel pouvoir normatif, à tout le moins sur la donnée gérée par des entités publiques.

Le 25/11/2023 à 15h 25

Rien à voir avec l'article, mais à partir de ce point du fil de commentaires, le texte déborde à droite du cadre (Webkit, Android).

Le 23/11/2023 à 22h 27

Actuellement, ça ne semble pas trop le cas. Par exemple Aluminium Dunkerque et OVH sont installés à côté de la centrale nucléaire (mais vraiment juste à côté), pas du tout là où il y a du solaire ou des éoliennes.

Peut importe (ou alors marginalemant) où le consommateur est implanté. Le réseau étant très fortement interconecté, tu peux être implanté à côté d'un réacteur nucléaire, et avoir un contrat "au surplus", la puissance de base étant consommée par d'autres (les habitants par exemple).

Le 18/11/2023 à 14h 50

Très bien le dessin bonus, très bien vu.
Sur la forme, le style est différent, ça me fait penser à Sempé pour les personnages, à Blain pour le décor (le parquet n’est qu’un simple zigzag, efficace, une épure pour ne pas surcharger). Sinon J’aime aussi cette sobriété monochrome, plus proche du dessin de presse.

Le 17/11/2023 à 09h 43

Ils l’ont nommée AxEMU

LOL, la combinaison est développé en partenariat avec Prada !! Le sponsoring n’a de limite que notre imagination désormais.

Le 08/11/2023 à 17h 21

Ça va probablement dans le bon sens, mais selon le rapport annuel 2022 ici. A comparer à 12000 plaintes. J’imagine aisément que la majorité des plaintes se concentrent sur un petit nombre de gros acteurs, et que toutes les plaintes ne sont pas forcément légitimes. Mais tout de même, je ne sais pas quels sont les moyens humains et financiers de la CNIL, mais ça reste très faible.
Il faut investir (au delà de du bien fondé de l’action de la CNIL pour la protection des citoyens, ça rapporte 100M€ par ans, soit probablement bien plus que ce que ça ne coûte)

Le 30/10/2023 à 09h 27

Mon humble avis, c’est que techniquement, c’est très compliqué de s’assurer que telle ou telle donnée, ou référence aux dites données ne font pas partie d’un jeu de donnée, sans pouvoir qualifier très précisément la donnée, ce que les aillants droit ne souhaitent pas faire.
Au delà de ça, je crois comprendre qu’il est techniquement impossible, sur un modèle déjà entraîné, de retirer ou exclure une part des informations pour générer des résultats (la donnée en elle même n’existant plus que sous forme de vecteur statistiques inintelligible pour l’humain.).
Comme les modèles sont itératifs, les anciens nourrissant ou servant à calibrer les nouveaux, ce problème semble insoluble sauf à repartir d’une page blanche à chaque requête de retrait, ce qui, étant donnés les coûts d’entraînement, est insoutenable économiquement.
Du coup, la seule solution restante, c’est le post traitement des résultats (avec une autre IA ? ) pour qualifier statistiquement la similitude avec des données sous copyright. Ce sera évidemment sujet à interprétation.–> Beaucoup d’argent à venir pour les futurs cabinets d’avocat spécialisés ?

Le 24/10/2023 à 12h 30

Depuis le boom médiatique de l’IA avec l’émergence des produits grand public type Chat GPT. ce que je ne comprends pas, c’est en quoi c’est fondamentalement différent de ce qui était dispo avant, depuis une dizaine d’années avec les assistants vocaux (Siri, Google assistant et Alexa, voire Cortana)?
Je comprend que certaines de leur fonctions phares sont codées en dur (“joue tel titre” , “éteint la lumière” etc.). Mais pour toutes les autres, l’aspect pseudo conversationnel, c’était bien déjà basé sur du deeplearning et reinforced learning non?
A part la taille des modèles, qu’est ce qui provoque le changement de paradigme ?
Pourquoi Apple et Amazon sont considérés en retard sur leur concurrents. Tout le monde utilise bien peu ou prou les mêmes méthodes, et l’algorithmique derrière est un sujet académique qui bien que très complexe est globalement non secret non?



Ça fait beaucoup de questions, mais je crois que j’ai une bonne chance de trouver quelqu’un qui sait à peu près de quoi il parle ici.

Le 23/10/2023 à 15h 08


whitemoon a dit:


problème des “lemon market”.


Merci de m’avoir appris quelque chose aujourd’hui. L’article wiki est très accessible (en français)

Le 17/10/2023 à 13h 29

+1
Si les journalistes sont charrette (ou gueule de bois si la soirée s’est éternisée) , j’invite modestement mes comparses impatiens qui auraient pris le temps de regarder à nous faire quelques bullets points (en toute subjectivité) en commentaire , car pour l’instant, le lecteur lambda mais fidèle que je suis ne sais RIEN… Merci par avance pour votre impactitude.

Le 03/10/2023 à 20h 13

Super article. Merci pour tous les liens. J’ai lu celui d’Olivier Rioul, super intéressant (j’imagine que c’est le b.a. ba pour tout étudiant en informatique ou télécom, mais c’est neuf pour moi). Reste à lire tous les autres…

Le 29/09/2023 à 14h 12

Au delà de l’aspect politique, je suis très surpris que ces ONG / sociétés se targent d’avoir développé des solutions d’IA permettant la détection automatique de contenu illicite. Si comme la plus part des modèles actuels, ces IA sont assises sur des formes de deeplearning ou apprentissage renforcé, il faut des bases d’entraînement et de test. Or dans la plus part des pays occidentaux, la simple possession d’image à caractère pédopornographique est interdite. Comment font-ils (s’il le font vraiment)?

Le 25/09/2023 à 20h 42

Tu peux nous en dire un peu plus ? La BNF ?

Le 22/09/2023 à 14h 54

Pour revenir au simulateur, l’ADEME précise un certain nombre d’hypothèses de transport, notemment le taux de remplissage moyen des camions entre les différents plateformes logistiques: entre 15 et 20%… Ça me paraît très bas (sauf éventuellement pour l’étape de livraison à domicile).
Il aurait été intéressant d’avoir un résumé final de la part de chaque composante (transport routier, emballage, stockage) dans le bilan carbone complet.

Le 30/08/2023 à 13h 23

Intéressant comme syntaxe, ça allège beaucoup le CSS de fait. Savez vous si Webkit et Blink supportent également le CSS nesting?

Le 22/08/2023 à 16h 23

Je sais que l’utilisation d’un IA nécessite boucoup moins de computations que celles nécessaires à son entraînement. N’empêche, résoudre un CaptaCha (ou équivalent), ça ne doit pas être négligeable en coût (pour faire du scraping ou du deni de service à coup de dizaines de milliers de requêtes par secondes ). Pour moi, la question pertinente, ce n’est pas est-ce qu’une IA peut résoudre rapidement un vulgaire test de CaptaCha, on se doute bien qu’elle sait déjà le faire très rapidement étant données les tâches bien plus complexe qu’elle “résout”. Mais est-ce à coût marginal ?

Le 12/08/2023 à 07h 06

OK, mais le bornage à une antenne X ou Y n’est pas un élément de facturation n’est-ce pas ?

Le 11/08/2023 à 19h 15

Pour les traces Email je comprends (Google logue toutes les IPs d’utilisation ? sur 10ans ?) mais pour les bornages je suis étonné que les opérateurs conserve tous les bornage sur des durées pareille. Ça en fait des données par terminal et par opérateur ! Quelqu’un sait si c’est pareil en France ? J’en étais resté aux seules fadettes (liste des numéros appelés).

Le 28/07/2023 à 16h 39

Enfin quelqu’un qui tient ce genre de propos! Je suis pour le local dans l’absolu, et je suis convaincu qu’une forme de décroissance s’imposera tôt ou tard (soit par le consommateur épris de sobriété, soit par la loi si nous trouvons un consensus dans un monde merveilleux, soit à terme par la guerre). Mais produire près de chez soit, OK, si et seulement si l’impact global n’est pas significativement plus sévère. Un champ, une mine, un parc éolien, c’est délocalisable, mais jamais à rendement égal. En imaginant la paix dans le monde et un gouvernement mondial avec les mêmes normes enviromentales et sociales partout, pas sûr qu’il soit pertinent de réduire significativement les transports, mais plutôt de spécialiser les productions sur les critères géographiques et physiques donnés. Un peu comme aujourd’hui en somme mais en beaucoup mieux.

Le 21/07/2023 à 11h 25

?? C’est vraiment possible ça ? Courant ? Légal ?

Le 19/07/2023 à 16h 57


(reply:2143445:Trit’)


Idem, merci pour le lien. Je ne connaissais pas ce Ploum, et c’est très rafraîchissant ! Je conseille la retranscription de sa dernière “conférence” ici. Ça résume bien sa pensé.

Le 10/07/2023 à 21h 40

Je suis étrangement peu impressionné. Soit on ne voit que le tout petit sommet de l’iceberg, soit ce Xandr est très en retard. Ou alors c’est un marché spécifique pour l’achat de pannel pour des usages spécifiques au 20 ème siècle.
Ce que je veux dire par là c’est que j’imagine très aisément que Google, par exemple, possède pour chacuns des utilisateurs, un vecteur de dimmenssion X contenant des milliers de sous paramètres qui part inférence peuvent lui permettre de faire un ciblage très largement plus fin que des grandes catégories (par exemple métier lieux visités les x derniers mois intérêt pour les meubles art déco possède un smartphone de moins de plus de 2 ans utilise un VPN possède un compte utilisateur sur le site Tartempion adore Maria Carrey a déménagé il y a moins de 2 mois grand mère à moustache * je m’arrête là). En tout cas, je ne vois rien qui techniquement empêcherait gg d’obtenir ce genre de dataset pour un utilisateur moyen de ces services, soit une grande partie de la population européenne.
Ce que je comprends, c’est que google ne vend pas ces données, mais il peut proposer un ciblage publicitaire de ce niveau là, n’est ce pas ?

Le 27/06/2023 à 16h 33

Idem, félicitations pour cet article. Mme Saliou nous offre depuis son arrivée une sélection de sujets qui donne tout son sel à la ligne éditoriale déjà si particulière de NextImpact. Merci.



Une question: En France, un particulier ou une personne morale qui achèterait auprès d’un brocker par exemple des données nominatives de géo-localisation liées à un lieu de culte et/ou un centre d’accueil LGBT, serait il condamnable du simple fait de l’interdiction de constituer (si j’ai bien compris) des bases de données basées sur l’orientation sexuelle ou religieuse ?

Le 14/06/2023 à 12h 20


carbier a dit:


ce jeu d’apprentissage est uniquement basée sur ce qu’on trouve sur le Net, qui lui même est fortement non représentatif de la réalité,


Comme le note Carbier, l’IA génère une représentation de nos représentations (au final, en exagérant un peu, le Web n’est le support que d’une seule activité humaine: la communication). Sur une liste de biais principalement visuels types (couleur de peau, sexe apparant), il m’apparaît relativement simple techniquement de totalement débiaiser. Dans les banques de données taguées humainement ou par un autre modèle, j’imagine que sexe et couleur de peau sont des attributs systématiquement renseignés ou renseignables. Du coup ou pourrait “forcer” Le générateur à produire des images 51%/49% femme /homme ou en proportion des couleurs de peaux mondiale tant que le prompt de l’utilisateur ne les specifie pas. La seule chose à modifier serait l’interpretateur de prompt utilisateur, relativement simple à faire sur quelques biais de base.



C’est un choix technique à faire (voire législatif demain pour les plateformes B2C ?) et donc c’est politique.



Je ne dis pas qu’il faut le faire (dessine moi un pygmé-> voici un indien avec une lance et une toje). C’est assez utile par exemple pour prendre conscience de nos biais de représentation, qui pour la quasi totalité nous restent inaccessibles.

Le 02/06/2023 à 11h 29

Je ne suis pas sûr que ça soit un problème. Je pense que, au-delà de l’aspect intéressant de l’exercice, identifier qu’un texte provient d’une IA ne sert à rien. Et idem pour les montages photos / vidéos.



Tout ça était déjà possible auparavant. Il suffit de se souvenir de https://fakirpresse.info/moi-journaliste-fantome-au-service-des-lobbies pour voir que la production par un humain n’est pas un critère de qualité. La seule chose qu’on change, c’est le prix : ça devient encore moins cher de générer du pipeau et des images bidonnées. Mais que ça soit bidonné par une IA ou un humain, ça reste juste des articles ou images bidons. Ça fait effectivement une différence pour la vidéo, mais pour le texte ou les photos ce n’était déjà pas très cher.



La période va être un peu compliquée dans les prochains temps, le temps que les gens comprennent qu’une photo ou une vidéo n’a plus aucune valeur de preuve – je pense d’ailleurs que les vendeurs de solutions vidéo de « sécurité » devraient travailler sur des signatures cryptographiques pour authentifier leurs vidéos). Mais après ça, on s’adaptera. Il y aura même peut-être des effets positifs (le chantage à la sextape dans un monde de deepfakes, ça doit marcher beaucoup moins bien…)

Excellent contre-point. Merci pour l’article ! Quand à Olivia Grégoire, c’est étonnant qu’elle ne se soit pas fait allumé par la vraie presse (ou alors j’ai loupé un épisode).

Le 24/05/2023 à 15h 06

Au delà de l’intérêt et de la démarche, largement discutable (en terme de réponse proportionnée à un problème bien réel qui n’a pas attendu les NTC pour exister), je m’interroge sur la faisabilité technique. Internet étant ce qu’il est, comment serait-il possible d’empêcher concrètement un échange chiffré de bout en bout ? Sauf à analyser en temps réel tout les flux de données transitant par L’UE, en supposant qu’on puisse détecter instantanément toute donnée chiffrée, la seule solution serait d’instaurer une gigantesque blacklist européenne blanquant tout échange depuis ou vers les dites IP / serveur ? J’ai bon ? Même avec l’ip v6, on serait rapidement dépourvu non ?

Le 14/04/2023 à 19h 43

@Jean-Marc,
Le “Hasard ou coïncidence” semble sarcastique.
Tu sous-entends que qu’Idemia aurait pu, très fortuitement bien sûr, assister directement le ministère pour la rédaction du CCTP ? C’est assez courant, mais en l’espèce, dans les procédures de marché public en France, c’est autorisé sous réserve d’exclusion automatique de “l’aidant”, dont le rôle d’AMO est ainsi constitué de fait, pour le dit marché qu’il a participé à spécifier.



Bien sûr, ceux qui montent le marché coté ministère peuvent faire du sourcing auprès d’un panel de soumissionnaires potentiels, de manière formalisée (RFI par exemple) ou non, c’est légal. Mais demander à un attributaire pressenti de fournir des specifications techniques pour que ce dernier soit (seul) dans les cordes et que tout roule, c’est à minima amoral.



Sinon, pour les marchés de travaux publics, au delà d’un certain montant, à minima 3 soumissionnaires doivent remettre des offres conformes pour que l’appel d’offre puisse aboutir à une attribution de marché. D’après ce qu’indique le début de l’article, ca risque d’être difficile ici non ? J’imagine que le ministère de l’intérieur bénéficie de procédures d’attribution plus souples que d’autres maîtres d’ouvrages. A creuser ?

Le 14/04/2023 à 19h 14

Très Intéressant. Merci Glandos.
Mais en pratique, un Hash sur une machine moderne, n’est-il pas limité par la vitesse de lecture des données sur disque ou SSD plutôt que l’algo lui même sur CPU ou GPU ? (C’est une vrai question).



J’avais cru comprendre qu’un Hash, c’était en gros des sommes de bits particulières calculées modulo un très grand nombre premier. La somme pouvait se faire en temps réel au cours de lecture séquentielle des données, restait quelques divisions, qui si grand soit le nombre à diviser, ne nécessitent que “quelques” cycles d’horloges, soit bien moins que le temps de lire un gros fichiers à hasher (sauf pour un très petit fichier).



J’avais du mal comprendre apparemment. Tu saurais m’expliquer ?

Le 12/04/2023 à 11h 09

Le terme “indigénisation” dans le contexte m’apparait assez obscure. Quelqu’un pour intuiter le sens recherché dans cette phrase ?