votre avatar Abonné

ImpactID

est avec nous depuis le 20 juin 2017 ❤️

Bio

Oups.
On dirait que quelqu'un ici aime garder ses petits secrets, comme si de par hasard il y avait quelque chose à cacher...
Désolé, ô lectrice de passage, cher lecteur égaré, pas de révélation sensationnelle pour le moment sur ce profil.
Repassez plus tard ?

108 commentaires

Terrorgram

Le 24/04/2024 à 23h 26

Au début de l'article, je ne comprenais pas. Je croyais que l'intention était satirique:"Terorgram" ,ca me faisait penser aux nazis sur la face cachée de la lune comme dans un bon gros nanard du dimanche... L'impression persiste à la lecture, avec des protagonistes décérébrés faisant moultes références à la culture populaire entre Conan le barbare, Rambo, idiocracie et divers mangas. Et puis force est de constater que non, je me suis trompé. Un article de J. M. Manach en plus, c'est rarement de la godriole. C'est désespérant.

Et dire qu'une part tres significative de la population s'apprête à voter pour des partis dont l'imaginaire est largement partagé avec celui de ces "saints" (le grand remplacement étant publiquement revendiqué par certains de leurs représentants)... Je comprends pourquoi, mais ça ne pardonne pas. Nous nous en mordrons tous les doigts, moi compris pour n'avoir pas fait assez pour convaincre mes concitoyens de réfléchir autrement.

D'ailleurs, les "saints" me font penser que la distinction entre terrorisme religieux et idéologique évoquée en début d'article n'est absolument pas pertinente : l'imaginaire et le schéma dialectique sont pour grande partie identiques. (En tant qu'athé je considère que toute religion, même modérée et en accord avec les normes temporelles, est une idéologie politique. Mais c'est une opinion qui est loin de faire consensus, donc je limite l'analogie au champ de l'extrémisme politique et religieux)

La Section 702 de la loi sur la surveillance du renseignement étranger (Foreign Intelligence Surveillance Act – FISA)

Le 15/04/2024 à 23h 16

C'est étrange, j'avais l'impression que les forces de l'ordre et le renseignement américain avaient beaucoup plus de l'attitude pour contrôler ce qu'ils veulent, quand ils le veulent. A la lecture de cet article, je me demande dans quelle mesure, ce n'est pas pas au contraire plus restrictif qu'en France par exemple. À l'étranger, ils font ce qu'ils veulent, mais sur leur sol ça a l'air bien cadré. Je n'arrive pas à me faire un avis. Un "simple" enquêteur et je France semble pouvoir faire pas mal de choses (cf. d'autres articles sur le sujet sur Next cette année).

Le projet de cable de farnorthfiber.com

Le 04/04/2024 à 17h 02

Juste un commentaire sur le début de l'article :
D'une, le satellite geostationnaire pour la data, c'est un peu has-been non ? Les constellations récentes sont en orbite basse avec une latence beaucoup plus faible. Après, est-ce qu'il y a beaucoup de données passant d'un satellite à l'autre pour faire de la longue distance, je ne crois pas. Le sat le plus proche communique probablement au relais terrestre le plus proche, et on repasse par câble.

De deux, il est à mon humble avis inconcevable aujourd'hui de faire passer une part significative du trafic par satellite. La bande passante totale d'une constellation est probablement bien plus fiable que celle d'un unique câble transatlantique récent (si ça a un sens, je ne suis pas sûr. C'est plutôt la bande passante de satellites de l'éphémèride à un temps T à un endroit donné qui compte).

Un intercepteur de la Police aux frontières

Le 19/03/2024 à 22h 49

Quelle débauche de technologie, alors qu'on peine à assurer les services de base à Mayotte (eau potable, déchet, énergie, sans parler de la scolarisation, de la santé ou encore l'accès à la justice) . J'entends que la surpopulation de l'île en grande partie due à à l'immigration irrégulière fait partie du problème, mais tout de même. Avec cet argent, combien de pompes, de kilomètres de tuyaux, de générateurs, d'écoles etc... Je ne dis pas qu'il ne faut rien faire pour réguler les arrivées, mais c'est tout de même obscène.
Et puis, la prochaine étape c'est quoi ? Des mines sur les plages et des tourelles mitrailleuses sur l'ensemble de frontières extérieures de l' Europe ? Si les écarts de développement ne se réduisent pas, j'ai bien peur que nous y viendrons, et de notre vivant à nous commentateurs du soir.

Des billets de cinquante euros.

Le 18/03/2024 à 12h 32

Juste pour comprendre: Pourquoi une brève parue vendredi dernier réapparaît dans le Brief de ce lundi ? Il y a eu une mise à jour ? Si oui, ce serait bien de l'indiquer explicitement.

Le 11/03/2024 à 16h 18

Il faudrait Jacquouille vienne visiter le 21 ème siècle : 2To/s et par puce, c'est dingue !

Deux requins étiquetés par portions avec les marques des entreprises d'IA génératives nagent dans l'océan

Le 28/02/2024 à 22h 11

Un plugin WordPress peut valoir cession de la propriété intellectuelle du contenu d'un site ? C'est compatible avec le droit français ce genre de clause ? Si oui, j'en suis très étonné.

Sinon, de manière générale, les développeurs d'IA crawlent tout ce qu'ils trouvent pour alimenter leurs modèles non ? Du coup ils achètent donc des pseudo droits à divers partenaires uniquement pour diminuer leur exposition à des plaintes non ?

Forage d'un doublet de géothermie profonde

Le 23/02/2024 à 08h 15

Je me rappelle plus, l'usine va faire exclusivement des batteries pour VE ou pas?

Sinon le terme gigafactory me fait tellement marrer, à chaque fois j'ai l'impression que c'est un gosse qui a trouvé le nom :D

Oui, très bien, mais entre l'extraction et la fabrication de batteries, il y a le raffinage. En gros l'étape la plus énergievore et qui produit le plus de coproduits (c.a.d des déchets pour la plupart). Au delà de la ressource minière, c'est c'est surtout sur le raffinage que nos amis chinois ont un quasi monopole. Et nous, on va raffiner où ?

une jeune femme s'apprête à enregistrer une vidéo d'elle-même avec un smartphone placé dans un anneau lumineux.

Le 22/02/2024 à 10h 29

que nenni : https://www.syntec.fr/convention-collective/obligations-militaires/#article-11-3

donc tous tes employeurs étaient hors des clous !

Franchement, je suis très étonné de lire ça. Merci pour le lien. Encien cadre d'un groupe de plusieurs milliers de personnes, dont un très large proportion de Cadres, c'était seconde pour tout le monde, quelque soit le trajet, sauf pour les pontes (train ou avion multi escales jusqu'à LlAutre bout du monde, et on voyageais beaucoup avant le Covid).

Une femme est attaquée par une nuée d'oiseaux représentés par l'ancien logo de Twitter, auxquels se mêlent les logos de YouTube, TikTok et Instagram.

Le 06/02/2024 à 19h 55

Incroyable. 3 million par jour. Est-ce que dans le csv, il est indiqué pour chaque cas:
1. s'il y a eu intervention humaine (si oui, ça peut être intéressant de voir si c'est signicatif, ou si comme je l'imagine l'écrasante majorité est purement du fait d'algorithmes)
2. s'il y des méta-données qui permettent de reconstruire un tant soit peu le contenu (titre, mots-clés, liens divers)

Sinon, l'intégration d'une vue Power-Bi, c'est facile à faire ? Si oui, sans 36 trackers Microsoft?

Hâte de découvrir vos prochains articles sur le sujet si les données sont intéressantes et réellement exploitables.

Une empreinte digitale latente

Le 01/02/2024 à 07h 59

La décision vaut-elle jurisprudence pour la France ? Cf les multiples articles publiés ici sur la conservation des données biométriques par les ministères de l'intérieur et de la justice. Ça devrait être applicable à tout registre judiciaire en comportant, a fortiori pour des personnes non condamnées, voire simples témoins, ou même les victimes dans les affaires pénales.

Le 30/01/2024 à 21h 26

Ça me rappelle les divers jeux concours de mon enfance (90s),pour lesquels on trouvait plusieurs présentoirs à la sortie des supermarchés, avec des formulaires à remplir (ou encore ceux des paquets de céréales pour recevoir des goodies à 3 centimes). Je comprend aujourd'hui que le business modèle était sûrement déjà celui le ciblage publicitaire (par courrier).
Quelqu'un saurait confirmer ?

Drapeaux de l’Union européenne

Le 30/01/2024 à 10h 15

Je viens de jeter un œil : L'exécutable Windows fait plus de 200Mo ! Je n'ai pas regardé les sources, mais qu'est-ce qui peut bien justifier une telle obésité ?

Graphe représentant une antenne terrestre envoyant du texte, de la voix et des données vers un réseau d'un opérateur partenaire puis vers le réseau terrestre de Starlink puis vers son réseau satellitaire et enfin vers un smartphone « non modifié ».

Le 06/01/2024 à 13h 56

Mais du coup, si ou parle bien ici de 2/3/4G, Starlink négocie / achette des licences pour des bande de fréquence pour chaque pays couvert ?
Si oui, chaque satellite change de fréquence d'émission toutes les quelques minutes d'un pays à l'autre ?

Un quidam cherche à se géolocaliser

Le 19/12/2023 à 22h 46

Sur une réquisition validée par un juge, certainement. Puisque les écoutes sont déjà autorisées et pratiquées, je pense que c'est même déjà activement utilisé.

Et bien justement, en lisant l'article sur l'ex flic/ripoux Haurus cité dans l'article, j'ai l'impression que ce n'est pas si simple. Si l'enquêteur a déjà des cibles (sim ou EMAI), pas de problème. Mais rechercher des correspondances de trajectoires dans l'intégralité des donnés opérateurs toutes antennes confondues, je n'ai pas l'impression que ce soit possible (via la PNIJ en tout cas, c'est bien sûr possible théoriquement).

Le 18/12/2023 à 18h 34

Et en sinon France, ce serait légal pour les forces de l'ordre et/ou la justice de faire une telle demande?
Sans aller jusqu'à la géo-localisation, les autorités peuvent elles demander aux opérateurs téléphoniques l'ensemble des SIM qui correspondent (via bornage) par exemple à l'itinéraire d'un suspect reconstitué sur la base d'autres indications?

Un mélange entre une réunion d’Anonymous et de tête d’ampoules, pour le meilleur et le pire

Le 17/12/2023 à 20h 20

La simulation Nano-GPT est très impressionnante (sur la forme, animations 3D pertinentes, explications textuelles en parallèle). C'est bien expliqué, compréhensible si on a un bagage de maths post bac (je ne prétend pas avoir tout compris). Mais il ne s'agit ici que de l'interrogation du modèle, pas de l'entrainement qui semble être le nerf de la guerre :
En bref, on constate que pour un simple tri alphabétique de 5 caractères, des milliers de multiplications, quelques centaines de passage à l'exponentielle et au logarithme sont nécessaire (même si j'imagine qu'ils ont des implémentations simplifiés et très efficaces pour ces fonctions), ce qui doit nécessiter des dizaines de milliers de fois plus de cycles de processeurs qu'une simple implémentation d'un algo de tri basique.

L'exemple est certes trivial, mais ca nous rappelle quand même que pour le bien de tous (bilan énergétique global entre autres), mieux vos apprendre les maths, apprendre à coder des choses simples correspondant à nos usages de bases, plutôt que de demander une réponse prémâchée à un oracle dont on ne sait pas grand chose.

En somme, il faudrait réserver leur usage à l'analyse de donnée inapprochables par méthodes d'analyse conventionnelles (mon petit doit me dit que moins de 0.1% de la population a de tels besoins), voire éventuellement (c'est triste) aux travaux créatifs...

station électrique pour voitures

Le 07/12/2023 à 22h 50

Genre, le truc qu'on vient de réglementer et qui s'est fortement réduit ? (à tel point qu'une petite partie du réchauffement récent peut être attribué à la réduction du souffre dans l'atmosphère).

Si on se consentre sur l'impact en équivalent CO2, le transport maritime est imbattable. Le rapport poid puissance d'un navire est sans commune mesure avec tous autre moyen de transport. À la tonne kilomètres, il n'y a pas photo.
Reste que paradoxalement, si le transport maritime est l'un des "moins urgent" à decarboner car déjà comparativement vertueux, c'est l'un des plus simple pour un passage à l'échelle industrielle (on peut emporter de très grosses batteries pas trop chères, au sodium par exemple, au sodium de plusieurs dizaines de milliers de tonnes si besoin. Le segment motorisation de forte puissance existe déjà.)

Api

Le 06/12/2023 à 17h 54

C'est vachement bien la CNIL tout de même. Dommage qu'elle ne puisse emmetre que des recommandations. J'imagine assez bien qu'un ministre de poid puisse demander à son administration de s'asseoir dessus.
En gros, il faudrait que la CNIL ait un réel pouvoir normatif, à tout le moins sur la donnée gérée par des entités publiques.

Une femme est attaquée par une nuée d'oiseaux représentés par l'ancien logo de Twitter, auxquels se mêlent les logos de YouTube, TikTok et Instagram.

Le 25/11/2023 à 15h 25

Rien à voir avec l'article, mais à partir de ce point du fil de commentaires, le texte déborde à droite du cadre (Webkit, Android).

Puces en silicium

Le 23/11/2023 à 22h 27

Actuellement, ça ne semble pas trop le cas. Par exemple Aluminium Dunkerque et OVH sont installés à côté de la centrale nucléaire (mais vraiment juste à côté), pas du tout là où il y a du solaire ou des éoliennes.

Peut importe (ou alors marginalemant) où le consommateur est implanté. Le réseau étant très fortement interconecté, tu peux être implanté à côté d'un réacteur nucléaire, et avoir un contrat "au surplus", la puissance de base étant consommée par d'autres (les habitants par exemple).

#Flock fait son petit commerce et refourgue, lui aussi, sa came

Le 18/11/2023 à 14h 50

Très bien le dessin bonus, très bien vu.
Sur la forme, le style est différent, ça me fait penser à Sempé pour les personnages, à Blain pour le décor (le parquet n’est qu’un simple zigzag, efficace, une épure pour ne pas surcharger). Sinon J’aime aussi cette sobriété monochrome, plus proche du dessin de presse.


Retour des humains sur la Lune : Artemis I décollait il y a un an, Artemis II doit décoller dans un an

Le 17/11/2023 à 09h 43

Ils l’ont nommée AxEMU


LOL, la combinaison est développé en partenariat avec Prada !! Le sponsoring n’a de limite que notre imagination désormais.


La CNIL inflige 10 « sanctions simplifiées » suite à de « nombreuses plaintes »

Le 08/11/2023 à 17h 21

Ça va probablement dans le bon sens, mais selon le rapport annuel 2022 ici. A comparer à 12000 plaintes. J’imagine aisément que la majorité des plaintes se concentrent sur un petit nombre de gros acteurs, et que toutes les plaintes ne sont pas forcément légitimes. Mais tout de même, je ne sais pas quels sont les moyens humains et financiers de la CNIL, mais ça reste très faible.
Il faut investir (au delà de du bien fondé de l’action de la CNIL pour la protection des citoyens, ça rapporte 100M€ par ans, soit probablement bien plus que ce que ça ne coûte)


L’outil pour retirer des données personnelles de l’entraînement des IA de Meta ne fonctionne pas

Le 30/10/2023 à 09h 27

Mon humble avis, c’est que techniquement, c’est très compliqué de s’assurer que telle ou telle donnée, ou référence aux dites données ne font pas partie d’un jeu de donnée, sans pouvoir qualifier très précisément la donnée, ce que les aillants droit ne souhaitent pas faire.
Au delà de ça, je crois comprendre qu’il est techniquement impossible, sur un modèle déjà entraîné, de retirer ou exclure une part des informations pour générer des résultats (la donnée en elle même n’existant plus que sous forme de vecteur statistiques inintelligible pour l’humain.).
Comme les modèles sont itératifs, les anciens nourrissant ou servant à calibrer les nouveaux, ce problème semble insoluble sauf à repartir d’une page blanche à chaque requête de retrait, ce qui, étant donnés les coûts d’entraînement, est insoutenable économiquement.
Du coup, la seule solution restante, c’est le post traitement des résultats (avec une autre IA ? ) pour qualifier statistiquement la similitude avec des données sous copyright. Ce sera évidemment sujet à interprétation.–> Beaucoup d’argent à venir pour les futurs cabinets d’avocat spécialisés ?


Apple investirait 1 milliard de dollars par an pour revenir dans la course à l’IA

Le 24/10/2023 à 12h 30

Depuis le boom médiatique de l’IA avec l’émergence des produits grand public type Chat GPT. ce que je ne comprends pas, c’est en quoi c’est fondamentalement différent de ce qui était dispo avant, depuis une dizaine d’années avec les assistants vocaux (Siri, Google assistant et Alexa, voire Cortana)?
Je comprend que certaines de leur fonctions phares sont codées en dur (“joue tel titre” , “éteint la lumière” etc.). Mais pour toutes les autres, l’aspect pseudo conversationnel, c’était bien déjà basé sur du deeplearning et reinforced learning non?
A part la taille des modèles, qu’est ce qui provoque le changement de paradigme ?
Pourquoi Apple et Amazon sont considérés en retard sur leur concurrents. Tout le monde utilise bien peu ou prou les mêmes méthodes, et l’algorithmique derrière est un sujet académique qui bien que très complexe est globalement non secret non?



Ça fait beaucoup de questions, mais je crois que j’ai une bonne chance de trouver quelqu’un qui sait à peu près de quoi il parle ici.


Réduire son empreinte environnementale numérique, « c’est comme le tri sélectif : il faut le faire, point barre »

Le 23/10/2023 à 15h 08


whitemoon a dit:


problème des “lemon market”.




Merci de m’avoir appris quelque chose aujourd’hui. L’article wiki est très accessible (en français)


Replay de la soirée de Next

Le 17/10/2023 à 13h 29

+1
Si les journalistes sont charrette (ou gueule de bois si la soirée s’est éternisée) , j’invite modestement mes comparses impatiens qui auraient pris le temps de regarder à nous faire quelques bullets points (en toute subjectivité) en commentaire , car pour l’instant, le lecteur lambda mais fidèle que je suis ne sais RIEN… Merci par avance pour votre impactitude.


Les modèles de langage sont de redoutables outils de compression sans perte

Le 03/10/2023 à 20h 13

Super article. Merci pour tous les liens. J’ai lu celui d’Olivier Rioul, super intéressant (j’imagine que c’est le b.a. ba pour tout étudiant en informatique ou télécom, mais c’est neuf pour moi). Reste à lire tous les autres…


Les discrets lobbyistes états-uniens de la proposition de surveillance des messageries chiffrées

Le 29/09/2023 à 14h 12

Au delà de l’aspect politique, je suis très surpris que ces ONG / sociétés se targent d’avoir développé des solutions d’IA permettant la détection automatique de contenu illicite. Si comme la plus part des modèles actuels, ces IA sont assises sur des formes de deeplearning ou apprentissage renforcé, il faut des bases d’entraînement et de test. Or dans la plus part des pays occidentaux, la simple possession d’image à caractère pédopornographique est interdite. Comment font-ils (s’il le font vraiment)?


Deezer augmente ses tarifs

Le 25/09/2023 à 20h 42

Tu peux nous en dire un peu plus ? La BNF ?


ADEME : un simulateur pour « mesurer l'impact carbone de la livraison de colis »

Le 22/09/2023 à 14h 54

Pour revenir au simulateur, l’ADEME précise un certain nombre d’hypothèses de transport, notemment le taux de remplissage moyen des camions entre les différents plateformes logistiques: entre 15 et 20%… Ça me paraît très bas (sauf éventuellement pour l’étape de livraison à domicile).
Il aurait été intéressant d’avoir un résumé final de la part de chaque composante (transport routier, emballage, stockage) dans le bilan carbone complet.


Firefox 117 disponible avec peu de nouveautés

Le 30/08/2023 à 13h 23

Intéressant comme syntaxe, ça allège beaucoup le CSS de fait. Savez vous si Webkit et Blink supportent également le CSS nesting?


CAPTCHA : les machines « prouvent » plus rapidement qu'elles sont des humains

Le 22/08/2023 à 16h 23

Je sais que l’utilisation d’un IA nécessite boucoup moins de computations que celles nécessaires à son entraînement. N’empêche, résoudre un CaptaCha (ou équivalent), ça ne doit pas être négligeable en coût (pour faire du scraping ou du deni de service à coup de dizaines de milliers de requêtes par secondes ). Pour moi, la question pertinente, ce n’est pas est-ce qu’une IA peut résoudre rapidement un vulgaire test de CaptaCha, on se doute bien qu’elle sait déjà le faire très rapidement étant données les tâches bien plus complexe qu’elle “résout”. Mais est-ce à coût marginal ?


Un tueur en série confondu par ses traces numériques, téléphoniques et bancaires

Le 12/08/2023 à 07h 06

OK, mais le bornage à une antenne X ou Y n’est pas un élément de facturation n’est-ce pas ?


Le 11/08/2023 à 19h 15

Pour les traces Email je comprends (Google logue toutes les IPs d’utilisation ? sur 10ans ?) mais pour les bornages je suis étonné que les opérateurs conserve tous les bornage sur des durées pareille. Ça en fait des données par terminal et par opérateur ! Quelqu’un sait si c’est pareil en France ? J’en étais resté aux seules fadettes (liste des numéros appelés).


Waymo met en pause son développement de camions autonomes

Le 28/07/2023 à 16h 39

Enfin quelqu’un qui tient ce genre de propos! Je suis pour le local dans l’absolu, et je suis convaincu qu’une forme de décroissance s’imposera tôt ou tard (soit par le consommateur épris de sobriété, soit par la loi si nous trouvons un consensus dans un monde merveilleux, soit à terme par la guerre). Mais produire près de chez soit, OK, si et seulement si l’impact global n’est pas significativement plus sévère. Un champ, une mine, un parc éolien, c’est délocalisable, mais jamais à rendement égal. En imaginant la paix dans le monde et un gouvernement mondial avec les mêmes normes enviromentales et sociales partout, pas sûr qu’il soit pertinent de réduire significativement les transports, mais plutôt de spécialiser les productions sur les critères géographiques et physiques donnés. Un peu comme aujourd’hui en somme mais en beaucoup mieux.


Pourquoi 69 % des RSSI français auraient-ils interdit l’utilisation de WhatsApp ?

Le 21/07/2023 à 11h 25

?? C’est vraiment possible ça ? Courant ? Légal ?


Wix va renforcer son arsenal avec un générateur de site basé sur l’IA

Le 19/07/2023 à 16h 57


(reply:2143445:Trit’)




Idem, merci pour le lien. Je ne connaissais pas ce Ploum, et c’est très rafraîchissant ! Je conseille la retranscription de sa dernière “conférence” ici. Ça résume bien sa pensé.


Comment l’industrie de l’adtech segmente et cible les internautes

Le 10/07/2023 à 21h 40

Je suis étrangement peu impressionné. Soit on ne voit que le tout petit sommet de l’iceberg, soit ce Xandr est très en retard. Ou alors c’est un marché spécifique pour l’achat de pannel pour des usages spécifiques au 20 ème siècle.
Ce que je veux dire par là c’est que j’imagine très aisément que Google, par exemple, possède pour chacuns des utilisateurs, un vecteur de dimmenssion X contenant des milliers de sous paramètres qui part inférence peuvent lui permettre de faire un ciblage très largement plus fin que des grandes catégories (par exemple métier lieux visités les x derniers mois intérêt pour les meubles art déco possède un smartphone de moins de plus de 2 ans utilise un VPN possède un compte utilisateur sur le site Tartempion adore Maria Carrey a déménagé il y a moins de 2 mois grand mère à moustache * je m’arrête là). En tout cas, je ne vois rien qui techniquement empêcherait gg d’obtenir ce genre de dataset pour un utilisateur moyen de ces services, soit une grande partie de la population européenne.
Ce que je comprends, c’est que google ne vend pas ces données, mais il peut proposer un ciblage publicitaire de ce niveau là, n’est ce pas ?


Aux États-Unis, l’avortement révélateur des problématiques de vie privée et de désinformation

Le 27/06/2023 à 16h 33

Idem, félicitations pour cet article. Mme Saliou nous offre depuis son arrivée une sélection de sujets qui donne tout son sel à la ligne éditoriale déjà si particulière de NextImpact. Merci.



Une question: En France, un particulier ou une personne morale qui achèterait auprès d’un brocker par exemple des données nominatives de géo-localisation liées à un lieu de culte et/ou un centre d’accueil LGBT, serait il condamnable du simple fait de l’interdiction de constituer (si j’ai bien compris) des bases de données basées sur l’orientation sexuelle ou religieuse ?


Les modèles d’IA génératifs renforcent les biais humains

Le 14/06/2023 à 12h 20


carbier a dit:


ce jeu d’apprentissage est uniquement basée sur ce qu’on trouve sur le Net, qui lui même est fortement non représentatif de la réalité,




Comme le note Carbier, l’IA génère une représentation de nos représentations (au final, en exagérant un peu, le Web n’est le support que d’une seule activité humaine: la communication). Sur une liste de biais principalement visuels types (couleur de peau, sexe apparant), il m’apparaît relativement simple techniquement de totalement débiaiser. Dans les banques de données taguées humainement ou par un autre modèle, j’imagine que sexe et couleur de peau sont des attributs systématiquement renseignés ou renseignables. Du coup ou pourrait “forcer” Le générateur à produire des images 51%/49% femme /homme ou en proportion des couleurs de peaux mondiale tant que le prompt de l’utilisateur ne les specifie pas. La seule chose à modifier serait l’interpretateur de prompt utilisateur, relativement simple à faire sur quelques biais de base.



C’est un choix technique à faire (voire législatif demain pour les plateformes B2C ?) et donc c’est politique.



Je ne dis pas qu’il faut le faire (dessine moi un pygmé-> voici un indien avec une lance et une toje). C’est assez utile par exemple pour prendre conscience de nos biais de représentation, qui pour la quasi totalité nous restent inaccessibles.


Comment tenter d'identifier les textes émanant d'intelligences artificielles génératives ?

Le 02/06/2023 à 11h 29

Je ne suis pas sûr que ça soit un problème. Je pense que, au-delà de l’aspect intéressant de l’exercice, identifier qu’un texte provient d’une IA ne sert à rien. Et idem pour les montages photos / vidéos.



Tout ça était déjà possible auparavant. Il suffit de se souvenir de https://fakirpresse.info/moi-journaliste-fantome-au-service-des-lobbies pour voir que la production par un humain n’est pas un critère de qualité. La seule chose qu’on change, c’est le prix : ça devient encore moins cher de générer du pipeau et des images bidonnées. Mais que ça soit bidonné par une IA ou un humain, ça reste juste des articles ou images bidons. Ça fait effectivement une différence pour la vidéo, mais pour le texte ou les photos ce n’était déjà pas très cher.



La période va être un peu compliquée dans les prochains temps, le temps que les gens comprennent qu’une photo ou une vidéo n’a plus aucune valeur de preuve – je pense d’ailleurs que les vendeurs de solutions vidéo de « sécurité » devraient travailler sur des signatures cryptographiques pour authentifier leurs vidéos). Mais après ça, on s’adaptera. Il y aura même peut-être des effets positifs (le chantage à la sextape dans un monde de deepfakes, ça doit marcher beaucoup moins bien…)


Excellent contre-point. Merci pour l’article ! Quand à Olivia Grégoire, c’est étonnant qu’elle ne se soit pas fait allumé par la vraie presse (ou alors j’ai loupé un épisode).


L'Espagne voudrait que l'Europe interdise le chiffrement de bout en bout

Le 24/05/2023 à 15h 06

Au delà de l’intérêt et de la démarche, largement discutable (en terme de réponse proportionnée à un problème bien réel qui n’a pas attendu les NTC pour exister), je m’interroge sur la faisabilité technique. Internet étant ce qu’il est, comment serait-il possible d’empêcher concrètement un échange chiffré de bout en bout ? Sauf à analyser en temps réel tout les flux de données transitant par L’UE, en supposant qu’on puisse détecter instantanément toute donnée chiffrée, la seule solution serait d’instaurer une gigantesque blacklist européenne blanquant tout échange depuis ou vers les dites IP / serveur ? J’ai bon ? Même avec l’ip v6, on serait rapidement dépourvu non ?


MTop Slim, le capteur biométrique nomade qui répond aux désidératas du ministère de l'Intérieur

Le 14/04/2023 à 19h 43

@Jean-Marc,
Le “Hasard ou coïncidence” semble sarcastique.
Tu sous-entends que qu’Idemia aurait pu, très fortuitement bien sûr, assister directement le ministère pour la rédaction du CCTP ? C’est assez courant, mais en l’espèce, dans les procédures de marché public en France, c’est autorisé sous réserve d’exclusion automatique de “l’aidant”, dont le rôle d’AMO est ainsi constitué de fait, pour le dit marché qu’il a participé à spécifier.



Bien sûr, ceux qui montent le marché coté ministère peuvent faire du sourcing auprès d’un panel de soumissionnaires potentiels, de manière formalisée (RFI par exemple) ou non, c’est légal. Mais demander à un attributaire pressenti de fournir des specifications techniques pour que ce dernier soit (seul) dans les cordes et que tout roule, c’est à minima amoral.



Sinon, pour les marchés de travaux publics, au delà d’un certain montant, à minima 3 soumissionnaires doivent remettre des offres conformes pour que l’appel d’offre puisse aboutir à une attribution de marché. D’après ce qu’indique le début de l’article, ca risque d’être difficile ici non ? J’imagine que le ministère de l’intérieur bénéficie de procédures d’attribution plus souples que d’autres maîtres d’ouvrages. A creuser ?


Comment vérifier l'intégrité d'un fichier via son empreinte SHA256 ?

Le 14/04/2023 à 19h 14

Très Intéressant. Merci Glandos.
Mais en pratique, un Hash sur une machine moderne, n’est-il pas limité par la vitesse de lecture des données sur disque ou SSD plutôt que l’algo lui même sur CPU ou GPU ? (C’est une vrai question).



J’avais cru comprendre qu’un Hash, c’était en gros des sommes de bits particulières calculées modulo un très grand nombre premier. La somme pouvait se faire en temps réel au cours de lecture séquentielle des données, restait quelques divisions, qui si grand soit le nombre à diviser, ne nécessitent que “quelques” cycles d’horloges, soit bien moins que le temps de lire un gros fichiers à hasher (sauf pour un très petit fichier).



J’avais du mal comprendre apparemment. Tu saurais m’expliquer ?


Semi-conducteurs : les restrictions ciblant la Chine pénalisent aussi TSMC et Taïwan

Le 12/04/2023 à 11h 09

Le terme “indigénisation” dans le contexte m’apparait assez obscure. Quelqu’un pour intuiter le sens recherché dans cette phrase ?


Firefox 112 peut afficher les mots de passe via un clic droit

Le 12/04/2023 à 11h 04

Est-ce vraiment une bonne idée, l’accès au mdp en clair sur simple clic droit ? Ca ouvre la voie à diverse indiscretions “humaines”. Sur Chrome, l’accès aux mdp gestionnaire peut être subordonnée à une verification supplémentaire (empreinte digitale chez moi mais c’est configurable). J’imagine que cette fonctionnalité reste optionnelle.


Des recherches des années 50 à GPT-4 en passant par BERT, quelles évolutions amènent les grands modèles de langage ?

Le 05/04/2023 à 07h 49

Merci pour cet article. Je l’aurais aimé plus long.
À noter que Nicolas Martin (ex. France Q) avait fait 2 superbes émission sur l’évolution des modèles de langage il y a 2 ans:
https://www.radiofrance.fr/franceculture/podcasts/la-methode-scientifique/parlez-vous-l-ordinateur-7914870
https://www.radiofrance.fr/franceculture/podcasts/la-methode-scientifique/traitement-automatique-des-langages-do-you-speak-computer-8285510.


Réseaux sociaux : il n’y a pas que Twitter dans la vie

Le 28/03/2023 à 11h 45

Bel article. Merci.
Il y a qqch. que je ne comprends pas. Les derniers nombre d’utilisateurs mentionnés pour Mastodont (toutes instances confondues, j’avoue ne pas bien comprendre si l’inscription reste centralisée) et Truth Social sont respectivement de 1,4M et 8M. Il a assurément de nombreux nostalgiques de Trump, mais qu’il y en ait plus sur Mastodont (qui pourrait j’imagine accueillir ces nostalgiques sur une instance dédiée) m’interroge. Une idée d’explication ?