votre avatar Abonné

fred42

est avec nous depuis le 17 décembre 2010 ❤️

Bio

Je n'ai rien à cacher, mais ce n'est pas une raison pour m'exposer.

Le 42 n'est ni mon âge, ni mon année de naissance, ni mon département.

18398 commentaires

Le 16/01/2024 à 19h 59

Pourquoi penses-tu que l'on ne gagnera pas en confidentialité vis-à-vis des US alors que c'est la raison d'être principale de l'offre ?

Le 16/01/2024 à 19h 13

Je préfère ce slogan comme sous-titre de cette actualité. Sans doute parce que plus proche de ce que je suspecte qu'il se passera. J'espère avoir tord.

C'est parce que tu n'aimes pas la poésie que tu dis ça !

Le 16/01/2024 à 19h 07

"Il n'y a pas d'envoi de données aux USA dans cette offre".

Ah bon ? Tu es sûr de toi ? Parce que la géolocalisation des serveurs n'a aucune importance. Un transfert de données peut parfaitement se faire avec des serveurs localisés à Château neuf du Pape (ou n'importe où ailleurs !) Les serveurs Azure vont être la propriété de Cap Gemini ? Avec aucun accès pour Microsoft ?Les codes sources de la solution Azure sont elles disponibles en totalité ? De notre 6ème puissance mondiale, il n'en reste vraiment plus grand chose ! Et pour son AI ? Enfin le Microsoft va faire comment si elle n'a pas accès à toutes les données de tous ses clients ? Enfin quid de la solidité du nouveau Data Privacy Act qui remplace le Privacy Shield qui remplace les Safe Harbour. Perso, si j'étais le conseil d'une entreprise française, je ne pourrais que déconseiller de choisir Blue !

Perso, si j'étais le conseil d'une entreprise française, je ne pourrais que déconseiller de choisir Blue !
Ça tombe bien, l'essentiel des entreprises françaises ne sont pas la cible de Bleu. Seules les OIV ou OSE le sont, il n'y a qu'à lire l'article pour le savoir.

Néanmoins, vu le niveau de sécurité visé, si elles pouvaient être clientes et si elles voulaient ce niveau de sécurité, ce serait idiot de leur déconseiller Bleu, la seule alternative pour avoir de la technologie Azure étant Microsoft et que ça pose au moins des problèmes de juridiction US.

Quant à tes autres questions, comme je l'ai dit, ça sera l'ANSSI qui jugera de la pertinence de la solution et je leur fais bien plus confiance qu'à toi ou moi. Dans l'absolu, contrôler ce qui rentre ou sort d'un Cloud que tu gères, ce n'est pas très difficile quand tu as l'expérience d'Orange dans les réseaux.

Oui, les serveurs seront la propriété de Bleu (et pas de Cap Gemini ni d'Orange qui eux sont propriétaires de Bleu).

Quant au Data Privacy Act, il n'a rien à voir avec la choucroute. Celui-ci est ne protège que les données personnelles qui sont envoyées depuis l'UE aux USA. Encore une fois, ce n'est pas l'objet de cette offre. Celle-ci est là pour protéger des données potentiellement plus importantes que des données personnelles.

Ce n'est pas parce que l'article est écrit sur un ton suspicieux que l'offre n'est pas sérieuse. Ce n'est pas sur un site plus vitrine qu'autre chose aujourd'hui que les solutions techniques sont expliquées. J'espère que le rédacteur le sait.

Le 16/01/2024 à 18h 09

Bravo pour l'argumentation de ces propos.
Où est le scandale ?
Qui sont pris pour des idiots ?
Qu'est-ce qui est gros ?

Le 16/01/2024 à 16h 36

Il n'y a pas d'envoi de données aux USA dans cette offre. Et tu as oublié l’adjectif "personnelles" pour qualifier les données dont tu veux probablement parler. Donc, quand/si l'accord actuel sur la protection des données personnelles traitées aux USA tombe(ra), cela ne changera rien pou Bleu.

Il y a ici une étanchéité a priori complète entre Bleu et Microsoft.
L'objectif de ce montage est de se protéger de tout effet d'une loi US en ayant une société française qui gère tout en France.
L'ANSSI vérifiera bien évidement cette étanchéité.

Le 16/01/2024 à 13h 25

C'est abordé dans l'article et ce n'est pas surprenant : il faut du temps pour se mettre au bon niveau sur ce genre de technologie.

Le 16/01/2024 à 13h 18

Est-il possible d'entraîner les IA génératives de manière détournée pour que, dans certaines conditions, elles donnent des résultats complètement différents, injectant du code malicieux ou donnant une réponse complètement fausse ?
Je ne comprends pas le de manière détournée. Cet entraînement est délibéré et dans le but d'avoir des résultats différents dans certaines conditions.

Je comprendrais l'utilisation de l'expression si cela était possible en produisant du contenu en ligne qui serait ensuite utilisé pour entraîner une IA et que ce contenu "pollué" ferait que le comportement varierait suivant le prompt ou en cas d'un autre déclencheur. Il faudrait aussi que ce contenu "pollué" ne soit pas détecté comme trompeur avant utilisation.

Remarque :je n'ai pas lu les 70 pages de l'étude.

Le 16/01/2024 à 12h 44

doublon

Le 16/01/2024 à 12h 44

On peut se demander toutefois ce qu’il en sera de la garantie de l’appareil si le sideloading est utilisé.
Je ne comprends pas pourquoi cela influerait sur la garantie.

Le 15/01/2024 à 18h 49

Tiens moi aussi j'ai eu l'impression de lire un publi reportage signé cloudflare....

Edit : comment fait on pour citer un commentaire ?

Edit : comment fait on pour citer un commentaire ?
Tu le copies/colles ou au moins la partie à laquelle tu réagis.

Comme je viens de le faire.
Et perso, j'ajoute souvent un > devant pour montrer la citation comme ça se faisait dans le temps et comme le markdown définit aussi les citations, comme ça, quand l'outil de commentaires sera enrichi, je n'aurai rien à changer.

Le 15/01/2024 à 15h 41

:pleure:

API day était bien aussi.

Le 15/01/2024 à 18h 46

J'avais tiqué aussi sur modèle algorithmique, parce que pour moi, bien que l'on utilise le terme algorithme pour décrire certains traitements faits par l'IA, c'est un mauvais terme parce qu'un algorithme, c'est Un algorithme est une suite finie et non ambiguë d'instructions et d’opérations permettant de résoudre une classe de problèmes d'après Wikipédia et cette définition me convient parfaitement.
Un algo, c'est donc déterministe et reproductible, tout le contraire de l'IA. Enfin, pour être précis, on ne sait généralement pas comment l'IA arrive à un résultat et on est incapable de décrire les opérations qui ont conduit à la résolution du problème.

En relisant la page présentant ce hall of fame, il ne parlent que de AI, Artificial intelligence et AI tools.

C'était donc probablement une mauvaise idée de vouloir éviter d'utiliser un de ces termes ici.

Parler de modèle statistique n'est pas forcément une meilleure idée.

Le 15/01/2024 à 15h 46

Moi qui me demandais comment un cyclone pouvait atteindre des câbles sous-marins ! :bouletdujour:

Le 15/01/2024 à 15h 31

"Sans précédent": les ventes de PC continuent de chuter dans le monde – bfmtv.com – 11/01/2024 :

« Un phénomène qui souligne la lenteur de la reprise du marché du PC dans un contexte de faible demande et de dépendance des consommateurs à l'égard des promotions, analyse IDC. Car de manière plus globale, les ventes mondiales d'ordinateurs personnels ont connu ces dernières années des baisses consécutives inédites, en rupture avec les tendances historiques observées depuis 1995, souligne l'entreprise. »

« En dépit de ce constat morose, IDC avance un motif d'espoir: les contractions du marché semblent avoir atteint leur point le plus fort et une croissance peut être attendue en 2024 à la faveur des prochaines avancées technologiques qui devraient créer des opportunités de vente pour les constructeurs de PC. »

IDC, ce sont des vendeurs d'espoir et de bonnes nouvelles pour ceux qui achètent leurs études. Il faut toujours se méfier de ce qu'ils disent. En tout cas, ils son généralement optimistes.

Le 11/01/2024 à 15h 36

Le paradoxe soulevé de l'optimisation ou l'amélioration de l'efficacité d'un système s'appelle le Paradoxe de Jevons

Edit: modifié après explication pour mettre du texte en hypertexte

Il ne s'agit pas de la même chose. Ici, il est juste dit que l'utilisation d'un outil comme l'IA permet de trouver plus facilement des gisements de pétrole et donc d'en produire plus. Que je sache, le coût du pétrole n'a pas vraiment diminué ces temps-ci (hors période COVID où il y avait beaucoup moins de demande).

Le prix du pétrole étant largement piloté par l'offre et la demande (à tel point que les producteurs décident de produire moins pour qu'il augmente), il est asse peu lié au coût de production actuellement.

Le 10/01/2024 à 23h 56

Parfois, certaines questions n’ont pas d’éléments de réponse (ou même pas de réponse tout court), ce n’est pas pour autant qu’elles ne sont pas intéressantes à soulever :)

Concernant la remarque sur les experts, je vais spoiler un peu la suite : oui, ils alimentent aussi le sujet de la deuxième partie sur l’IA générative, avec d’autres intervenants :chinois:

Parfois, certaines questions n’ont pas d’éléments de réponse (ou même pas de réponse tout court), ce n’est pas pour autant qu’elles ne sont pas intéressantes à soulever :)
Tu as raison, mais je suis cependant déçu de ne pas avoir de réponses alors que j'avais l'impression qu'il allait y en avoir.

Le 10/01/2024 à 23h 54

« Le premier disant, on n'a pas d'infos qui chiffrent les impacts positifs ou négatifs du numérique mais qui finit par dire que si le bilan était positif, on nous le dirait (entreprises, administrations,...). C'est un peu léger comme démonstration pour un expert !« 

Je te trouve un peu dur pour le coup. Un spécialiste ou expert d’un domaine, peut, pour un sous domaine donné, manquer d’informations substantielles : cette reconnaissance d’impuissance à pouvoir délivrer un constat pragmatique sur la question est plutôt à mettre à son actif quand on voit et entend le nombre de pseudo experts qui compensent leur impuissance par des élucubrations pseudo savantes avec une assurance de margoulin. De plus il est parfois tout aussi intéressant de savoir (et faire savoir) que l’on n’a pas encore d’éléments fiables de mesure : c’est en soi une information importante à considérer.

Je ne critique pas le fait qu'il dise qu'il est impossible de chiffrer ces impacts, mais qu'il en déduit que si c'est ça, c'est que c'est évident que le bilan pas significativement positif.

Quand je ne sais pas ou que je n'ai pas assez d'information, je le dis simplement en évitant d'en tirer des conclusions. S'il s'était arrêté à dire je ne sais pas, c'était mieux.

Le 10/01/2024 à 20h 48

Merci du retour, on se rode sur le sujet du numérique et de l'environnement, si j'ai bien compris il s'agit ici de la première partie d'un article un peu long, dont la seconde partie contiendra les témoignages annoncés.
To be continued

J'ai compris différemment de toi (mais je peux me tromper) pour les experts qui me semblent être annoncés pour cette première partie. Quant à la seconde partie, elle me semble parler plutôt de l'IA générative et de ses effets sur l'écologie.

C'est bien parce que le sujet numérique et environnement est important mais rarement abordé correctement que j'ai été déçu.

On verra après le second article, je changerai peut-être d'avis s'il y a plus de réponses. De toute façon, je le commenterai probablement.

Le 10/01/2024 à 19h 20

Je suis assez déçu par cet article.

Il y a plein de questions mais pas vraiment de réponses.

Et dommage de nous avoir annoncé 2 experts pour une si petite contribution à l'intérêt limité.

Le premier disant, on n'a pas d'infos qui chiffrent les impacts positifs ou négatifs du numérique mais qui finit par dire que si le bilan était positif, on nous le dirait (entreprises, administrations,...). C'est un peu léger comme démonstration pour un expert !

Le second enfonce des portes ouvertes : si on optimise un système qui consomme beaucoup de ressources, il en consommera encore plus.
L'exemple (qui n'est peut-être pas de lui) sur l'énergie pétrolière et l'optimisation de la recherche de nouveaux gisements et celle de la maintenance des équipements par l'IA est criant mais cela n'apporte rien au sujet.

C'est dommage parce que le sujet est intéressant.

Autres remarques plus ponctuelles :.
il peut être observé que « l’intensité énergétique de l’économie » (la quantité d’énergie consommée par unité de PIB) ne montre pas de rupture de tendance particulière depuis le milieu des années 90 et l’avènement du numérique, que ce soit dans les pays émergents ou les pays industrialisés.
Je n'ai gardé que la courbe mondiale, c'est la plus représentative d'autant plus que l'on a mondialisé notre production (c'est-à-dire déplacée vers la Chine).

Il y a un point tous les 10 ans (jusqu'en 2010) sur cette courbe et on voit quand même une inflexion après 1990, ça pourrait bien correspondre au milieu des années 90 cité. La pente de ce segment 1990-2000 et 1,7 fois plus forte que celle des 10 années précédentes. Ça me semble significatif. Et la pente entre 2000 et 2010 est elle aussi plus forte ( de 23 %) que celle de 1980 à 1990 ce qui signifie que la baisse de la quantité d'énergie consommée continue mais une seule courbe ne peut pas donner la raison de la baisse.
Du côté des PC portables et fixes, après une explosion des ventes en 2020 et 2021 du fait des confinements, c’est la dégringolade : au quatrième trimestre 2021, 90 millions d’unités furent expédiés. Au premier trimestre 2023, seuls 54 millions d’unités furent expédiés, soit une chute de 40 % en un an et demi.
Quand on a un phénomène singulier comme celui du COVID, il faut neutraliser son effet pour que les chiffres veulent dire quelque chose, soit en ignorant ces chiffres qui sont des points aberrants, soit en les lissant si on a des données pendant assez longtemps après. Ici, dans les 2 cas, on ne peut appliquer cette neutralisation puisque l'on est trop près du point aberrant et que l'on n'a donc pas de données significatives après ce point : les ventes de 2022 et 2023 sont encore impactées par le pic de ventes lié aux confinements et au télétravail. Rendez-vous dans quelques années pour savoir ce qu'il en est.

Le 14/01/2024 à 13h 27

Le bon lien
Et aussi sur France Inter, j'ai écouté cette émission là et ça semblait intéressant.

Le 14/01/2024 à 09h 44

Tu écris vraiment n'importe quoi (ou je n'ai pas saisi un quelconque humour ?): TF1 et M6 sont en clair sur la TNT, il n'y a aucun DRM. Donc n'importe quel boitier TNT ou TV permet l'enregistrement / la mise en pause et l'avance rapide des pubs.
Concernant la TVIP, la Freebox révolution, permet d'enregistrer 3-4 programmes en // sur son disque-dur puis de les relire en avançant n'importe quelle partie. (en fibre la restriction semble lié à la lenteur du disque-dur qui n'arrive pas à écrire assez vite)

Je crois qu'il y avait effectivement de l'humour au niveau de la détection d'attention.

Pour le reste, il fait des prédictions (emploi du futur). Elles peuvent se réaliser ou non.
Mais la tendance des groupes TF1 et M6 en particulier est effectivement d'imposer de plus en plus de choses aux FAI et autres diffuseurs. Je crains aussi que la TNT ne dure qu'un temps et sans licence TNT, l'ARCOM pourra imposer beaucoup moins de choses faute de cahier des charges négocié en contrepartie de l'autorisation d'utiliser une partie du spectre hertzien. Ces groupes seraient alors beaucoup plus libres.
Et n'oublions pas que l'exception de la copie privée n'est qu'une exception au droit d'auteur et pas un droit pour les usagers.

Le 14/01/2024 à 09h 32

"Remarque : je réponds à ton commentaire comme à celui d'un lecteur "normal" et pas au propriétaire du site, même si je sais que tu es les 2. Le but n'est pas de t'influencer sur le contenu éditorial, je sais que tu ne le ferais pas de toute façon."

Qu'on me corrige si je me trompe, mais c'est surtout que Ferd ne s'est octroyé aucun droit de regard sur la ligne éditoriale de Next, entièrement gérée par Sébastien et l'équipes de journalistes, donc dans tous les cas, ça ne risque pas d'avoir une quelconque influence.

C'est ce que je sous-entendais en effet.

Le 13/01/2024 à 10h 38

En rajoutant « selon la Fondation Mozilla » on aura sans doute gagné en clarté sur le titre, mais il y a un facteur qui joue dans l’autre sens, c’est que les titres d’articles sont trop longs dans Next et que ça pose d’innombrables problèmes d’interface.
J’imagine que JM a voulu faire dans la concision graphique, sachant que le propos est parfaitement précisé dès les premières lignes de l’article, lisibles de tout le monde.

Tu as sûrement raison. et il a donc utilisé les guillemets pour montrer qu'il s'agissait d'une citation.

J'ai eu à peu près la même réaction que psikobare à la lecture du titre et de l'article. Je n'ai pas écrit de commentaire alors que j'aurais pu le faire avant lui, parce que je sais que c'est toujours un problème d'être précis dans le titre sans être trop long. Dans ce cas, il faut peut-être pencher pour un titre moins percutant mais plus neutre. (dans le genre : craintes sur l'influence de Microsoft sur OpenAI vis-à-vis de la concurrence, c'est une première idée mais elle est perfectible : ce n'est pas mon métier...)

Je suis souvent mal à l'aise sur ce genre de titre parce qu'il y a mise en avant dans le titre d'un point de vue d'adversaires (pas forcément de concurrents) d'OpenAI et Microsoft sur ce sujet alors qu'à la lecture du titre on ne sait pas qui parle. Cela pourrait être une autorité de régulation de la concurrence ce qui aurait un autre poids.
Mais ici, vu le nombre d'entités ayant participé à faire cette affirmation, il était parfaitement impossible de les citer dans le titre.

Remarque : je réponds à ton commentaire comme à celui d'un lecteur "normal" et pas au propriétaire du site, même si je sais que tu es les 2. Le but n'est pas de t'influencer sur le contenu éditorial, je sais que tu ne le ferais pas de toute façon.

Mais la discussion sur le sujet est intéressante, donc, je pense qu'elle peut continuer (mais probablement sans toi afin que tu ne sois pas en porte-à-faux).

Le 13/01/2024 à 11h 54

Si ça se trouve, en lisant les informations disponibles à partir du premier commentaire (suivre le lien dans le tweet) et mon commentaire précédent, on peut penser qu'ils disent vrai.

Mais, c'est uniquement "si ça se trouve", hein, rien de certain.

Par contre, il est certain que leur communication sur le sujet n'est pas anodine.

Le 11/01/2024 à 16h 11

Pourquoi un hachage et pas un chiffrement plus complet ?
De ce que je comprends en lisant la traduction en lien et l'article de Forbes, c'est que l'information est trouvée dans les journaux de l'iPhone récepteur.

Forbes parle de journaux chiffrés, mais la traduction dit seulement que les champs permettant d'identifier un émetteur étaient de valeurs hachées.

Donc difficile de savoir si le journal était bien chiffré ou pas, mais de toute façon, comme le chiffrement était fait sur l'iPhone récepteur, la clé de déchiffrement était aussi probablement disponible pour lire le journal.

Ensuite, l'émetteur lui semble émettre diverses infos identifiantes sous forme de hash. Pourquoi un hash ? parce que ça permet d'avoir des identifiants différents (sauf cas rare de collision), mais ces informations sont-elles vraiment utiles ou faut-il uniquement des identifiants qui pourraient être aléatoires ?

Si un identifiant aléatoire suffit, c'est facile à corriger. Il y a aussi la possibilité de saler avant de hasher, ça tue la solution de la table arc en ciel.

Mais surtout, si on veut éviter des ennuis aux Chinois qui font ça, il ne faut mettre aucune information identifiante dans le journal. Là, soit on supprime carrément les entrées Airdrop du journal, soit on remplace les hash par des 0 ou toute autre valeur non identifiante.

Èdit : en lisant le lien dans le premier commentaire, je me rends compte que le hash sur le numéro de tel ou l'adresse e-mail (voire l'identifiant de l'iPhone ?) sont transmis pour le cas courant où on n'accepte les Airdrop de ses contacts. C'est pour cela que le hash est transmis : afin que le récepteur compare le hash avec le hash des identifiants des contacts.

Il faut donc oublier mon idée de saler le hash ou de transmettre un identifiant aléatoire. Ne pas stocker les hash dans les journaux reste la seule solution pour protéger les Chinois (et les autres).

Le 13/01/2024 à 10h 08

Modifié aujourd'hui à 16h57

alors que j'ai modifié le commentaire hier (12/01/2024) à l'heure indiquée probablement et qu'il est 10h09 le 13/01/2024.

Si quelqu'un de l'équipe passe par là... C'est un bug plus amusant qu'ennuyeux.

Le 13/01/2024 à 10h 04

Pour être précis, la solution de Google reCaptcha nécessite un consentement car les données recueilli par Google servent également d'autres finalités que la simple sécurisation (analyse du trafic par exemple).

Si ie seul traitement de reCaptcha concernait la sécurisation du site, pour éviter les bot, il n'y aurait pas besoin du consentement. Mais c'est loin d'être le seul traitement, et les autres sont des traitements d'analyse de comportement, trafic, etc. D'où l'obligation, du point de vue de la CNIL, de recueillir le consentement avant l'utilisation de cette solution.

C'est donc au responsable de traitement de faire son boulot correctement :
- soit il continue d'utiliser reCaptcha, auquel cas il doit demander le consentement avant
- soit il choisi une autre solution, plus respectueuse de la vie privée.

J'ajoute que la position de la CNIL est assez récente (2020 au sujet de l’application Stop COVID) et que une société qui ne fait pas une veille active sur le sujet de la protection des données personnelles a pu facilement passer à côté de cette décision si son site web a été conçu avant 2020.

Ça semble le cas de cette société qui utilise des solutions qui ne sont plus adaptées à l'état de l'art actuel : mots de passe en clair (ou dans le meilleur des cas hash SHA)1 et reCaptcha.

Le nombre de petites sociétés non conformes doit être énorme.

Le 12/01/2024 à 16h 49

Je ne suis pas fan du fait que 2 sujets très différents soient mélangés dans un seul article sur la même société :
- la sanction de la CNIL
- les arnaques visant les clients de cette société faites par des tiers malveillants.

Je vous suggère de couper l'article en 2 quitte à mettre un lien vers l'autre article dans chacun d'eux.

Édit : Cela dit, les 2 parties sont intéressantes.

Le 12/01/2024 à 16h 50

faut être abonné :)

Bah, abonne toi. :D

En gros, Apple les a approché en 2013 et il y a eu des conversations très avancées puis plus rien de la part d'Apple.

Apple a fini par débaucher plusieurs dizaines d'employés et a sorti en 2020 sa montre avec un capteur d'oxygénation sanguine.

Le 12/01/2024 à 16h 30

Une fraude ou tout simplement un brevet opportuniste ? C'est la spécialité de certaines sociétés qui déposent ou rachètent des brevets et attendent un produit similaire à succès pour l'attaquer en justice et récoler des $$$.

Avant d'accuser la société plaignante, va relire l'article de Next qui relatait l'historique.

Le 12/01/2024 à 10h 11

Pour moi, que ca soit "ecrit en Rust" n'est pas une valeur ajoutée qui se suffit à elle même.
Non, de nos jours la valeur ajoutée serait de dire que le kernel est écrit en nodejs.

ou par une IA. :fumer:

Le 12/01/2024 à 10h 06

Tu lui retire la mention de hacker car il est étudiant ?

Non, parce que c'était un pirate informatique.

Mais ta question m'a fait sourire.

Le 12/01/2024 à 09h 45

Le hacker f Français Sébastien Raoult

Le 12/01/2024 à 09h 51

Je pense le dans un canevas d'une "IA" générative l'image bruité serait très proche.
Une IA qui commente sur Next enfin démasquée ! :D Elle aligne les mots sans que cela n'ait un sens.

Le 11/01/2024 à 17h 44

Merci pour la remarque. Je modifie l'article en conséquences.

J'ai trouvé trop compliqué de signaler l'erreur par l'outil dédié. C'est un peu long à bien expliquer.

Édit : je laisse mon premier commentaire : j'ai passé du temps à l'écrire ( :D) et ça permet à comprendre comment on lit une directive européenne.

Comme j'avais cité les morceaux de l'article, ça reste compréhensible après la modification.

Le 11/01/2024 à 17h 08

De même, il n’est pas clair que la directive européenne d’avril 2019 citée par OpenAI aille dans son sens. En effet, il y est écrit que, dans le cadre de la fouille de textes par des acteurs qui ne font pas partie d’organisme de recherche, « les titulaires de droits devraient conserver la possibilité d’autoriser les utilisations de leurs œuvres ou autres objets protégés qui ne relèvent pas du champ d’application de l’exception obligatoire prévue par la présente directive concernant la fouille de textes et de données à des fins de recherche scientifique et de celui des exceptions et limitations existantes prévues par la directive 2001/29/CE ».
Cet extrait pourrait sembler imposer l’utilisation d’un opt-in de la part des auteurs avant toute utilisation de textes dans ce cadre.


Une directive européenne, c'est des considérants (introduits par la phrase "considérant ce qui suit:" en début de document)

puis une partie "législative" introduite par la phrase "ONT ADOPTÉ LA PRÉSENTE DIRECTIVE:".

La première partie explique pourquoi on a décidé de réglementer comme écrit dans la seconde partie.

La partie de la directive citée est dans le considérant 18.

Mais il faut en lire la suite qui dit que :
Afin d'améliorer la sécurité juridique dans ces situations et d'encourager également l'innovation dans le secteur privé, la présente directive devrait, dans certaines conditions, prévoir une exception ou une limitation pour les reproductions et extractions d'œuvres ou autres objets protégés aux fins de la fouille de textes et de données, et autoriser la conservation des copies ainsi effectuées pendant toute la durée nécessaire aux fins de cette fouille de textes et de données.
Cette exception ou limitation ne devrait s'appliquer que lorsque le bénéficiaire a accès de manière licite aux œuvres ou autres objets protégés, y compris lorsque ceux-ci ont été mis à la disposition du public en ligne, et dans la mesure où les titulaires de droits n'ont pas réservé de manière appropriée les droits de reproduction et d'extraction pour la fouille de textes et de données. En ce qui concerne les contenus mis à la disposition du public en ligne, la réservation de ces droits ne devrait être jugée appropriée que si elle est effectuée au moyen de procédés lisibles par machine, y compris des métadonnées et les conditions générales d'utilisation d'un site internet ou d'un service.

Donc, pour des raisons de sécurité juridique (et pour encourager l’innovation), il faudrait pouvoir autoriser l'accès aux œuvres (et autres objets) dans les conditions décrites au dernier paragraphe cité. Et il y a finalement l'opt-out qui est introduit en disant que les titulaires de droits peuvent réserver leurs droits dans le cas de la reproduction ou la fouille de texte, mais il faut qu'ils l'expriment par un procédé lisible par une machine.

Et on arrive donc à la rédaction de l’article 4 :
1. Les États membres prévoient une exception ou une limitation aux droits prévus à l'article 5, point a), et à l'article 7, paragraphe 1, de la directive 96/9/CE, à l'article 2 de la directive 2001/29/CE, à l'article 4, paragraphe 1, points a) et b), de la directive 2009/24/CE et à l'article 15, paragraphe 1, de la présente directive pour les reproductions et les extractions d'œuvres et d'autres objets protégés accessibles de manière licite aux fins de la fouille de textes et de données.
2. Les reproductions et extractions effectuées en vertu du paragraphe 1 peuvent être conservées aussi longtemps que nécessaire aux fins de la fouille de textes et de données.

3. L'exception ou la limitation prévue au paragraphe 1 s'applique à condition que l'utilisation des œuvres et autres objets protégés visés audit paragraphe n'ait pas été expressément réservée par leurs titulaires de droits de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne.

4. Le présent article n'affecte pas l'application de l'article 3 de la présente directive.

que je peux résumer ainsi :

1. On fait une exception ou limitation au droit d'auteur aux fins de fouille de texte et de données.

2. On peut garder les reproductions (copies) ou extractions aussi longtemps que nécessaire à cette fouille.

3. Les titulaires des droits peuvent s'opposer à cette exception au droit d'auteur explicitement, de façon lisible par une machine.

4. Il n'y a pas d'opposition possible pour la recherche scientifique.
Mais en France, l’exécutif a clairement penché en 2021 vers l’opt-out dans l’ordonnance transposant cette directive : « des copies ou reproductions numériques d’œuvres auxquelles il a été accédé de manière licite peuvent être réalisées en vue de fouilles de textes et de données menées à bien par toute personne, quelle que soit la finalité de la fouille, sauf si l’auteur s’y est opposé de manière appropriée, notamment par des procédés lisibles par machine pour les contenus mis à la disposition du public en ligne ».
La France a donc bien appliqué correctement la directive en rédigeant son ordonnance ainsi.
En tout cas, cette directive européenne n’autorise pas le fait de reproduire en sortie des passages entiers d’articles collectés comme ceux du New York Times.
Ça, c'est vrai. C'est un problème qui doit être corrigé.

Le 11/01/2024 à 18h 47

La fonctionnalité via sélection n'existe pas sur mobile, mais il est possible de faire une remontée depuis le menu "Plus d'options" (les 3 petits points), puis "Signaler une erreur".

Voilà, à nous deux, on a une info assez complète !

Le 11/01/2024 à 18h 01

Tu devrais passer par la fonction "signaler une erreur". Ce sera remonté directement aux journalistes, avec une correction bien plus rapide, alors qu'ici, tu n'as aucune assurance sur le fait que ta correction soit remarquée et traitée 👍

Pour cela, sélectionner le texte et cliquer sur "une erreur ?", le texte sélectionné est copié dans une boite de saisie où l'on peut expliquer ce qui ne va pas. Ici, dire que c'est plusieurs fois dans le texte, par exemple et dire ce qu'il faut mettre à la place (MISP).

Remarque : je ne sais pas si c'est possible sur mobile maintenant, la dernière fois que j'ai voulu le faire, (l'an dernier), ce n'était pas possible.

Le 11/01/2024 à 15h 44

Je ne vois pas dut tout ce que

Attention, ton clavier se blo

Le 11/01/2024 à 15h 40

Pas beaucoup, une dizaine probablement. Si c'est efficace, c'est amorti rapidement.

Le 11/01/2024 à 15h 37

Cela ne date pas d'hier : tu gagneras ton pain à la sueur de ton front.

Le 11/01/2024 à 13h 11

Le papier de recherche "Extracting Training Data from Diffusion Models" en lien (sous le mot experts) est très intéressant. Attention, il a un bon niveau et il est assez long à lire.

Il confirme mon intuition qui me faisait dire ici que la recherche de performances meilleures pour les systèmes d'IA génératives avaient probablement transformé ces systèmes en système qui mémorisaient.

Il m'a aussi appris que les systèmes de générations d'images s'appuyaient maintenant sur ce que l'on appelle des Image diffusion models. Je n'ai pas vraiment compris (ni pris le temps de comprendre) l'article Wikipedia sur le sujet, il me semble trop technique pour moi.
Si Next pouvait expliquer pour un large public en quoi ça consiste, ça serait top. Il me semble qu'il y a 2 rédacteurs qui doivent avoir le profil pour le faire. :fumer:

Le 11/01/2024 à 12h 58

Annonce liminaire : je suis nul en sac à main.

Pour moi, les images 1 et 3 sont très proches, ce qui semble vouloir dire que les créateurs eux-mêmes produisent des produits proches. Comme a priori, il n'y a pas eu de plainte de l'un contre l'autre, c'est qu'ils ont jugés que c'était des créations différentes et pas des contrefaçons.
Il me semble qu'il y a autant de différences entre ces 2 images qu'il y en a entre l'image de WALL-E de l'article précédent avec une vraie image de WALL-E que j'avais mis en lien en citant les principales différences.
J'aurais donc tendance à dire que s'il n'y a pas contrefaçon dans le cas des sacs à main, il n'y en a pas non plus dans le cas de WALL-E.
Dans le domaine des marques, cela dit, « il y a pour le moment moins de crispations » autour des productions d’IA génératives que dans le domaine artistique.
Cela me semble vrai : les marques (de luxe) n'ont pas d'intérêt à poursuivre les créations artistiques d'image représentant leurs produits, il y a même un tas de marques qui fait du placement de produit dans des films et qui paient pour cela. Par contre, il ne faut pas que cela nuise à leur marque, à leur image, dans ce cas, on peut être sûr qu'elles attaqueront, mais je ne sais pas si ce sera sur l'aspect propriété intellectuelle ou juste sur le préjudice causé, peut-être bien les 2.

Je pense qu'il y a peu de risque pour les utilisateurs de ces IA génératives d'image d'utiliser ces images copiant les produits des marques tant que ce n'est pas pour vendre des contrefaçons en ligne.

Cela est conforté par ceci :
Lorsque la citation de la marque n’a aucune vocation publicitaire ou commerciale et qu'elle ne porte pas atteinte à la renommée de la marque de son titulaire, il n’y a pas d’obligation juridique à demander l’autorisation au titulaire de la marque. (citation de : https://www.economie.gouv.fr/files/files/directions_services/apie/propriete_intellectuelle/publications/Droit_auteur_image_numerique.pdf?v=1696932490 ).
Par contre, attention, un Logo peut aussi est protégé par le droit d'auteur.

Le 11/01/2024 à 12h 21

@fred42 C'est une très bonne question. Que la loi du pays d'hébergement s'applique, c'est évident, mais déterminer si la loi du pays de consultation s'applique aussi, c'est plus compliqué à mettre en oeuvre en effet.

A la limite, en rendant le contenu inaccessible dans le pays en question (autrement on devrait tous suivre les lois émises par les pires dictatures), mais on sait le caractère très inefficace des mesures de blocage.

En théorie les 2 lois s'appliquent.

Mais quand la loi du pays d'hébergement est plus permissive que la loi du pays de consultation, ça devient compliqué.

Pour faire obliger par la justice l'hébergeur dans son pays, dans les accords internationaux, il faut que la loi du pays de consultation existe dans les même termes dans le pays de l'hébergeur. C'est donc problématique dans le cas où l'hébergeur est aux USA et la consultation en Europe quand il s'agit de la liberté d'expression (au sens des USA, donc très large y compris pour des propos soutenant l'idéologie nazi).

On ne pourra jamais faire interdire la publication de tels propos sur une plateforme US. Il reste alors 2 solutions :
- si l'hébergeur a une présence dans l'UE (c'est le cas de tous les gros GAFAM et autres), on a une décision de justice (ou administrative) qui interdit que le contenu illégal soit accessible et l'hébergeur fait du géo-blocage (par les IP) et c'est l'entité présente dans l'UE qui est obligée d'appliquer la décision.
- si l'hébergeur n'a pas de présence dans l'UE, le seul blocage possible est celui qui s'impose aux Fournisseurs d'accès à Internet voire moteurs de recherche. On sait ces mesures sont contournables (mais cela ne les rend pas inefficaces comme tu le dis : plein de gens ne savent pas les contourner ou ne font pas l'effort de le faire). On a vu récemment apparaître des demandes aussi auprès des principaux fournisseurs de service DNS, ce qui va fortement renforcer l'efficacité de ces décisions, tout le monde ne pourra pas héberger son serveur DNS chez lui.

Le 10/01/2024 à 19h 46

Non je ne suis pas du genre à m'auto punir :p

Mon Dieu ! :D

Le 10/01/2024 à 19h 45

Ah bah voilà.
Je ne sais pas trop à quel point notre responsabilité d'hébergeur est engagée si la ressource est stockée à l'extérieur tiens.

Attention, il y en a au moins un qui embarque l'image en base64 en Markdown., donc sur vos serveurs Ça se voyait sur l'ancien site quand on faisait "citer" pour un commentaire.

localhost, va se reconnaître. :fumer:

Le 10/01/2024 à 17h 55

Par accompagnant, je veux dire "les personnes qui s'occupent de ces enfants" (vu qu'en seconde ils ne sont pas majeurs). J'aurais pu mettre "quelqu'un responsable de leur éducation" ou "représentant légal".

Je laisse les pions de côté parce que leur travail n'est pas d'enseigner.
Ca tombe bien, ce n'est pas le rôle de l'IA non plus. On parle d'"approfondissement", donc les pions peuvent assurer cette tâche (peut-être dans tous les lycées).

OK, les accompagnants, je les mets avec les parents dans ce cas.

Donner des exercices aux élèves, c'est de toute façon un rôle lié à l'enseignement. Les pions n'ont pas ce rôle et ne sont pas capables de l'avoir (ils ne sont pas recrutés ni payés sur ce critère). De plus, il s'agit ici d'adapter les exercices au niveau de l'élève, c'est encore plus compliqué. En l'absence d'IA, le mieux placé pour le faire dans tous ceux que tu as cités, c'est les profs, mais ils n'ont pas le temps de faire du sur mesure pour chaque élève.

Le 10/01/2024 à 17h 45

Dans le cas de MIA ? on peut tout à fait immaginer les mêmes genres de biais dans les interractions. Je comprends pas bien où est le mystère en fait. La transparence dans l'action publique est un intérêt en soit.

MIA propose des exercices adaptés au niveau de l'élève en français et en math. Le but est donc de faire progresser l'élève à son rythme, rien de plus. Vraiment, je ne vois pas comment ça peut discriminer les élèves. En plus l'avantage est que les autres élèves ne connaissent pas les exercices proposés à l'un ou l'autre, ce qui peut éviter moquerie ou pire harcèlement.

Mais je t'en prie, si tu as des idées précises de là où ça peut être un scandale, dis nous le, parce que franchement, moi, je ne vois pas.
Au pire, ça ne sert à rien, au mieux, ça permettra aux élèves les plus faibles de progresser à leur rythme plutôt que d'essayer en vain de suivre le rythme de la classe qui est trop rapide pour eux.

Le 10/01/2024 à 17h 37

Ok je raye parents.

Ils ont tous des profs / pions / accompagnants, non ?

De plus même si je conviens que cela peut êetre une aide (pour répondre à un devoir par exemple), rien ne remplace l'échange humain. Si je lis seul un texte, ou qu'on me l'explique oralement, ma compréhension peut être totalement différente.

En fait, j'ai répondu aux parents parce qu'il est dit :
Tous les élèves entrant au lycée seront désormais accompagnés, à la maison
Le "à la maison" correspond au lieu d'intervention des parents.

Et l'outil propose des exercices adaptés au niveau de l'élève. Cela permet probablement une personnalisation de la progression que ne permet pas un prof qui doit s'occuper de plein d'élèves à la fois et qui aura du mal à donner des exercices différents à chaque élève.
Ce logiciel n'intervient de toute façon pas dans les établissements d'enseignement où les profs ont toujours leur rôle à jouer.

Je laisse les pions de côté parce que leur travail n'est pas d'enseigner. Quant aux accompagnants, je ne sais pas ce que c'est. Si tu parles de ceux qui s'occupent des enfants en situation de handicap (AESH), je pense que ce n'est pas le sujet car ce logiciel s'adresse à tous.

Le 10/01/2024 à 19h 33

iStockPhoto dit pareil mais ça n'empêche que si les photos proposées sont volées, ils seront responsables pénalement.

C'est différent : iStockPhoto met des œuvres à disposition du public, pas Midjourney (ou quand il le fait, c’est sous le statut d'hébergeur).

En plus, je ne suis pas sûr de ce que tu affirmes. S'ils ont le statut d'hébergeur (je ne sais pas dire si c'est le cas), ils ne sont responsable pénalement que s'ils ne réagissent pas quand on leur indique que l'œuvre appartient à quelqu'un d'autre que celui qui leur a soumise.