Google attaquée en justice pour l’entraînement de Bard
Le 17 juillet 2023 à 06h40
1 min
Droit
Droit
Une plainte a été déposée le 12 juillet contre Google, sa maison mère Alphabet et contre leur filiale dédiée à l’intelligence artificielle DeepMind, rapporte CNN.
L’entreprise y est accusée d’avoir utilisé des millions de données utilisateurs récupérées sans leur consentement et d’avoir enfreint des droits de propriété intellectuelle sur des milliers d’autres éléments pour l’entraînement de ses modèles algorithmiques, parmi lesquels Bard, dont la version française vient d’être rendue accessible.
La plainte, une class action, est déposée par l’entreprise californienne Clarkson Law Firm. Cette dernière a déposé une plainte similaire contre le développeur de ChatGPT, OpenAI.
Auprès de CNN, une représentante de Google a déclaré la plainte « sans fondement ».
Le document pointe notamment l’évolution des politiques de confidentialité de début juillet, qui vient seulement d’informer explicitement les utilisateurs que leurs données pourraient être utilisées pour entraîner des modèles algorithmiques.
Le 17 juillet 2023 à 06h40
Commentaires (18)
Vous devez être abonné pour pouvoir commenter.
Déjà abonné ? Se connecter
Abonnez-vousLe 17/07/2023 à 07h17
Pas d’inquiétude: en tant qu’européens nous sommes protégés par Fiona Scott Morton.
Le 17/07/2023 à 08h37
Quelle que soit l’issue tu procès, s’il a lieu, et dans combien de temps… le mal est fait. L’IA est entraîné et donne un avantage décisif pour le futur. Pire, les sociétés qui se lanceraient maintenant, du fait de la régulation qui va en découler, vont devoir dépenser plus pour arriver au même résultat.
Une solution, à mon avis, serait que la source et le résultat du travail que Google a fait doit être rendu publique et utilisable librement.
Le 17/07/2023 à 09h09
Si ce qu’ont fait Google et OpenAI pour entraîner leurs AI est illégal, la justice pourrait leur ordonner de détruire le résultat de ces actions illégales. Tout le monde partirait donc à égalité. Se serait le mieux à faire.
Mais, j’ai de gros doutes sur l’illégalité avancée. Leurs arguments semblent assez faibles. On verra bien ce que dira la justice.
En particulier, ici, les plaignants mélangent data et informations personnelles alors qu’il s’agit de droits différents, même aux USA.
Pour les données, s’il n’y a pas de restriction explicites lors de la publication de ces données sur le WEB, il n’y a rien à dire. Pour les informations personnelles, la législation de l’État s’applique (pour les USA, puisque la plainte est déposée là-bas).
Le 17/07/2023 à 09h10
Tout cela ne servira à rien tant que la plus part des gens dans le monde se comporteront comme des mouton en mettant un max de données personnelles chez meta ou google ou autre sans se poser des questions et en évoquant l’excuse magique “c’est compliqué, je n’y comprends rien à ces trucs”. Être un citoyen, c’est fatiguant, il faut s’intéresser a plein de trucs , prendre des décisions et assumer ses choix.
C’est l’éternel problème de la facilité privative vs la difficile liberté. Il semble qu’une majorité de gens préfèrent la dictature des géants dont ils on permis l’émergence.
Quel poids a la commission quand si peu de citoyens s’insurgent face à cela? On ne peut pas aider les gens contre le gré.
Le 17/07/2023 à 09h24
Bon, je suis curieux, j’ai testé Bard, il est pas encore au niveau de ChatGPT quand même…
Après, j’ai plus l’impression que c’est le moteur de recherche Google qui clique sur un lien à ta place (il cite ses sources d’ailleurs à la fin de chaque message).
Et il est plutôt nul en dev celui là
J’ai demandé un pti prog en python, il l’a fait plus ou moins en donnant comme source stackoverflow avec le lien…
Le 17/07/2023 à 13h18
J’avoue qu’il n’est pas au niveau de chatGPT dans mon usage “dev”.
J’ai donné un petit script python à bard, je lui demande de m’ajouter la doc au style numpydoc, les type hint et de m’écrire la fonction “parseArgs” (ce genre de truc chiant, mais très utiles) :
Le 17/07/2023 à 16h05
Bard a été sorti “en urgence” pour endiguer le fait que Chat-GPT, dans les mains de Bing, puisse supplanter Google dans le domaine de la recherche en ligne. Pas très étonnant qu’ils se soient focus sur la recherche plutôt que la génération de réponse.
Le 17/07/2023 à 09h44
+1
La France et l’Europe ont fait des choix: ne pas investir dans Internet, ne pas investir dans le dev logiciel, préférer des solutions développées hors France/UE. Des choix économiques à court terme face à des enjeux stratégiques de long terme.
L’ambition de la France/UE c’est de garantir sa souveraineté par la mise en place d’un cadre légal/réglementaire.
J’ai du mal a croire que cela suffira.
Posté il y a 4 jours sur numérama: Google Bard vs. ChatGPT : qui fait mieux ?
Conclusion:
Le 17/07/2023 à 09h50
Je n’ai pas reçu d’alerte de cette mise à jour.
Est-ce que continuer à utiliser les services vaut acceptation des nouvelles CGU ?
Le 17/07/2023 à 10h20
Tu confonds politique de confidentialité et GCU, même si les CGU peuvent contenir la première.
Pour la première, le RGPD s’applique : tu dois donc être informé d’une évolution sur le traitement de tes données personnelles.
Par contre, la phrase que tu as citée n’est pas claire sur ce qui a été modifié. En suivant les liens jusqu’à The Verge (non, ce n’est pas sale !), on voit que les données personnelles concernées sont celles qui peuvent être données lors de l’utilisation des services de Google utilisant l’IA, par exemple Bard ou CloudAI. Si tu n’es pas utilisateur enregistré de ces services (Google le sait), ils n’ont pas à te prévenir.
Je me suis inscrit sur Bard pour voir. Et j’ai dû accepter les CGU et leur politique de confidentialité. Ceci est conforme au RGPD.
La lecture de The Verge confirme ce que j’avais compris quand je me suis inscrit pour utiliser Bard.
Ils insistent lourdement pour ne pas donner d’informations personnelles de toi (ou d’autres personnes) dans les demandes que tu fais à Bard.
Le 17/07/2023 à 11h22
Le texte de la news est trompeur.
Quand NXI dit que Google va collecter les données des utilisateurs, il faut comprendre que c’est les utilisateurs d’internet (“internet users” dans la news CNN) et pas les utilisateurs des services google (sous-entendu collecter des données privées des comptes Google).
La source de tout ce tintamarre c’est ce changement dans les règles de confidentialité de Google:
source: Google
Le 17/07/2023 à 13h28
Il y a système à 2 vitesses je trouve.
Pourquoi une IA devrait avoir moins de droits qu’autre chose ?
Du genre répondre à la question “quel est le compte Instagram de xxx” ?
IA : interdit sauf personnes très connues
Moteur de recherche de la même société Google : certaines limites (liens vers seulement certaines photos).
Moteur de recherche Instagram : aucune limite
Les 3 méthodes ne font qu’accéder qu’aux mêmes données publiques.
Le 17/07/2023 à 20h03
Le 17/07/2023 à 20h27
Ça dépend de ce que tu appelles « données », je suppose.
Les connaissances ne sont pas soumises au droit d’auteur, par exemple (Bard et ChatGPT ont tout à fait le droit d’apprendre que pi = 3.14159…).
Mais pour tous les contenus soumis au droit d’auteur, c’est l’inverse : s’il n’y a pas d’autorisation explicite, leur utilisation est interdite.
République Française
Le 17/07/2023 à 22h05
On parle ici du droit des USA, donc évitons de trop se focaliser sur un texte français.
Ce pendant, le droit d’auteur protège à peu près la même chose un peu partout (pas forcément le droit moral qui n’est pas reconnu aux USA par exemple).
Le terme utiliser n’est pas à prendre dans son sens courant, mais par rapport au droit d’auteur. Et le droit d’auteur protège la reproduction, la diffusion ou la représentation.
L’utilisation pour l’apprentissage des IA ne rentre pas plus dans ce cadre (ce n’est pas une reproduction) que quand un humain apprend quelque chose d’une œuvre sous droit d’auteur (je ne parle pas d’apprendre une œuvre par cœur et de la restituer mot pour mot, mais de ressortir les idées, les connaissances qui sont dans l’œuvre.
On peut voir fans le PDF dont le lien est sur la page que tu as citée que j’ai une lecture correcte du droit :
J’ai déjà fait un commentaire plus complet de ce type sur le sujet sous une autre brève qui parlait de l’apprentissage des IA. Là, il est tard et je fais court.
Le 18/07/2023 à 09h31
Comme dit @fred42, c’est la contrefaçon qui pose problème. Donc la reproduction sans autorisation de l’auteur (hors exceptions prévues par la loi: copie privée…).
Ce qu’on peut simplifier en :
Ce qui nous amène à la question: Est-ce que tous les textes générés par Bard/ChatGPT sont forcément des contrefaçons des sources d’apprentissage ?
Si c’est oui alors ca pose aussi la question à tous les textes générés par un être humain à partir de ces mêmes sources.
Si c’est non, alors il faut traiter chaque texte généré par une IA au cas par cas.
Le 18/07/2023 à 12h22
J’ai cru que c’était Twitter qui les attaquaient, vu qu’Elon Musk lors du week-end ou il était inutilisable il avait prétendu que c’était les IA qui aspirait les données de Twitter
Attaquer sa propre filiale, c’est la meilleure
Le 18/07/2023 à 14h10
Je pense que tu as raté quelque chose. Relis le début de la brève : ce sont Google, Alphabet et DeepMind qui sont attaqués.
Bon, la phrase est un peu bancale avec 2 “contre” pour 3 sociétés attaquées.