Il y a eu des takedown sur HuggingFace de dataset contenant des livres qui ne sont pas dans le domaine public. Exemple avec the_pile_books3.
Mais ça c'est quand les dataset sont publics. Comme la plupart des entreprises de l'IA ont des dataset privés, le seul moyen de le démontrer c'est par procédure. Cf le New York Times en ce moment par exemple.
Mais en cherchant rapidement, on voit que c'est Common Crawl qui fait l'objet de plaintes.
(et pour répondre à @SebGF au passage) La situation de Next (INpact) était à l’époque assez compliquée (doux euphémisme), pour ça que j’ai fait un gros récap au passage :)
Oui, en effet, ça se comprend. Peut-être ajouter une petite mention dans ce cas pour lever la confusion en indiquant que cela est arrivé plus ou moins en même temps que le changement de proprio et donc que vous n'avez pas été en mesure de communiquer dessus.
Le
24/06/2024 à
17h
51
Si cette mésaventure permet de faire avancer la jurisprudence naissante sur les procédures-bâillon, il n’y a pas d’hésitation à avoir : interjetons appel !
N'oublions pas que la jurisprudence en droit français n'est pas automatique.
Sinon je ne me rappelais pas que les poursuites avaient été abandonnées.
Naméhoo... on va pas te féliciter parce que tu es un cochonou qui ne ferme pas ses onglets inutilisés non plus... Un navigateur c'est comme le kiki, çà se nettoie
Sauf que le navigateur c'est aussi comme le kiki, mon cerveau principal :p
Le
24/06/2024 à
11h
17
Juste pour dire que le fait d'être proposé de consulter un onglet existant quand on tape une URL est la plus belle chose qui me soit arrivée dans la vie.
Comme j'ai toujours plusieurs fenêtres avec de nombreux onglets, ça va me permettre d'arrêter les doublons.
S'auto entrainer, c'est probablement une spirale du vide vers un trou noir. La richesse est dans ce qui reste à découvrir.
Ce n'est pas dans ce sens là que je parlais d'autonomie.
Bien que l'IA a été utilisée pour plusieurs découvertes scientifiques ces derniers temps.
Le
23/06/2024 à
17h
36
Je pense, sans preuves, juste intuition optimiste, que les IA que l'on vante tant sont déjà au bout de leurs capacités, car leur moteur c'est le passé, pas l'avenir.
Pas forcément. Il y a des projections estimant que leurs capacités d'analytique permettrait de se passer de data analyst pour la qualification des données d'entraînement.
Et donc, d'un certain point de vue, de s'auto entraîner.
Le bond qu'a fait l'IA en seulement quelques années est quand même notable.
Le
23/06/2024 à
10h
10
C'est surtout déjà la réalité des conditions de travail dans les entreprises de la tech et des services en ligne. La modération des médias sociaux est faite par des personnes sous payées qui voient passer toutes les horreurs que nos sociétés sont capables de produire. Les personnes travaillant à l'entraînement des IA aussi en devant qualifier des jeux de données pouvant avoir du contenu dégueulasse. Et avec la pratique du "fake it until you make it", ce genre de scène ne me surprendrait pas une seule seconde. Avant la boom de l'IA générative auprès du grand public, la plupart des "démo" ont été démontées car faussées. Comme des dialogues préenregistrés avec un acteur en face.
Le
22/06/2024 à
14h
20
Excellent ! Et oui, bien vu. Pourquoi l'IA ne ferait-elle pas croire qu'elle est moins avancée qu'on ne l'imagine en échouant volontairement ?
Flock tiendrait un synopsis pour une nouvelle de SF.
Le problème c’est surtout qu’on a déjà vu un chatbot lancé sans contrôle et ce qu’il est devenu en quelques heures à peine…
En soit ça démontre que ces systèmes ont le même niveau de réflexion que l'humain :)
Le
23/06/2024 à
10h
17
Le Chat Mistral est tout aussi bridé et censuré que ChatGPT, ce genre de résultat n'est pas étonnant.
L'IA générative est aussi un magnifique reflet de notre société : lissé, plat, ne doit choquer personne. Bref, être chiant à en crever.
Le
19/06/2024 à
07h
39
À défaut d'avoir un pouvoir de persuasion, j'espère ouvrir les yeux de certains. En vrai, j'aimerai vraiment des articles de fond positifs parce que j'aimerais bien apprendre ce que l'IA peut apporter et comme le dit mon autre commentaire, il y en a très certainement.
Whisper peut te retranscrire une source audio (podcast, vidéo, etc) en texte et même le traduire en live. Comparé aux transcriptions automatiques des systèmes de visio, c'est comme comparer la hache silex et la tronçonneuse.
Gemini 1.5 avec son contexte de 1 million de tokens est capable de lire une vidéo et d'en faire une restitution.
Perso, je vois déjà deux apports positifs : convertir des formats de diffusion d'information inefficients (car exigeant une attention et aux capacités de recherche nulles) en un plus léger, lisible en moins de temps, et pouvant être exploité facilement.
Et même en matière d'accessibilité, des cas d'usage où ces outils retranscriraient pour fournir l'information à des systèmes de communication pour personne handicapées (surdité, aveugle, par exemple) me paraissent tout à fait envisageable.
Concernant les LLM en tant que générateurs de texte associé à des synthèses vocale : capacité d'être un "opérateur téléphonique" pour prendre et qualifier un appel en premier niveau. La hotline qui se contente de dérouler son script sans valeur ajoutée perd son sens (alors oui, d'un point de vue emploi c'est négatif. Mais vu les commentaires au sujet de ces métiers, cela ne devrait déranger personne) et, cerise sur le gâteau, le robot répond de manière cordiale voire même avec empathie si configuré en ce sens. Un use case que j'ai pu voir (en mode démo, donc à relativiser) était la prise d'appel pour une déclaration de sinistre à l'assurance. Le robot (vocal ou texte) était en mesure de qualifier les premiers éléments avec les données générales, puis devait rediriger vers un opérateur humain pour le traitement du dossier par rapport au cas spécifique de l'assuré.
🎻
Le
18/06/2024 à
17h
48
Ce qui est dommage ici, c'est que c'est encore un papier négatif sur l'IA. Qui sait me donner un pointeur sur un article du site positif sur l'IA ? (pas neutre ou juste explicatif) Lors de l'édito sur le sujet, j'ai essayer de remonter dans la catégorie IA et algorithmes" pour en trouver un mais j'ai arrêté avant d'en trouver un.
Perso j'ai laissé tombe l'idée d'avoir un traitement équilibré de ce sujet ici.
Ca apportera que "signifcant" n'a rien d'objectif ? D'ailleurs, la publication dit bien "can cause significant ozone depletion" et pas "will cause..", donc non, la publication ne dit pas que le problème est sérieux. C'est de l'interprétation, et c'est justement pour cela qu'avoir des chiffres permet au moins d'avoir des données un minimum objectives.
Edit: tu demandes ce que ça apporterait d'avoir des chiffres, il y a une réponse évidente: nous ne serions pas en train d'avoir cette discussion. Nous saurions que la situation demande des mesures urgentes, ou de moyen de terme ou aucune mesure parce que l'échelle de temps impliquée fait que l'effet bien que réel n'a pas d'importance.
Pour prendre un parallèle: si je te dis quel tel aliment contient un cancérigène probable en quantités mesurables sans en préciser la quantité, qu'est ce que tu fais? Tu interdis l'aliment en question? Ou bien tu attends d'avoir des chiffres pour savoir comment agir (en supposant qu'une action soit nécessaire)?
Pour information, mon exemple, ce sont les pommes, qui contiennent et produisent naturellement de l'acétaldéhyde, classé cancérigène probable.
J'en étais sûr que Chirac voulait tous nous tuer !
Le
22/06/2024 à
09h
55
"Attention cette expérience comporte des risques pouvant entrainer coups de soleil, cancers et fin de civilisation, et ne devrait pas être réalisée avec une planète en production, utilisez toujours une planète de test pour vérifier les risques avant de la réaliser sur votre planète de production."
J'en étais sûr, les extraterrestres se servent bien de la Terre comme sandbox de test ! Bande d'enfoirés de petits culs gris !
Il présente bien des caractéristiques que l'EPDB avait considéré comme problématiques dans son rapport sur les cookie banners.
Ici, le Type C qui est considéré comme un consentement invalide.
The taskforce members agreed that the following examples do not lead to valid consents (nonexhaustive list):
- the only alternative action offered (other than granting consent) consists of a link behind wording such as ‘refuse’ or ‘continue without accepting’ embedded in a paragraph of text in the cookie banner, in the absence of sufficient visual support to draw an average user’s attention to this alternative action;
- the only alternative action offered (other than granting consent) consists of a link behind wording such as ‘refuse’ or ‘continue without accepting’ placed outside the cookie banner where the buttons to accept cookies are presented, in the absence of sufficient visual support to draw the users’ attention to this alternative action outside the frame;
Plus qu'à déterminer un âge minimum de majorité légale spécifique RS, genre 110 ans ........
RS comme réseaux sociaux ?
Alors, bonne nouvelle, l'âge minimum requis pour avoir un consentement au traitement des données personnelles en France est de 15 ans. En dessous, le traitement est considéré comme illicite sans accord d'un représentant légal du mineur.
Au delà, bah on est considéré comme assez grand pour savoir si on a envie d'une coloscopie permanente ou non.
Perso, j'ai beaucoup de mal avec cette syntaxe dont j'oublie encore et toujours le nom et le fait qu'il n'y a pas de boutons pour placer ces balises.
Ouh, ça me manque tellement, les customisations de phpBB
Markdown ne m'est pas étranger, j'ai écrit des livres avec
C'est le rendu ici qui est toujours buggé où la citation disparaît alors qu'elle était visible au moment de poster. Je n'ai jamais compris ce besoin impérieux qu'a le Web de redéfinir systématiquement des choses basiques qui marchent et les casser.
Ce doit être pour ça que je hais le JS.
Le
21/06/2024 à
14h
00
J'imagine que c'était en relation avec le nom du pirate?
Yup, mais j'en ai eu marre d'essayer de corriger l'affichage de la citation. Tant pis, c'est tombé à l'eau.
Le
21/06/2024 à
10h
10
Pas nécessairement. Les russes sont particulièrement en retard au nveau micro-électronique et R&D à c niveau. Si ils arrivent à piller ce genre de données, c'est tout bénef poru eux et leurs alliés chinois.
Je viens de remarquer que la citation a encore été tronquée et donc la boutade tombée à l'eau......
Le
21/06/2024 à
08h
24
Sur un forum, un pirate du nom d’IntelBroker propose à la vente, contre de la cryptomonnaie évidemment, des données provenant de chez AMD.
soit l'équipe de Next s'essaie à la rédaction de brèves par IA, et le résultat est plutôt problématique.
Si c'est le cas, il serait appréciable de signaler ce fait. (et hypocrite de mon point de vue en raison de la ligne éditoriale majoritairement négative sur le sujet)
Le
20/06/2024 à
15h
18
Le truc qui se désactive en 2 clics et demi ?
Je n'ai pas envie qu'il s'active tout court.
Et je n'ai pas envie qu'on me demande de l'activer tous les 4 matins.
Le
20/06/2024 à
11h
38
L’application a surtout l’avantage de ne pas agir avant d’avoir été appelée et configurée. Une différence majeure avec la première version, activée par défaut et présentée dès l’assistant initial de configuration de Windows.
Est-ce que ça va être comme l'autre truc Hello je sais plus quoi qui va péter les burnes tous les 4 matins pour demander à être activé à chaque démarrage du système jusqu'à ce que l'utilisateur craque ?
C'est quand même marrant de se dire que les boîtes de l'IT n'ont pas dépassé le stade de l'enfance. Ce ne sont que des gamins qui hurlent pour qu'on cède à leurs caprices. Ca manque de torgnoles tout ça.
Voilà, c'était bien de lui qu'il s'agissait. Mais quand j'ai fait mon premier commentaire, je n'y ai pas pensé, sinon, j'aurais signalé l'erreur.
En fait, c'est peut-être un scoop : Lemaire remplacerait Breton à la Commission ?
L'article a été corrigé, mais je pense qu'il devrait faire l'objet d'un erratum (une simple mention suffisant). Prêter des propos qui n'étaient pas les siens à une personnalité politique peut être vu comme de la désinformation.
Tout d'abord, je ne connais pas les caractéristiques des modèles derrière DALL-E 2 et DALL-E 3. Il faut bien comprendre qu'ici, il faut que ça tourne en local, sur une machine qui n'a que quelque Go de RAM allouable au modèle (elles n'ont que 16Go pour faire tourner l'intégralité d'un OS, des programmes -- comme un navigateur web -- en plus du modèle) et "seulement" 40 TOPS pour le calcul (modulo que l'on parle de la même unité, voir articles, on est a priori un peu en dessous d'un RTX2060 qui est donné à "52 AI TOPS" : https://www.nvidia.com/fr-fr/geforce/graphics-cards/40-series/rtx-4080-family/#specs).
Donc, je parierai plus sur des modèles allégés, dégraissés, optimisés.
De plus, je ne pense pas que la taille de l'image créée soit un bon critère pour dire si c'est tel ou tel modèle. En effet, je n'ai pas encore regardé les modèles de diffusion en détail, donc je peux me tromper, mais ce type de modèle ne semble pas avoir de problèmes (autre que le temps de calcul et la quantité de mémoire) pour créer des images de taille arbitraire.
En effet, je n'ai pas encore regardé les modèles de diffusion en détail, donc je peux me tromper, mais ce type de modèle ne semble pas avoir de problèmes (autre que le temps de calcul et la quantité de mémoire) pour créer des images de taille arbitraire.
En fait ils travaillent dans des formats définis (512x512 pour SD 1, 1.5, 2 ou 1024x1024 pour SDXL par exemple, connais pas le détail des autres mais ça doit être la même tambouille). Dans le cas de Stable Diffusion, sa capacité à tourner sur des configs type "consumer" est dûe à son VAE qui permet de travailler l'image dans un espace latent très très réduit, là où DALL-E par exemple travaille en espace pixel donc plus gourmand. Dans le cas de SD, il génère l'artefact aléatoire de base, le compresse, applique les couches successives de denoise via le scheduler, puis une fois l'itération terminé il décompresse l'image de l'espace latent pour produire le résultat final.
Les algo d'upscalling d'image étant également excellents, il ne sert de toute façon à rien de chercher à produire des tailles supérieures à celles pour lesquelles les modèles ont été optimisés. Il suffit de lui demander ensuite un x2 ou x4. Perso je travaille sur un format genre 1300x800 (car il me sert à rendre des scènes pour de l'écriture, et faire la couverture du bouquin) et ça donne d'excellents résultats sur une conf de 2018 avec une 1080GTX, un i5 de l'époque (voire plus vieux) et 21GB de RAM.
(PS : me demande pas les concepts mathématiques derrière, kernel panic)
Les systèmes sont plus complexe mais aussi de véritables pancakes de couches empilées les unes sur les autres.
Un serveur physique, la surface d'attaque était plutôt délimitée (OS / middleware / appli).
Un container, tu as le serveur physique, l'OS de l'hyperviseur, la couche de virtualisation, l'OS de la VM, sa couche de virtualisation, ses API de containerisation, l'OS du container, les middlewares déployés dedans, les dépendances du code, les dépendances transitives, le code, les services d'exposition, etc.
Et oui, à l'époque c'était plus YOLO car moins de conscience sur ce sujet (même si y'a encore du chemin à faire). Le réseau ouvert par défaut et root / en mot de passe, c'était légion.
Le
17/06/2024 à
13h
53
Leur méthode de travail, c'est surtout souvent "dis nous de quoi tu as besoin, nous t'expliquerons comment t'en passer"...
C'est un petit peu plus subtile que ça, de mon expérience d'architecte solutions.
Les 3/4 du temps, les projets ne viennent pas avec un besoin mais une solution. Dans 90% des cas, foireuse, car ne prenant pas en compte le cadre d'architecture (le truc souvent dessiné sur un coin de table avec l'éditeur qui compte déjà les biftons).
Une fois ce filtre passé et le premier jet de proposition d'architecture fourni (sachant que je travaille en incluant la sécurité by design), je la traite avec l'équipe sécu. Et à chaque fois qu'il y a un truc qui va pas, c'est le même délire : - ça c'est pas bon - c'est quoi la préco ? - de faire ça - oui mais c'est quoi le standard ? - il faut le faire
Dialogue de sourd. Et encore, j'ai ça parce que je propose des solutions (c'est mon métier en même temps). Mais à chaque fois il faut leur tirer les vers du nez.
Alors imagine les projets qui pratiquent le mensonge par omission en disant "non y'a pas de données confidentielles", "non c'est pas critique" mais que lorsque tu grattes (voire souffle dessus), la couche d'obfuscation saute et révèle qu'en fait, c'est la merde.
Mon plus gros reproche des travaux avec la sécurité dans mon expérience, c'est qu'elle se positionne de manière régalienne (ce qui est normal), mais ne propose jamais rien. Voire ne challenge pas suffisamment. C'est problématique car elle est vue comme une contrainte et non un moyen de protéger l'entreprise. Et ce genre de posture n'aide pas.
Le
17/06/2024 à
11h
41
Le spécialiste de SSI ne fait qu’analyser et conseiller
Ca c'est la théorie. Dans la pratique, la plupart des équipes sécu avec qui j'ai bossé c'est "non tu peux pas" sans proposer.
Ce qui est contre productif comme méthode de travail.
Le
17/06/2024 à
11h
31
D'ailleurs sur la partie IA, la fondation OWASP avait publié l'année dernière son top ten pour les applications LLM.
Le
17/06/2024 à
10h
45
Quant au marché de la sécurité, il est florissant. Malheur à celui qui ne rentre pas dans une case et qui n’a pas son sigle :
Et encore j'ai l'impression que la liste est orientée infra.
Il manque les notions portées côté développement telles que le SAST, le SCA, le DAST, le Secret Scanning, etc.
Perso je viens ici pour collecter vos meilleurs punchline et les revendre à des redditeurs en échange de points de karma pour pouvoir poster des liens vers mes vidéo tiktok rémunérées.
Dans la mesure où j'essaye de trigger le plus possible la cancel-culture, est-ce que ça marche ?
Le
17/06/2024 à
19h
00
C'est quand même la beauté de ce modèle économique n'empêche. Faire travailler gratuitement des gens et leur revendre ce travail en contrepartie de données personnelles et affichage publicitaire.
Whisper l'est toujours, leur Tokenizer aussi qui est utilisé par d'autres applications. Ces projets sont sous license MIT, donc ils peuvent être fork à un moment si jamais.
Mais… c'est de l'ergotage en bout de chaine, l'histoire de licence, non ? Débattre du machin, c'est déjà ne plus questionner l'existence-même du-dit machin.
Ne pourrait-on pas revenir au début et se (re ?)poser les bonnes questions : * À quoi cela sert-il ? * Quel besoin remplit-il (besoin, et non envie/gadget, ou sentiment induit d'un besoin) ? * Cela remplace-t-il d'autres choses existantes ? Si oui, avantageusement ? * Quel ratio avantages/inconvénients (placer dans les inconvénients les sorties d'une matrice de risques) ?
Penses-tu que les concepteurs de la commande sl se soient posés autant de questions ?
Perso le fait d'avoir vu un début d'implémentation en open source m'a amusé. Je n'utiliserai jamais ce genre d'outil, mais je voulais partager l'info.
Je pense que l'usure des batteries (je ne parle que d'usure ici) sur les électriques est un faux problème.
On commence à avoir un retex intéressant, les premières Tesla qui ont maintenant plus de 10 ans, avec les premières versions de batterie, en NMC, n'ont pas de soucis particulier de batterie. Et autant dire que dès qu'il y a un problème sur des électriques, ca fait tout de suite le JT, alors que Peugeot a réussi à planquer sous tapis et minimiser le scandale des PureTech. Donc ca se saurait.
Depuis 10 ans, les batteries ont évoluées, les BMS limitent encore plus l'usure, et une partie des voitures est passé au LFP, dont la durée de vie est estimé à 2 fois celle des NMC. Donc bon, si ca se passait déjà bien, ça ne fait qu'aller encore plus dans le bon sens.
En mettant quelques chiffres (€) la dessus:
Et si on focus sur les quelques personnes qui commencent à avoir des problèmes, c'est avec des voitures à plus de 400.000km. Déjà, combien de thermique vont jusque là? Ensuite, 400.000 km, c'est 50k€ de carburant (6L/100 à 2€/L), vs 11k€ d'électricité (13kWh/100 à 20cts/kWh, 1/3 Tempo, 2/3 supercharger). Également, 400.000km, c'est 20 vidanges à 100€, 4 courroies de distribution (+accessoire) à 1000€, ... soit 6000€ de base d'entretien courant.
Donc ok, une batterie à 15k€ à changer à 400.000km, ca pique. Mais en comparaison avec le prix du thermique, ca reste quand même très correct. Et ça, c'était avec les batteries d'il y a 10 ans.
Personnellement, J'ai actuellement une thermique diesel qui a 10ans, j'ai eu 10000€ de gros entretien dessus (contrat d’entretien les 6 premières année + courroie distri + injecteurs). Soit 1000€/an lissé sur 10 ans. Je verrais sur mon électrique, mais on est sur 2000€ de contrat d’entretien/garantie sur les 7 premières années. Je doute que j'arriverais au 10000€ au bout de 10 ans...
Dans tous les cas, c'est l'usage qui provoque l'usure de la batterie (merci V12, je sais).
Passer son temps à la charger sur des bornes rapide contribuera à réduire sa durée de vie. Là où rester sur des charges lentes type courant domestique contribuera à garder une bonne durée. Même chose pour la conduite : tabasser l'accélérateur va forcément la flinguer plus vite.
Après, perso, j'ai pas passé mon temps à faire des calculs dans tous les sens pour me décider de passer sur un véhicule électrique (tfaçon je suis nul en maths). J'ai regardé mon usage, j'ai vu l'autonomie par rapport à celui-ci, l'utilité, et je me suis dit que c'était stupide de rester sur du thermique. Et comme je considère cette charge comme étant du jetable avec trois ans de vie en ce qui me concerne, je n'ai pas été plus loin. Et n'irai pas plus dans le mesure où ça sera certainement ma dernière voiture.
Le
14/06/2024 à
14h
07
T'a de la chance, car moi j'ai toujours des trucs qui merde même en dehors du moteur: - Poignées de porte dont le mécanisme casse - Vérins de coffre à changer - Siège qui se coince , qui monte ou descend plus (et le pire c'est que c'est rédhibitoire au CT) - Divers problèmes électriques : Allume-cigare , neiman (et donc anti-démarrage), boutons de clim, .... (Bon ok ça c'est surtout chez Renault)
Et bien sur l'entretien sur les filtres & liquides mais ça c'est pas des "réparations" pour moi.
Un autre point que je fait c'est le changement de pièces de carrosserie , surtout les plastiques. (Je ne touche pas aux éléments structurels ou au train roulant)
Ce que j'en comprends et surtout chez Tesla actuellement (mais j'ai l'impression que c'est un peu le cas chez les chinoises, je sais pas trop ce que ce sera coté européenne) c'est qu'il y a très peu de réparations possibles soit même , y compris si l'on veux ou peux le faire, que le garage est +/- un passage obligé par choix du constructeur (cf la "checklist longue comme le bras"). La garantie m'intéresse pas trop car tant que le véhicule est garanti, bien sur, tu va au garage (c'est idiot de pas le faire). La question c'est sur le long terme, dans 15/20 ans.
Aujourd'hui j'ai une voiture de 1994 - c'est vrai que je passe du temps à réparer les petits ennuis, mais elle marche bien. Or j'ai l'impression qu'on a conçu les véhicules électriques à usage unique, notamment avec le fait que le pack batterie est inamovible et pas réparable ni remplaçable. (Même les moteurs sont remplaçable en thermique, les malheureux possesseurs de moteurs puretech en savent qq chose...)
Bah perso j'ai une voiture neuve sous garantie avec le contrat d'entretien dans la LLD... Donc autant dire que les soucis de jeunesse ont été traités par ce biais.
Me concernant, je suis en VaaS : Voiture as a Service.
Et probablement en PVaaS bientôt : Plus de Voiture as a Service.
Dans tous les cas, oui, la batterie reste un élément impactant pour la durée de vie. Cela reste changeable (je ne connais pas de VE à batterie non remplaçable, mais je connais pas tout le marché), mais le coût est rédhibitoire car c'est la moitié du prix de la caisse. Dans le cas de la mienne, elle est garantie à 75% de perte de capacité sur 7 ans.
Mais quand l'EU va t-elle mettre un frein sur le système de paradis fiscale de l'Irlande.
Quand la politique fiscale directe sera de sa compétence et non plus celle des Etats membres ?
À ce jour, seule la fiscalité indirecte est de la compétence de l'UE, comme la TVA dont un seuil minimum est imposé avec une liste de produits autorisés pour les taux réduits. En matière de fiscalité directe, elle a surtout une directive pour l'évasion et impose de la transparence. Mais elle n'a pas le pouvoir d'harmoniser la fiscalité des États membres. (et vu le contexte en ce moment... ça risque pas)
À noter que l'Irlande n'est pas le seul paradis fiscal pour entreprise étrangère ou multinationale dans l'UE : les Pays Bas le sont (nombre de groupe européens sont immatriculés là bas, mais aussi étrangers), tout comme le Luxembourg (Amazon y est installé).
Le
16/06/2024 à
09h
48
Franchement j’ai cherché où les contacter, sans succès. Et j’ai ressayé de générer les datas à nouveau avec le même résultat… à croire que c’est fait pour ne pas fonctionner.
Si tu n'as pas eu de réponse du DPO dans un mois, tu peux déposer plainte à la CNIL. Donne tous les éléments que tu as démontrant l'impossibilité d'exploiter ce service censé te permettre d'exercer tes droits accordés par le RGPD.
En effet, je parlais de l'échec en terme d'adoption, dans sa globalité. Techniquement, les algos de Mastodon reste cependant très basiques.. Et même si cela a beaucoup d'effets négatifs, c'est aussi une des force de X dans sa popularité et son adoption d'avoir des algos qui te balancent un max de chose à la figure... Je ne pense pas que tout le monde reste sur X pour les trolls et les désinformateurs en revanche... Il y a surtout sur X, les médias, les politiques, les personnalités, les artistes, les youtubeurs, journalistes, etc, etc...
Bah Mastodon c'est de la diffusion en chronologique, rien de plus. Pas d'algo pour dire quoi regarder.
Il y a bien des tendances ou des pages de découvertes, mais c'est limité.
Perso je considère toujours que Mastodon et Twitter ne sont pas comparables. L'un est un système reposant sur un protocole standard et interopérable pour communiquer. L'autre est une usine à contenus viraux pour générer de l'audience. Une instance Mastodon n'a pas spécialement d'enjeux d'audience. C'est la principale différence.
Au contraire même, plus une instance est grosse, plus elle coûte cher en hosting et management.
14066 commentaires
Meta, Hugging Face et Scaleway lancent un AI Startup Program
24/06/2024
Le 25/06/2024 à 08h 07
Internet Archive retire plus de 500 000 livres de sa bibliothèque sous la pression des éditeurs
24/06/2024
Le 25/06/2024 à 07h 59
Il y a eu des takedown sur HuggingFace de dataset contenant des livres qui ne sont pas dans le domaine public. Exemple avec the_pile_books3.Mais ça c'est quand les dataset sont publics. Comme la plupart des entreprises de l'IA ont des dataset privés, le seul moyen de le démontrer c'est par procédure. Cf le New York Times en ce moment par exemple.
Mais en cherchant rapidement, on voit que c'est Common Crawl qui fait l'objet de plaintes.
pg dv – rd 13
24/06/2024
Le 25/06/2024 à 07h 48
Le 24/06/2024 à 19h 49
La prochaine fois, écrivez le en polonais en retirant les consonnes.Procédure-bâillon d’Avisa Partners : Next fait appel, le combat pour la liberté de la presse continue !
24/06/2024
Le 24/06/2024 à 18h 03
Le 24/06/2024 à 17h 51
N'oublions pas que la jurisprudence en droit français n'est pas automatique.Sinon je ne me rappelais pas que les poursuites avaient été abandonnées.
Vivaldi 6.8 intègre Courrier 2.0 et affiche la consommation mémoire en temps réel
21/06/2024
Le 24/06/2024 à 15h 30
Le 24/06/2024 à 11h 17
Juste pour dire que le fait d'être proposé de consulter un onglet existant quand on tape une URL est la plus belle chose qui me soit arrivée dans la vie.Comme j'ai toujours plusieurs fenêtres avec de nombreux onglets, ça va me permettre d'arrêter les doublons.
#Flock : Le test à la con de Seb
22/06/2024
Le 24/06/2024 à 08h 16
Bien que l'IA a été utilisée pour plusieurs découvertes scientifiques ces derniers temps.
Le 23/06/2024 à 17h 36
Et donc, d'un certain point de vue, de s'auto entraîner.
Le bond qu'a fait l'IA en seulement quelques années est quand même notable.
Le 23/06/2024 à 10h 10
C'est surtout déjà la réalité des conditions de travail dans les entreprises de la tech et des services en ligne.La modération des médias sociaux est faite par des personnes sous payées qui voient passer toutes les horreurs que nos sociétés sont capables de produire.
Les personnes travaillant à l'entraînement des IA aussi en devant qualifier des jeux de données pouvant avoir du contenu dégueulasse.
Et avec la pratique du "fake it until you make it", ce genre de scène ne me surprendrait pas une seule seconde. Avant la boom de l'IA générative auprès du grand public, la plupart des "démo" ont été démontées car faussées. Comme des dialogues préenregistrés avec un acteur en face.
Le 22/06/2024 à 14h 20
Excellent !Et oui, bien vu. Pourquoi l'IA ne ferait-elle pas croire qu'elle est moins avancée qu'on ne l'imagine en échouant volontairement ?
Flock tiendrait un synopsis pour une nouvelle de SF.
[T@LC] On fait passer le test de Turing à ChatGPT, et on a bien rigolé
18/06/2024
Le 23/06/2024 à 17h 32
Le 23/06/2024 à 10h 17
Le Chat Mistral est tout aussi bridé et censuré que ChatGPT, ce genre de résultat n'est pas étonnant.L'IA générative est aussi un magnifique reflet de notre société : lissé, plat, ne doit choquer personne. Bref, être chiant à en crever.
Le 19/06/2024 à 07h 39
Gemini 1.5 avec son contexte de 1 million de tokens est capable de lire une vidéo et d'en faire une restitution.
Perso, je vois déjà deux apports positifs : convertir des formats de diffusion d'information inefficients (car exigeant une attention et aux capacités de recherche nulles) en un plus léger, lisible en moins de temps, et pouvant être exploité facilement.
Et même en matière d'accessibilité, des cas d'usage où ces outils retranscriraient pour fournir l'information à des systèmes de communication pour personne handicapées (surdité, aveugle, par exemple) me paraissent tout à fait envisageable.
Concernant les LLM en tant que générateurs de texte associé à des synthèses vocale : capacité d'être un "opérateur téléphonique" pour prendre et qualifier un appel en premier niveau. La hotline qui se contente de dérouler son script sans valeur ajoutée perd son sens (alors oui, d'un point de vue emploi c'est négatif. Mais vu les commentaires au sujet de ces métiers, cela ne devrait déranger personne) et, cerise sur le gâteau, le robot répond de manière cordiale voire même avec empathie si configuré en ce sens. Un use case que j'ai pu voir (en mode démo, donc à relativiser) était la prise d'appel pour une déclaration de sinistre à l'assurance. Le robot (vocal ou texte) était en mesure de qualifier les premiers éléments avec les données générales, puis devait rediriger vers un opérateur humain pour le traitement du dossier par rapport au cas spécifique de l'assuré.
🎻
Le 18/06/2024 à 17h 48
Les constellations de satellites vont gravement endommager la couche d’ozone
20/06/2024
Le 23/06/2024 à 10h 20
Le 22/06/2024 à 09h 55
L’UFC-Que Choisir pointe les dark patterns des sites d’e-commerce
21/06/2024
Le 22/06/2024 à 18h 55
Il présente bien des caractéristiques que l'EPDB avait considéré comme problématiques dans son rapport sur les cookie banners.Ici, le Type C qui est considéré comme un consentement invalide.
L’État de New York impose aux réseaux sociaux l’ordre chronologique par défaut pour les mineurs
21/06/2024
Le 21/06/2024 à 18h 37
Alors, bonne nouvelle, l'âge minimum requis pour avoir un consentement au traitement des données personnelles en France est de 15 ans. En dessous, le traitement est considéré comme illicite sans accord d'un représentant légal du mineur.
Au delà, bah on est considéré comme assez grand pour savoir si on a envie d'une coloscopie permanente ou non.
On développe et entraine une IA, avec seulement 10 lignes de code !
21/06/2024
Le 21/06/2024 à 18h 32
C'est précisément pour ça que j'ai opté pour faire tourner du modèle en local au tout début où j'ai mis les pattes dans SD.Marre de filer des données à Google.
AMD confirme la fuite d’une « quantité limitée d’informations »
21/06/2024
Le 21/06/2024 à 18h 29
C'est le rendu ici qui est toujours buggé où la citation disparaît alors qu'elle était visible au moment de poster. Je n'ai jamais compris ce besoin impérieux qu'a le Web de redéfinir systématiquement des choses basiques qui marchent et les casser.
Ce doit être pour ça que je hais le JS.
Le 21/06/2024 à 14h 00
Le 21/06/2024 à 10h 10
Le 21/06/2024 à 08h 24
Il s'est gouré de cible dans ce cas.
Microsoft change de formule pour Copilot sur Windows 10 et 11
20/06/2024
Le 20/06/2024 à 18h 36
Si c'est le cas, il serait appréciable de signaler ce fait.(et hypocrite de mon point de vue en raison de la ligne éditoriale majoritairement négative sur le sujet)
Le 20/06/2024 à 15h 18
Et je n'ai pas envie qu'on me demande de l'activer tous les 4 matins.
Le 20/06/2024 à 11h 38
Est-ce que ça va être comme l'autre truc Hello je sais plus quoi qui va péter les burnes tous les 4 matins pour demander à être activé à chaque démarrage du système jusqu'à ce que l'utilisateur craque ?C'est quand même marrant de se dire que les boîtes de l'IT n'ont pas dépassé le stade de l'enfance. Ce ne sont que des gamins qui hurlent pour qu'on cède à leurs caprices. Ca manque de torgnoles tout ça.
Face au DMA, Margrethe Vestager estime qu’Apple a de « très sérieux » problèmes
19/06/2024
Le 20/06/2024 à 07h 39
Les Copilot+ PC sont là : prise en main de l’IA et explications de Microsoft
18/06/2024
Le 19/06/2024 à 18h 19
Dans le cas de SD, il génère l'artefact aléatoire de base, le compresse, applique les couches successives de denoise via le scheduler, puis une fois l'itération terminé il décompresse l'image de l'espace latent pour produire le résultat final.
Les algo d'upscalling d'image étant également excellents, il ne sert de toute façon à rien de chercher à produire des tailles supérieures à celles pour lesquelles les modèles ont été optimisés. Il suffit de lui demander ensuite un x2 ou x4.
Perso je travaille sur un format genre 1300x800 (car il me sert à rendre des scènes pour de l'écriture, et faire la couverture du bouquin) et ça donne d'excellents résultats sur une conf de 2018 avec une 1080GTX, un i5 de l'époque (voire plus vieux) et 21GB de RAM.
(PS : me demande pas les concepts mathématiques derrière, kernel panic)
La FTC attaque la procédure de résiliation d’abonnement d’Adobe
18/06/2024
Le 19/06/2024 à 17h 39
Une attaque DDoS aurait visé une dizaine de sites gouvernementaux français
18/06/2024
Le 18/06/2024 à 20h 31
Pour le site des impôts, c'est normal. C'est juste les déclarations de dernière seconde :pC’est quoi la sécurité informatique ?
17/06/2024
Le 18/06/2024 à 07h 42
Les systèmes sont plus complexe mais aussi de véritables pancakes de couches empilées les unes sur les autres.Un serveur physique, la surface d'attaque était plutôt délimitée (OS / middleware / appli).
Un container, tu as le serveur physique, l'OS de l'hyperviseur, la couche de virtualisation, l'OS de la VM, sa couche de virtualisation, ses API de containerisation, l'OS du container, les middlewares déployés dedans, les dépendances du code, les dépendances transitives, le code, les services d'exposition, etc.
Et oui, à l'époque c'était plus YOLO car moins de conscience sur ce sujet (même si y'a encore du chemin à faire). Le réseau ouvert par défaut et root / en mot de passe, c'était légion.
Le 17/06/2024 à 13h 53
Les 3/4 du temps, les projets ne viennent pas avec un besoin mais une solution. Dans 90% des cas, foireuse, car ne prenant pas en compte le cadre d'architecture (le truc souvent dessiné sur un coin de table avec l'éditeur qui compte déjà les biftons).
Une fois ce filtre passé et le premier jet de proposition d'architecture fourni (sachant que je travaille en incluant la sécurité by design), je la traite avec l'équipe sécu. Et à chaque fois qu'il y a un truc qui va pas, c'est le même délire :
- ça c'est pas bon
- c'est quoi la préco ?
- de faire ça
- oui mais c'est quoi le standard ?
- il faut le faire
Dialogue de sourd. Et encore, j'ai ça parce que je propose des solutions (c'est mon métier en même temps). Mais à chaque fois il faut leur tirer les vers du nez.
Alors imagine les projets qui pratiquent le mensonge par omission en disant "non y'a pas de données confidentielles", "non c'est pas critique" mais que lorsque tu grattes (voire souffle dessus), la couche d'obfuscation saute et révèle qu'en fait, c'est la merde.
Mon plus gros reproche des travaux avec la sécurité dans mon expérience, c'est qu'elle se positionne de manière régalienne (ce qui est normal), mais ne propose jamais rien. Voire ne challenge pas suffisamment. C'est problématique car elle est vue comme une contrainte et non un moyen de protéger l'entreprise. Et ce genre de posture n'aide pas.
Le 17/06/2024 à 11h 41
Ca c'est la théorie. Dans la pratique, la plupart des équipes sécu avec qui j'ai bossé c'est "non tu peux pas" sans proposer.Ce qui est contre productif comme méthode de travail.
Le 17/06/2024 à 11h 31
D'ailleurs sur la partie IA, la fondation OWASP avait publié l'année dernière son top ten pour les applications LLM.Le 17/06/2024 à 10h 45
Et encore j'ai l'impression que la liste est orientée infra.Il manque les notions portées côté développement telles que le SAST, le SCA, le DAST, le Secret Scanning, etc.
Santé : aux États-Unis, Amazon emploie des contractuels non formés pour répondre à des patients
17/06/2024
Le 18/06/2024 à 07h 36
Pour le coup oui, quitte à faire ça, autant laisser un LLM faire avec une synthèse vocale.Ou racheter Doctissimo si ça existe encore.
C'est même encore mieux, l'algo aurait été simple : répondre "CANCER" à chaque demande. Y'avait juste à plugger une synthèse par dessus !
YouTube teste les notes de communauté
17/06/2024
Le 18/06/2024 à 07h 34
Le 17/06/2024 à 19h 00
C'est quand même la beauté de ce modèle économique n'empêche. Faire travailler gratuitement des gens et leur revendre ce travail en contrepartie de données personnelles et affichage publicitaire.Législatives : le numérique abordé par l’industrie, la souveraineté et les libertés numériques
17/06/2024
Le 17/06/2024 à 16h 17
Mon programme est simple : je vous promet la lune.Votez pour moi.
(moi au moins j'ai pas menti)
Sam Altman voudrait se débarrasser de la partie à but non lucratif d’OpenAI
17/06/2024
Le 17/06/2024 à 13h 57
Whisper l'est toujours, leur Tokenizer aussi qui est utilisé par d'autres applications. Ces projets sont sous license MIT, donc ils peuvent être fork à un moment si jamais.Microsoft continue de reculer sur Recall
14/06/2024
Le 17/06/2024 à 08h 15
sl
se soient posés autant de questions ?Perso le fait d'avoir vu un début d'implémentation en open source m'a amusé. Je n'utiliserai jamais ce genre d'outil, mais je voulais partager l'info.
Le 14/06/2024 à 16h 06
Pour les personnes intéressées, la version FOSS !L’Europe va taxer les véhicules électriques chinois, de 17,4 (BYD) à 38,1 % (MG)
13/06/2024
Le 16/06/2024 à 13h 04
Passer son temps à la charger sur des bornes rapide contribuera à réduire sa durée de vie. Là où rester sur des charges lentes type courant domestique contribuera à garder une bonne durée. Même chose pour la conduite : tabasser l'accélérateur va forcément la flinguer plus vite.
Après, perso, j'ai pas passé mon temps à faire des calculs dans tous les sens pour me décider de passer sur un véhicule électrique (tfaçon je suis nul en maths). J'ai regardé mon usage, j'ai vu l'autonomie par rapport à celui-ci, l'utilité, et je me suis dit que c'était stupide de rester sur du thermique. Et comme je considère cette charge comme étant du jetable avec trois ans de vie en ce qui me concerne, je n'ai pas été plus loin.
Et n'irai pas plus dans le mesure où ça sera certainement ma dernière voiture.
Le 14/06/2024 à 14h 07
Me concernant, je suis en VaaS : Voiture as a Service.
Et probablement en PVaaS bientôt : Plus de Voiture as a Service.
Dans tous les cas, oui, la batterie reste un élément impactant pour la durée de vie. Cela reste changeable (je ne connais pas de VE à batterie non remplaçable, mais je connais pas tout le marché), mais le coût est rédhibitoire car c'est la moitié du prix de la caisse. Dans le cas de la mienne, elle est garantie à 75% de perte de capacité sur 7 ans.
[Màj] Meta met sur pause son projet d’entraîner ses IA avec les contenus de ses utilisateurs
14/06/2024
Le 16/06/2024 à 09h 54
Quand la politique fiscale directe sera de sa compétence et non plus celle des Etats membres ?À ce jour, seule la fiscalité indirecte est de la compétence de l'UE, comme la TVA dont un seuil minimum est imposé avec une liste de produits autorisés pour les taux réduits. En matière de fiscalité directe, elle a surtout une directive pour l'évasion et impose de la transparence. Mais elle n'a pas le pouvoir d'harmoniser la fiscalité des États membres. (et vu le contexte en ce moment... ça risque pas)
À noter que l'Irlande n'est pas le seul paradis fiscal pour entreprise étrangère ou multinationale dans l'UE : les Pays Bas le sont (nombre de groupe européens sont immatriculés là bas, mais aussi étrangers), tout comme le Luxembourg (Amazon y est installé).
Le 16/06/2024 à 09h 48
Donne tous les éléments que tu as démontrant l'impossibilité d'exploiter ce service censé te permettre d'exercer tes droits accordés par le RGPD.
Le poing dev – Round 12
13/06/2024
Le 15/06/2024 à 13h 30
Perso je me suis mis en blacklist. J'en pouvais plus de lire mes conneries.Mastodon : les chercheurs n’ont finalement pas migré en masse
13/06/2024
Le 14/06/2024 à 18h 04
Il y a bien des tendances ou des pages de découvertes, mais c'est limité.
Perso je considère toujours que Mastodon et Twitter ne sont pas comparables. L'un est un système reposant sur un protocole standard et interopérable pour communiquer. L'autre est une usine à contenus viraux pour générer de l'audience.
Une instance Mastodon n'a pas spécialement d'enjeux d'audience. C'est la principale différence.
Au contraire même, plus une instance est grosse, plus elle coûte cher en hosting et management.