Perso la question que je me pose, surtout, c'est à quel moment ils comptent injecter ça dans l'entraînement de GPT-5 (par exemple).
En dehors de polluer CommonCrawls et d'intervenir dans le traitement des dataset, je vois pas trop.
Sachant que les dataset sont de plus en plus eux-même traités par IA.
Le
26/07/2024 à
18h
31
Il y a un élément que je ne comprends pas dans la mise en oeuvre.
L'empoisonnement de données d'entraînement visuelles comme des images ou de la vidéo se fait par watermark qui trompe le processus. L'entraînement des modèles de diffusion se fait par un ajout successif de bruit (corruption de l'image) et diffusion inversée. La génération d'image étant une application successive de filtres de suppression de bruit.
Mais dans un cas d'un texte ? À quel moment cela s'applique-t-il ?
Mettre des phrases incohérentes ou dénuées de sens suffisamment importantes pour être prises en compte dans l'apprentissage va surtout gêner le lectorat de ce texte.
D'ailleurs, CreativeCommons a publié un article hier sur une idée de "Preference Signals". Ça semble encore assez préliminaire, mais ça montre qu'il reste encore beaucoup de réflexion à avoir sur le sujet.
Je n'ai pas compris "interactions utilisateurs" comme le fait de mentionner un utilisateur, mais comme le fait de lire les tweets d'un utilisateur. Mais peut être que je me trompe.
Après, retirer la mention de l'utilisateur (en gros, "anonymiser") d'un tweet est facile. Il s'agit ici d'entrainer et d'ajuster leur IA. Ce qui importe alors est le contenu, pas les métadonnées.
Encore une fois, cela n'enlève rien au fait que je trouve cette manière de procéder pitoyable. Et je ne cherche pas à les défendre. J'essaie juste de comprendre comment une entité de cette taille et qui est sous surveillance peut se lancer dans ce genre d'initiative alors que le RGPD est entrée en application en Europe depuis 6 ans maintenant et que le moindre écart va être vite sanctionné.
C'est la seule explication "valable" que je vois. On peut voir cela comme une "évolution" des captchas qui ont largement servi à entrainer des modèles d'IA de reconnaissance de texte.
Bah en l'absence de détails, on ne peut que supposer. Et compte tenu de l'historique de ces entreprises, ma supposition par défaut est qu'ils prennent tout et disent aux personnes de se justifier pourquoi elles ne devraient pas se faire violer leur vie privée.
La routine habituelle.
De l'arbitraire pur, encore et toujours.
J'essaie juste de comprendre comment une entité de cette taille et qui est sous surveillance peut se lancer dans ce genre d'initiative alors que le RGPD est entrée en application en Europe depuis 6 ans maintenant et que le moindre écart va être vite sanctionné.
Bof. Ils sont installés dans le pays de l'APD qui a les couilles dans un étau (puisque l'économie de son pays dépend des multinationales étrangères) et donc un pouvoir presque nul. Je n'ai pas vérifié, mais je suppose que X est aussi installé en Irlande.
Quand le bâton de la sanction est une matraque en mousse, ça fini forcément en fête du slip.
On peut voir cela comme une "évolution" des captchas qui ont largement servi à entrainer des modèles d'IA de reconnaissance de texte.
Plutôt la reconnaissance d'image pour le coup, même si ua début c'était beaucoup du texte.
Encore une belle idée de merde, n'empêche...
J'adore la société vue par le Web n'empêche : tout le monde est un robot par défaut, tout le monde doit être considéré comme mineur par défaut vu que législation l'impose, et tout le monde doit servir de matière première à entraîner des modèles de machine learning. Manque plus que tout le monde qui doit servir à nourrir la population à la fin et on aura terminé la boucle.
Le
26/07/2024 à
19h
38
Juste pour rappel, le RGPD concernent les données à caractère personnel. Toute donnée n'est pas forcément une donnée personnelle.
Je suppose que X et Meta partent du principe qu'un post utilisateur n'est pas a priori une donnée personnelle (même si elle peut éventuellement l'être). Dans le cas contraire, un consentement explicite en opt-in me parait effectivement obligatoire.
Quoi qu'il en soit, cela n'empêche pas cette pratique d'être abjecte.
Vu que le traitement parle des "interactions utilisateurs", il va forcément avoir les noms d'utilisateur puisque le principe est de mentionner le destinataire dans le post. Et ceux-ci sont considérés comme donnée personnelle indirectement identifiante. Voire directe si la personne poste sous sa véritable identité.
Donc cela ne peut être de l'opt-in par défaut.
Mais de toute façon ils s'en foutent. Perso j'ai choisi la solution qui me sied le mieux : refuser d'ouvrir un lien qui va vers ces sites.
Même si cela ne sert pas à grand chose puisque les éviter est quasi impossible. Y compris ici avec des saletés d'intégrations dans les articles.
Je suis très biaisé contre Google depuis une bonne décennie. Entre le « web sémantique » et l'imposée régionalisation des résultats, Google est devenu progressivement très inefficace.
Le Google moderne se moque de ce que demande l'usager. Il prétend savoir ce que l'usager veut réellement et agit en conséquence. Sauf que ce n'est pas ce qui a été demandé... C'est le paragdime en développement informatique depuis 2010.
Je mets des mots clés EN (surtout informatique) car je veux des résultats EN ? J'aurai des résultats principalement FR. Parfois je mets une série de mots clés et il oublie volontairement tous sauf un... D'autres fois je force la prise en compte d'un mot (guillemets) mais il s'en moque quand même... J'en passe et des meilleurs.
Jusqu'à peu les autres moteurs offraient des résultats pires que Google malgré leur auto-sabotage, mais ça semble enfin changer puisque je me surprends à aller ailleurs de plus en plus volontiers.
Oui, le Google "pur" est une daube inutilisable. Par contre, via Startpage, je le ressens moins.
Le
26/07/2024 à
19h
28
D'après Wikipedia, Bing fait partie des "400" sources utilisées. Ils ont aussi leur propre crawler.
Mais leur page d'accueil et de résultats n'a pas la lourdeur de Bing, et il m'arrive souvent de trouver des résultats plus rapidement que sur Google.
S'il y a mieux je suis preneur.
Je ne me souvenais plus, j'ai pas utilisé DDG depuis un bail.
Perso j'utilise Startpage, mais c'est Google qui est utilisé derrière. Je l'avais retenu pour le côté vie privée et son origine européenne. Quelques features intéressantes comme la consultation de site en mode "privé" où ils font proxy.
Après j'ai pas la prétention de dire qui est mieux, chacun fait son choix selon ses envies.
Le
26/07/2024 à
16h
11
DuckDuckGo c'est pas Bing en backend ?
Le
26/07/2024 à
07h
42
En France, Citroen intègre ChatGPT dans ses véhicules, accompagné de la reconnaissance vocale basée IA elle aussi SoundHound. Comme de nombreux autres constructeurs.
Si j'y vois du positif en me disant que ça fera moins de distraction comme les écrans d'infodivertissement en produisent, car il s'agira juste de causer comme à ses passagers. J'ai une appréhension quant au caractère verbeux de ChatGPT, et surtout de GPT, qui obligerait à trop se concentrer sur ce qu'il dit vu qu'il aime parler pour ne rien dire ou étaler sa science. À voir si les system prompt ont été pensés de manière plus efficiente.
Evidemment, l'autre point d'attention est la dépendance à la connectivité embarquée du véhicule. Même si c'est déjà la réalité. Perso j'ai désactivé la reconnaissance vocale car celle-ci était basée sur du connecté. Et c'est relou vu ça se déclenche n'importe quand.
L'Irlande est un paradis fiscal pour tous les GAFAM, grâce à leur politique de dumping sur l'impôt sur les sociétés. Du coup, fort logiquement, ils localisent leurs activités là-bas, et refacturent à leurs entités européennes en ne laissant le bénéfice qu'au strict minimum dans les autres pays de l'UE. Pour que ce soit moins "grillé" vis-à-vis des juridictions fiscales, ils foutent tous leurs services en Irlande, call center, ingés, et quand c'est possible, datacentres.
L'Irlande a une politique qui va à l'encontre de l'intérêt collectif de l'UE, et ça paye pour eux, très bien d'ailleurs, ils sont un des états qui génèrent le plus de PIB par habitant, alors qu'ils n'avaient pas beaucoup d'atouts dans leur jeu il y a 40 ans. Cool pour eux, mais entièrement contraire à l'intérêt général, qui est de taxer la richesse là où elle est produite, et à un taux compatible avec une société bien financée. Si la dette française se creuse un peu plus tous les ans, c'est un peu grâce à l'Irlande quoi.
N'oubliez pas de fêter la Saint Patrick le 17 Mars prochain.
Ça paye pour eux, mais ils se sont aussi enfermés dans une dépendance extrêmement forte aux multinationales.
Ce n'est pas gagné, quand on voit que même dans les pays occidentaux les LGBT+ se font emmerder alors que légalement ils ne risquent plus rien depuis longtemps...
Le fait que leur sexualité ne soit pas considérée hors-la-loi est déjà une première chose. Ce genre d'agression risque de toujours exister, hélas, mais une protection au niveau de la loi est déjà un élément permettant de les considérer (aux yeux de la loi, j'entend) comme des victimes.
Le
25/07/2024 à
07h
37
J'avoue que perso je pensais la notoriété du service assez connue, mais le préciser ne sera pas un luxe en effet.
Le
24/07/2024 à
18h
03
Toujours triste de voir que des personnes ne peuvent vivre leur sexualité sans risques.
Meta, c'est toi qui créé le contenu, donc on te demande de payer pour accéder au contenu que tu as toi-même créé.. Marmiton, Le Figaro, c'est eux qui créent le contenu, tu payes pour accéder au contenu créé par un tiers qui se rémunère soit via la pub, soit via un paywall. Quand tu vas faire tes courses tu payes pour avoir le produit, ici c'est la même chose.
Marmiton c'est pas du contenu utilisateur ? Me semblait que si.
L'entreprise surveille également en permanence le noyau en cours de développement actif qui sera la prochaine version de la branche stable. Microsoft maintient en effet de son propre noyau, Azure-tuned, optimisé pour les performances et pour le matériel Azure.
Tout comme il ne faut pas oublier qu'elle maintient deux distributions Linux pour ses propres usages.
CBL-Mariner qui est optimisée pour la containerisation (on peut l'activer optionnellement sur AKS ou les Container app).
Et une autre dont j'ai oublié le nom qui gère les virtual network.
Peut être, mais sur un update journalier, c'est une personne a temps plein qu'il te faut pour tester..
Les tests ça s'automatise ;)
Le
22/07/2024 à
15h
39
Il faut je voir comme sur un bon vieux AV, quand tu as des nouvelles définitions de virus, tu n'attends pas 1 mois pour les appliquer, sinon le produit perd de son intérêt.
T'es pas obligé d'attendre un mois. Un cycle de test peut se faire en une journée.
Surtout si le truc fait un BSOD sur la machine :p
Le
22/07/2024 à
08h
14
Ce n'est pas un patch du client ou quoi que ce soit. C'est une MAJ du catalogue de détection qui, d'après ce que j'ai compris, était là pour ajouter de nouvelles détections mais qui l'a fait dans un espace mémoire ou il ne devrait pas y être. Du coup direct le Kernel Windows s'est mis en sécurité en balançant l'écran bleu.
C'est pour ça que cette MAJ est passé en masse car pour le catalogue c'est direct et sans contrôle
Ça reste quand même un problème pour un SI de mon point de vue : un changement de configuration non maîtrisé qui tank en masse une infra.
Pour moi, c'est comme tourner avec une nightly en prod ce genre de comportement.
Le
21/07/2024 à
17h
57
Perso je retiens surtout un truc qui m'inquiète : des machines de production installent des mises à jour non qualifiées en mode automatique ? Un parc entier ?
Que l'éditeur se chie dessus et sorte une version foireuse, ça arrive.
Mais voir qu'un patch foireux se répand dans un SI aussi rapidement, cela m'inquiète quand à leur maîtrise de la part de toutes ces entreprises.
Je peux comprendre qu'un composant de sécurité nécessite d'être à jour le plus vite possible, car les enjeux sont presque en temps réel. Mais là, c'est inquiétant.
À mes yeux, ça démontre un mauvais choix stratégique : tout centraliser, tout confier à des services managés, tout externaliser, perdre la maîtrise, c'est une vision qui est appréciable sur une ligne comptable à court terme (moins d'ETP, le SI qui devient de l'OPEX, etc). Mais au moindre pépin de ce genre (et un Cloud Provider ou service SaaS, ça se chie dessus plus souvent qu'on ne l'évoque dans la presse, les devs dépendant de GitHub sauront de quoi je parle), c'est une catastrophe et il ne reste que ses yeux pour chialer.
De mon expérience avec le SaaS : c'est bien pour des petites entreprises qui ne peuvent se permettre d'avoir des ETP pour gérer leur IT, ou pour externaliser des services non critiques dont le RTO/RPO et le SLA ne mettent pas en danger l'entreprise en cas d'indisponibilité. Pour le reste, c'est une hérésie de perdre autant sa maîtrise.
Le
21/07/2024 à
17h
48
C'est le revers de la médaille quand on est le backend. Indispensable, mais invisible.
Ici, les Windows impactés ont été en front, donc l'incident très rapidement visible.
Le
21/07/2024 à
15h
34
Je dirais qu'en l'état sur les systèmes en HA critique il faudrait mixer les EDR sur les nœuds. Là le problème c'est que même si tu avais un cluster de X nœuds pour la redondance ça a planté l'ensemble des nœuds. Mixer les EDR ça peut être une bonne idée mais ça va être chiant pour maintenir une cohérence dans le cluster. Bref pas de solution miracle
Chez nous on était pas sur CrowdStrike donc on a rien vu. On a subi la baisse de capa de Entra ID qui a ralenti un chouya la plate-forme mais sinon RAS pour nous et on est à 95% sur du Windows Server.
Ce qui me choque le plus là dedans c'est les médias mainstream qui continuent dans les titres de faire croire que le problème vient de Microsoft. Il sont victime au même titre que l'ensemble des autres boîtes qui sont équipées de CrowdStrike.
Mixer les EDR ça peut être une bonne idée mais ça va être chiant pour maintenir une cohérence dans le cluster.
Et en matière de coût de license ? Je ne connais pas le modèle de ces produits, mais c'est peut-être pas forcément rentable.
L'autre risque étant d'avoir des erreurs de déploiement et de se retrouver avec deux EDR sur la même machine. Pour l'avoir déjà vécu, bah c'est la merde.
D'autant plus que ce qui peut ne pas être attrayant pour une personne, peut l'être pour quelqu’un d'autre... C'est subjectif en plus de ne pas être clair et imprécis.
C'était précisément l'objet de mon message.
Les entreprises de la tech nous habituent à l'arbitraire. Demain, Google décidera que rouge = bleu ou que 2+2=5.
Tout va bien se passer.
Le
22/07/2024 à
15h
44
Des sources seraient grandement appréciées pour étayer une telle affirmation. Merci d'avance.
Un cas datant de cette année : https://www.forbes.com/sites/zakdoffman/2024/07/04/samsung-galaxy-google-pixel-android-users-delete-this-play-store-app/
Le
22/07/2024 à
13h
58
et la surprise lors de l'exécution si l'apk est vérolé jusqu'à la moelle, c'est cadeau
Vu la quantité d'applications vérolées dessus, le Play Store ne protège aucunement de ce risque non plus.
Le
22/07/2024 à
13h
01
"contenu attrayant"
En voilà une définition claire et précise dites donc !
Bon, après, il reste la possibilité d'installer depuis l'APK ou des stores alternatifs des applications qui n'apportent pas de "contenu attrayant". Une fois qu'on a passé les 128 messages anxiogènes et trouvé l'option cachée dans trois millions de sous menus planqués.
Même pour un smartphone Pixel, Gmail, ou Android (par exemple) ?
Dans le cas d'Android, pour moi c'est un non choix. La concurrence se limitant à ça et Apple.
(le Pinephone qui est sur mon bureau n'a ni la maturité, ni la capacité à répondre au caractère de plus en plus obligatoire de ces écosystèmes)
Perso je ne choisirai jamais du Google car leur habitude à supprimer un produit du catalogue sans alternative n'est pas un gage de confiance. Et avec GCP à la mode en ce moment, je sens que va y avoir pas mal de désillusions.
Le
20/07/2024 à
20h
16
J'ai jamais compris comment on peut faire confiance dans Google quand on choisi un produit.
Et l'impact n'est pas que performance technique. Il est aussi financier quand un EDR est mal configuré.
Pour les entreprises qui consomment du Cloud, donc payé à l'usage, un EDR qui scanne des dossiers en permanence c'est autant d'actes de lecture sur des disques managés. Et la facture peut grimper trèèèèèès vite dans le cas de stockage objet.
FP16, ou Half Floating Point, ou encore appelé half precision, la moitié des Floating Point 32 (appelé aussi single precision).
Pour simplifier, c'est le niveau de précision pour les réseaux neuronaux artificiels. Ça réduit l'usage mémoire du modèle.
Le niveau de précision supportée par le GPU est indiqué dans sa fiche technique.
Chez NVIDIA c'est lié aux GPU CUDA : https://docs.nvidia.com/deeplearning/tensorrt/support-matrix/index.html#hardware-precision-matrix
Par exemple ma RTX 3070 du PC de jeux a un Compute Capability de 8.6, elle supporte la précision 16 et 32.
Par contre la vénérable GTX 1080 sur laquelle je fais tourner Stable Diffusion ne l'aura pas (compute à 6.1, même pas dans la liste). C'est pour ça que je ne peux pas forcément utiliser des features trop poussées.
Le
20/07/2024 à
09h
23
Cas d'usage possibles :
- Rédaction automatisée de communications (oui, ça existe déjà, c'est juste une autre façon de le faire). Typiquement la comm' est souvent négligée dans une cellule de crise. - Réponses automatisées un poil plus personnalisées - Avoir des mails lisibles, je bosse avec des européens qui écrivent mieux dans notre langue que des français - Préparer un corps de message à enrichir (on revient dans l'idée du template) comme un CR de réunion par exemple - Insulter un collègue de façon politiquement correcte, car tout le monde ne maîtrise pas l'art de la ponctuation à la fin d'une phrase qui veut dire "connard".
Edit : après ça reste aussi très utile pour de la reformulation.
la demande de rançon n'était pourtant que de 5 000 dollars en bitcoin, « non négociable », à payer dans les quatre jours, sous peine de voir les données revendues. Un montant qui ne colle pas vraiment avec celui que réclame les gangs russophones ciblant les grandes entreprises.
Pour sa défense, si c'est bien cet employé de Cap Gemini, comme ils payent au lance-pierre (vécu) on peut comprendre la confusion sur les montants. 5000 dollars était bien une somme colossale pour ce genre de référentiel.
Jusqu'a présent, si on générait la voix d'une personnalité dans un contexte sérieux (= pas humoristique), c'était forcément pour tromper l'auditoire en mode "fake news". Dorénavant, on peut le faire dans un contexte sérieux pour un motif légitime.
Ce qui pose la question de savoir si c'est une contrefaçon légale ? Ou pas une contrefaçon ? bref...
Ce qui pose la question de savoir si c'est une contrefaçon légale ? Ou pas une contrefaçon ? bref...
La contrefaçon est par définition illégale. Donc le cas de cette parlementaire n'est pas une contrefaçon puisqu'elle l'a fait et a donné son accord.
Donc tout n'est qu'accord d'utilisation.
Par exemple, James Earl Jones avait cédé les droits pour synthétiser sa voix par IA pour le personnage de Dark Vador. Cela ne peut être un contrefaçon puisque c'est un accord d'exploitation contractualisé.
Aux USA les accords verbaux (une poignée de main) ont une plus forte valeur culturelle qu'en France.
C'est donc pareil que l'utilisation de l'image d'une personne. Par défaut, sans accord, c'est une atteinte au droit à l'image (dans le contexte légal français).
Le
18/07/2024 à
07h
39
Je pars du principe que l'orateur approuve le contenu du discours qu'il prononce, même s'il est écrit par d'autre.
Mais là, on entre dans une nouvelle ère où la voix n'est qu'une police d'écriture.
Bientôt on pourra télécharger les voix pour s'exprimer "à la manière de".
Bientôt on pourra télécharger les voix pour s'exprimer "à la manière de".
Ca existe déjà depuis un bail, comme les voix spéciales des GPS par exemple. Ca fait aussi partie des possibilités pour les chat bot vocaux via IA. Dans l'une des démos auxquelles j'avais assisté, le robot utilisait la voix du présentateur.
Dans les faits, il n'y a besoin que de quelques minutes de sample pour que l'outil reproduise la voix d'une façon relativement fidèle. (bon, perso lors de la démo j'avais pas reconnu la voix)
Le
17/07/2024 à
18h
17
Un cas d'usage pas mal pour permettre à des personnes de surmonter un lourd handicap.
L'IA est clairement une opportunité pour améliorer des interactions humain-machine et ça ouvre la voix à de nouvelles possibilités.
Je n'avais pas compris que c'était le gamin qui mettait le smartphone en service. La loi suppose que c'est les parents qui le font, sinon, c'est effectivement mort.
Je pense, et crains, que la loi suppose mal. M'est avis que les parents qui font le setup eux-même et qui gèrent ça comme par exemple @wanou le relate plus haut sont une exception et non la règle.
Le
15/07/2024 à
21h
09
Pré-cocher Non est un dark patern qui pourrait être reproché. Il y a un moyen plus intelligent de poser la question : "quel est l'âge de l'utilisateur ?" éventuellement avec des tranches d'âge pour adapter le paramétrage.
Il fallait voir mon message comme une narration. Le gamin clique non et balec du contrôle parental :p
Le
15/07/2024 à
18h
54
Joyeux anniversaire ! Nouveau smartphone à la mode !
Activer le contrôle parental ? [X] Non [ ] Oui [Suivant]
Je sens que ça va être très efficace.
Edit : Je me rappelle d'une vieille image il y a vingt ans avec la mère qui montrait la boîte du logiciel à son fils.
"Ce logiciel va t'empêcher de voir ce que tu ne dois pas voir. Peux-tu l'installer ?"
Tu peux étendre cette question de validation artistique aux artistes qui voient des albums d'inédits publiés post mortem. Ce sont des morceaux que l'artiste n'avait même pas sélectionnés pour une "face B" de son vivant...
En fait, ce sont pour moi deux choses bien différentes.
Sortir un album de titres originaux que l'artiste n'a jamais voulu diffuser, c'est moralement discutable en matière de respect de sa volonté mais ça reste du contenu original qu'il a fait lui-même. Tout comme reprendre une séquence tournée avec le véritable comédien peut encore passer (exemple : Carrie Fisher rajeunie numériquement dans Rogue One, mais la réplique "Hope" était bien un enregistrement de l'actrice).
Celui que je mettais en exemple était du contenu original post-mortem. Comme si demain on avait un album de Michael Jackson ou Prince complètement inédit synthétisé par IA.
Sur le plan purement légal, la question ne se pose pas vraiment puisque c'est uniquement du droit d'auteur. Et les héritiers / ayants-droits peuvent profiter de l'exploitation de l'oeuvre aussi longtemps que le contrat avec l'auteur le permet (puisque c'est ce dernier qui a accordé le droit d'exploitation et sa durée).
Le
15/07/2024 à
13h
14
Il pourra être intéressant de voir comment ces usages se catégorisent vis à vis du RAI publié hier au journal officiel de l'UE.
Cela dit, le cas des deadbot est aussi similaire avec ce que Hollywood parvient désormais à faire en ressuscitant un acteur décédé que ce soit via le visage ou la voix pour un rôle qu'il aurait tenu par le passé. Outre l'usage de l'image, la question se pose aussi dans sur l'opinion avec le film. La personne aurait-elle voulue jouer dedans de son vivant ?
Là où on est complètement d'accord, c'est que 600km, tu les fais à 50kmh le vent dans le dos et en descente.
Ceci étant dit, mon mètre étalon à moi est le Paris - Briançon (chacun ses petits habitudes). Avec la Model 3, je perds environ 45 minutes de charge sur le trajet aller, callé à 135 kmh, en deux arrêts, en hiver. Au retour, descente oblige, c'est 30 minutes. Ce qui correspond à peu près à ce que je ferais en thermique, à quelques minutes près. Est-ce que c'est significatif sur un trajet de 8h ? Pas réellement, en tout cas pas pour moi.
Je n'ai plus de thermique du tout, pour le coup si j'ai "coûté" la fabrication de la batterie, maintenant je l'amortis !
Ah tu restes quand même à 130 sur autoroute ? Perso j'ai fini par me fixer à 110. Déjà parce que les autoroutes belge sont à 120, donc ça change rien (je vais plus souvent là-bas), et qu'au final sur un trajet d'une quarantaine de km, la diff est négligeable versus le conso de la batterie.
À 110 j'arrive à garder une moyenne de 18Kwh/100 au régulateur, à 130 ça monte un peu plus.
Dans tous les cas, il n'y a pas de "perte de temps" pour recharger, ce sont des pauses nécessaires. Marathoner un trajet de 8h est stupide.
Le
15/07/2024 à
13h
16
Je roule en VW (oui, la voiture du peuple, marque crée par l'Allemagne nazie), essence qui plus est.
À ma décharge, elle a 21 ans et moins de 140 000 km. Je le raye pour le concours du pire.
Je suis nazi + franquiste, roulant dans une marque appartenant à VAG et créée sous l'ère du dictateur espagnol.
Et juste avant j'étais sur une japonaise, donc j'ai roulé pour l'Empire japonais dans son alliance avec les nazi durant la seconde guerre mondiale.
Et encore avant deux italiennes, Mussolini était mon idole.
Le
15/07/2024 à
13h
07
Alors, j'ai une Model 3, que j'ai acheté pour sa capacité à voyager loin et à limiter au maximum mes déplacements en avion (je vise un usage tous les 5 ans max). Faute d'alternative sur le marché, j'ai fait le tour de Norvège en Zoe avant cela, et c'était un peu juste pour convaincre Madame de suivre la distance sur les 3 prochaines années, et si les constructeurs FR ou EU sortaient une berline comparable à la Model 3, je sauterais dessus direct (j'ai bien cherché, croyez-moi). Je hais Elon Musk pour tout un tas de raisons (il ne possède que 20% du capital de Tesla environ). Toutefois, Musk a eu une influence positive sur la démocratisation du déplacement automobile électrique, ce qui est à mettre à son crédit, mettons que ça limite le mépris aux 80% du capital qu'il ne possède pas 😊
Le monde est complexe, et comme le dit @fred42 entre limiter mon empreinte sur l'environnement et filer une part du crédit de mon achat à un gros $#&%, j'ai fait mon choix. Ce n'est pas idéal, mais dans notre monde empli de contradictions, l'inoptimal commence à devenir la norme.
Oui, le déplacement électrique n'est pas la panacée avec une voiture, je sais. Ce n'est que significativement mieux que du thermique.
Pfeuh. Petit joueur.
Avec ces amalgames et ce raisonnement stupide, je suis soutien de deux des plus grandes dictatures européennes du 20è siècle juste avec une bagnole électrique.
14062 commentaires
Copyright traps : un outil pour détecter si un texte est utilisé pour entrainer des IA ?
26/07/2024
Le 27/07/2024 à 08h 03
Perso la question que je me pose, surtout, c'est à quel moment ils comptent injecter ça dans l'entraînement de GPT-5 (par exemple).En dehors de polluer CommonCrawls et d'intervenir dans le traitement des dataset, je vois pas trop.
Sachant que les dataset sont de plus en plus eux-même traités par IA.
Le 26/07/2024 à 18h 31
Il y a un élément que je ne comprends pas dans la mise en oeuvre.L'empoisonnement de données d'entraînement visuelles comme des images ou de la vidéo se fait par watermark qui trompe le processus. L'entraînement des modèles de diffusion se fait par un ajout successif de bruit (corruption de l'image) et diffusion inversée. La génération d'image étant une application successive de filtres de suppression de bruit.
Mais dans un cas d'un texte ? À quel moment cela s'applique-t-il ?
Mettre des phrases incohérentes ou dénuées de sens suffisamment importantes pour être prises en compte dans l'apprentissage va surtout gêner le lectorat de ce texte.
D'ailleurs, CreativeCommons a publié un article hier sur une idée de "Preference Signals". Ça semble encore assez préliminaire, mais ça montre qu'il reste encore beaucoup de réflexion à avoir sur le sujet.
X/Twitter permet par défaut à son IA Grok d’utiliser vos tweets pour son entrainement
26/07/2024
Le 27/07/2024 à 07h 59
La routine habituelle.
De l'arbitraire pur, encore et toujours.
Bof. Ils sont installés dans le pays de l'APD qui a les couilles dans un étau (puisque l'économie de son pays dépend des multinationales étrangères) et donc un pouvoir presque nul. Je n'ai pas vérifié, mais je suppose que X est aussi installé en Irlande.
Quand le bâton de la sanction est une matraque en mousse, ça fini forcément en fête du slip.
Plutôt la reconnaissance d'image pour le coup, même si ua début c'était beaucoup du texte.
Encore une belle idée de merde, n'empêche...
J'adore la société vue par le Web n'empêche : tout le monde est un robot par défaut, tout le monde doit être considéré comme mineur par défaut vu que législation l'impose, et tout le monde doit servir de matière première à entraîner des modèles de machine learning. Manque plus que tout le monde qui doit servir à nourrir la population à la fin et on aura terminé la boucle.
Le 26/07/2024 à 19h 38
Donc cela ne peut être de l'opt-in par défaut.
Mais de toute façon ils s'en foutent. Perso j'ai choisi la solution qui me sied le mieux : refuser d'ouvrir un lien qui va vers ces sites.
Même si cela ne sert pas à grand chose puisque les éviter est quasi impossible. Y compris ici avec des saletés d'intégrations dans les articles.
Le 26/07/2024 à 18h 16
À mes yeux c'est complètement illégal.Microsoft Bing lance prudemment ses résumés alimentés par l’IA générative
25/07/2024
Le 27/07/2024 à 07h 51
Le 26/07/2024 à 19h 28
Perso j'utilise Startpage, mais c'est Google qui est utilisé derrière. Je l'avais retenu pour le côté vie privée et son origine européenne. Quelques features intéressantes comme la consultation de site en mode "privé" où ils font proxy.
Après j'ai pas la prétention de dire qui est mieux, chacun fait son choix selon ses envies.
Le 26/07/2024 à 16h 11
DuckDuckGo c'est pas Bing en backend ?Le 26/07/2024 à 07h 42
En France, Citroen intègre ChatGPT dans ses véhicules, accompagné de la reconnaissance vocale basée IA elle aussi SoundHound. Comme de nombreux autres constructeurs.Si j'y vois du positif en me disant que ça fera moins de distraction comme les écrans d'infodivertissement en produisent, car il s'agira juste de causer comme à ses passagers. J'ai une appréhension quant au caractère verbeux de ChatGPT, et surtout de GPT, qui obligerait à trop se concentrer sur ce qu'il dit vu qu'il aime parler pour ne rien dire ou étaler sa science. À voir si les system prompt ont été pensés de manière plus efficiente.
Evidemment, l'autre point d'attention est la dépendance à la connectivité embarquée du véhicule. Même si c'est déjà la réalité. Perso j'ai désactivé la reconnaissance vocale car celle-ci était basée sur du connecté. Et c'est relou vu ça se déclenche n'importe quand.
En Irlande, les datacenters consomment plus d’énergie que les ménages urbains
25/07/2024
Le 26/07/2024 à 11h 59
C'est une politique très risquée au final.
Grindr suspend la fonction Explorer au Village olympique
24/07/2024
Le 25/07/2024 à 11h 04
Le 25/07/2024 à 07h 37
J'avoue que perso je pensais la notoriété du service assez connue, mais le préciser ne sera pas un luxe en effet.Le 24/07/2024 à 18h 03
Toujours triste de voir que des personnes ne peuvent vivre leur sexualité sans risques.Peut-être qu'un jour notre espèce grandira.
[MàJ] La page Wikipédia francophone de la première ministrable du NFP Lucie Castets débattue
24/07/2024
Le 24/07/2024 à 18h 00
Perso ça m'impression de voir qu'on en est à ce point là pour trouver comment s'écharper sur un sujet. Ça promet pour l'avenir.« Payer ou consentir » de Meta : des « pratiques sournoises » selon la Commission européenne
22/07/2024
Le 23/07/2024 à 18h 18
Linux est aujourd’hui le premier système d’exploitation sur Microsoft Azure
23/07/2024
Le 23/07/2024 à 18h 17
Tout comme il ne faut pas oublier qu'elle maintient deux distributions Linux pour ses propres usages.CBL-Mariner qui est optimisée pour la containerisation (on peut l'activer optionnellement sur AKS ou les Container app).
Et une autre dont j'ai oublié le nom qui gère les virtual network.
Clairement, c'est une autre époque.
Fiasco CrowdStrike : Microsoft persiste et signe, tout est la faute de l’Europe
23/07/2024
Le 23/07/2024 à 18h 07
Méchante UE. À cause d'elle, Microsoft ne peut avoir le monopole pour tanker Windows.[MàJ] Fiasco CrowdStrike : détails techniques, 8,5 millions de machines touchées selon Microsoft
21/07/2024
Le 23/07/2024 à 08h 49
Le 22/07/2024 à 15h 39
Surtout si le truc fait un BSOD sur la machine :p
Le 22/07/2024 à 08h 14
Pour moi, c'est comme tourner avec une nightly en prod ce genre de comportement.
Le 21/07/2024 à 17h 57
Perso je retiens surtout un truc qui m'inquiète : des machines de production installent des mises à jour non qualifiées en mode automatique ? Un parc entier ?Que l'éditeur se chie dessus et sorte une version foireuse, ça arrive.
Mais voir qu'un patch foireux se répand dans un SI aussi rapidement, cela m'inquiète quand à leur maîtrise de la part de toutes ces entreprises.
Je peux comprendre qu'un composant de sécurité nécessite d'être à jour le plus vite possible, car les enjeux sont presque en temps réel. Mais là, c'est inquiétant.
À mes yeux, ça démontre un mauvais choix stratégique : tout centraliser, tout confier à des services managés, tout externaliser, perdre la maîtrise, c'est une vision qui est appréciable sur une ligne comptable à court terme (moins d'ETP, le SI qui devient de l'OPEX, etc). Mais au moindre pépin de ce genre (et un Cloud Provider ou service SaaS, ça se chie dessus plus souvent qu'on ne l'évoque dans la presse, les devs dépendant de GitHub sauront de quoi je parle), c'est une catastrophe et il ne reste que ses yeux pour chialer.
De mon expérience avec le SaaS : c'est bien pour des petites entreprises qui ne peuvent se permettre d'avoir des ETP pour gérer leur IT, ou pour externaliser des services non critiques dont le RTO/RPO et le SLA ne mettent pas en danger l'entreprise en cas d'indisponibilité. Pour le reste, c'est une hérésie de perdre autant sa maîtrise.
Le 21/07/2024 à 17h 48
C'est le revers de la médaille quand on est le backend. Indispensable, mais invisible.Ici, les Windows impactés ont été en front, donc l'incident très rapidement visible.
Le 21/07/2024 à 15h 34
L'autre risque étant d'avoir des erreurs de déploiement et de se retrouver avec deux EDR sur la même machine. Pour l'avoir déjà vécu, bah c'est la merde.
Google veut purger son Play Store des applications instables et peu attrayantes
22/07/2024
Le 23/07/2024 à 07h 34
Les entreprises de la tech nous habituent à l'arbitraire. Demain, Google décidera que rouge = bleu ou que 2+2=5.
Tout va bien se passer.
Le 22/07/2024 à 15h 44
Le 22/07/2024 à 13h 58
Le 22/07/2024 à 13h 01
"contenu attrayant"En voilà une définition claire et précise dites donc !
Bon, après, il reste la possibilité d'installer depuis l'APK ou des stores alternatifs des applications qui n'apportent pas de "contenu attrayant". Une fois qu'on a passé les 128 messages anxiogènes et trouvé l'option cachée dans trois millions de sous menus planqués.
Google annonce l’arrêt de la redirection de son raccourcisseur d’URL à l’été 2025
19/07/2024
Le 21/07/2024 à 11h 13
(le Pinephone qui est sur mon bureau n'a ni la maturité, ni la capacité à répondre au caractère de plus en plus obligatoire de ces écosystèmes)
Perso je ne choisirai jamais du Google car leur habitude à supprimer un produit du catalogue sans alternative n'est pas un gage de confiance. Et avec GCP à la mode en ce moment, je sens que va y avoir pas mal de désillusions.
Le 20/07/2024 à 20h 16
J'ai jamais compris comment on peut faire confiance dans Google quand on choisi un produit.Panne CrowdStrike : comment une simple mise à jour a-t-elle entrainé une telle pagaille ?
19/07/2024
Le 20/07/2024 à 11h 59
Et l'impact n'est pas que performance technique. Il est aussi financier quand un EDR est mal configuré.Pour les entreprises qui consomment du Cloud, donc payé à l'usage, un EDR qui scanne des dossiers en permanence c'est autant d'actes de lecture sur des disques managés. Et la facture peut grimper trèèèèèès vite dans le cas de stockage objet.
Proton lance Scribe, un assistant IA d’écriture pour les emails
19/07/2024
Le 20/07/2024 à 09h 43
FP16, ou Half Floating Point, ou encore appelé half precision, la moitié des Floating Point 32 (appelé aussi single precision).Pour simplifier, c'est le niveau de précision pour les réseaux neuronaux artificiels. Ça réduit l'usage mémoire du modèle.
Le niveau de précision supportée par le GPU est indiqué dans sa fiche technique.
Chez NVIDIA c'est lié aux GPU CUDA : https://docs.nvidia.com/deeplearning/tensorrt/support-matrix/index.html#hardware-precision-matrix
Par exemple ma RTX 3070 du PC de jeux a un Compute Capability de 8.6, elle supporte la précision 16 et 32.
Par contre la vénérable GTX 1080 sur laquelle je fais tourner Stable Diffusion ne l'aura pas (compute à 6.1, même pas dans la liste). C'est pour ça que je ne peux pas forcément utiliser des features trop poussées.
Le 20/07/2024 à 09h 23
Cas d'usage possibles :- Rédaction automatisée de communications (oui, ça existe déjà, c'est juste une autre façon de le faire). Typiquement la comm' est souvent négligée dans une cellule de crise.
- Réponses automatisées un poil plus personnalisées
- Avoir des mails lisibles, je bosse avec des européens qui écrivent mieux dans notre langue que des français
- Préparer un corps de message à enrichir (on revient dans l'idée du template) comme un CR de réunion par exemple
- Insulter un collègue de façon politiquement correcte, car tout le monde ne maîtrise pas l'art de la ponctuation à la fin d'une phrase qui veut dire "connard".
Edit : après ça reste aussi très utile pour de la reformulation.
Panne et paralysie mondiale : une mise à jour CrowdStrike provoque des bugs en cascade
19/07/2024
Le 19/07/2024 à 14h 05
Au moins, c'est un EDR efficace ! Une machine tankée est une machine sécurisée.Pour désorbiter l’ISS, SpaceX va construire une capsule « Dragon sous stéroïdes »
18/07/2024
Le 18/07/2024 à 20h 33
Pfeuh, SpaceX se ramollie. À une époque ils auraient lancé une Falcon Heavy pour l'exploser.Wikipédia a enfin son mode sombre
18/07/2024
Le 18/07/2024 à 18h 13
Bon bah je vais pouvoir désactiver Dark Reader dessus.Un ingénieur de 26 ans soupçonné d’avoir rançonné son employeur, Cap Gemini
18/07/2024
Le 18/07/2024 à 18h 09
Pour sa défense, si c'est bien cet employé de Cap Gemini, comme ils payent au lance-pierre (vécu) on peut comprendre la confusion sur les montants. 5000 dollars était bien une somme colossale pour ce genre de référentiel.États-Unis : malade, une parlementaire utilise l’IA pour continuer de s’adresser au Congrès
17/07/2024
Le 18/07/2024 à 18h 06
Donc tout n'est qu'accord d'utilisation.
Par exemple, James Earl Jones avait cédé les droits pour synthétiser sa voix par IA pour le personnage de Dark Vador. Cela ne peut être un contrefaçon puisque c'est un accord d'exploitation contractualisé.
Aux USA les accords verbaux (une poignée de main) ont une plus forte valeur culturelle qu'en France.
C'est donc pareil que l'utilisation de l'image d'une personne. Par défaut, sans accord, c'est une atteinte au droit à l'image (dans le contexte légal français).
Le 18/07/2024 à 07h 39
Dans les faits, il n'y a besoin que de quelques minutes de sample pour que l'outil reproduise la voix d'une façon relativement fidèle.
(bon, perso lors de la démo j'avais pas reconnu la voix)
Le 17/07/2024 à 18h 17
Un cas d'usage pas mal pour permettre à des personnes de surmonter un lourd handicap.L'IA est clairement une opportunité pour améliorer des interactions humain-machine et ça ouvre la voix à de nouvelles possibilités.
L’Autorité de la concurrence confirme enquêter sur NVIDIA
17/07/2024
Le 18/07/2024 à 07h 35
Tout ça parce qu'ils n'ont pas réussi à installer le driver sous Linux. Ces rageux !Élections américaines : les fondateurs d’Andreessen Horowitz financeront le camp Trump
17/07/2024
Le 17/07/2024 à 18h 15
Y'a beaucoup d'électeurs Etats-uniens sur Next ?Le DRH de Zoom vante les mérites du présentiel, mais reste en télétravail
17/07/2024
Le 17/07/2024 à 18h 05
Le titre est est un peu putaclic ici.
Le contrôle parental désormais obligatoire sur les appareils connectés, l’ANFR veillera au grain
15/07/2024
Le 16/07/2024 à 07h 36
Le 15/07/2024 à 21h 09
Le 15/07/2024 à 18h 54
Joyeux anniversaire ! Nouveau smartphone à la mode !Activer le contrôle parental ?
[X] Non [ ] Oui
[Suivant]
Je sens que ça va être très efficace.
Edit : Je me rappelle d'une vieille image il y a vingt ans avec la mère qui montrait la boîte du logiciel à son fils.
"Ce logiciel va t'empêcher de voir ce que tu ne dois pas voir. Peux-tu l'installer ?"
Le comité éthique du CNRS appelle à la vigilance sur les robots « sociaux »
15/07/2024
Le 15/07/2024 à 18h 31
Sortir un album de titres originaux que l'artiste n'a jamais voulu diffuser, c'est moralement discutable en matière de respect de sa volonté mais ça reste du contenu original qu'il a fait lui-même. Tout comme reprendre une séquence tournée avec le véritable comédien peut encore passer (exemple : Carrie Fisher rajeunie numériquement dans Rogue One, mais la réplique "Hope" était bien un enregistrement de l'actrice).
Celui que je mettais en exemple était du contenu original post-mortem. Comme si demain on avait un album de Michael Jackson ou Prince complètement inédit synthétisé par IA.
Sur le plan purement légal, la question ne se pose pas vraiment puisque c'est uniquement du droit d'auteur. Et les héritiers / ayants-droits peuvent profiter de l'exploitation de l'oeuvre aussi longtemps que le contrat avec l'auteur le permet (puisque c'est ce dernier qui a accordé le droit d'exploitation et sa durée).
Le 15/07/2024 à 13h 14
Il pourra être intéressant de voir comment ces usages se catégorisent vis à vis du RAI publié hier au journal officiel de l'UE.Cela dit, le cas des deadbot est aussi similaire avec ce que Hollywood parvient désormais à faire en ressuscitant un acteur décédé que ce soit via le visage ou la voix pour un rôle qu'il aurait tenu par le passé. Outre l'usage de l'image, la question se pose aussi dans sur l'opinion avec le film. La personne aurait-elle voulue jouer dedans de son vivant ?
Elon Musk soutient officiellement Donald Trump pour la présidentielle aux États-Unis
15/07/2024
Le 15/07/2024 à 15h 51
À 110 j'arrive à garder une moyenne de 18Kwh/100 au régulateur, à 130 ça monte un peu plus.
Dans tous les cas, il n'y a pas de "perte de temps" pour recharger, ce sont des pauses nécessaires. Marathoner un trajet de 8h est stupide.
Le 15/07/2024 à 13h 16
Et juste avant j'étais sur une japonaise, donc j'ai roulé pour l'Empire japonais dans son alliance avec les nazi durant la seconde guerre mondiale.
Et encore avant deux italiennes, Mussolini était mon idole.
Le 15/07/2024 à 13h 07
Avec ces amalgames et ce raisonnement stupide, je suis soutien de deux des plus grandes dictatures européennes du 20è siècle juste avec une bagnole électrique.