Logiciel espion, détournement de RIB, boîtier équipé d’une carte SIM dans la voiture, détournement de la domotique… À l’heure du numérique, les violences conjugales aussi prennent un tour technologique.
Et de manière plus globale, les capacités d’espionnage et de violation de la vie privée sont une véritable horreur vu que n’importe qui peut acheter son petit kit du parfait espion en ligne pour pas cher.
C’est comme les personnes qui collent des balises GPS à leurs mouflets ou encore les locations entre particulier avec des caméras cachées. Ajouté à cela les assistants connectés de toute sorte qui écoutent H24 des conversions et enregistrent les moindres faits et gestes, la surveillance de masse c’est une réalité depuis des années qu’elle soit d’origine étatique, entreprise privée, et cercle de proches.
C’est clair. J’avais osé posté une réponse sur youtube où je disais une c’était pas une bonne idée de retirer les radars pour se baser uniquement sur les caméras. Trois fanboys m’étaient tombés dessus avec une virulence qui m’avait bien fait rire. On aurait dit que j’insultais leur mère. Je n’arrive pas à comprendre cette polarisation que cette entreprise/personnage provoque.
C’est pas que lié à Tesla, c’est une tendance globale de la radicalisation des discussions sur le Web. Avec l’effet de bulle des médias sociaux et la tendance à s’enfermer entre gens d’accords entre eux, la moindre critique devient une attaque.
Le web “social” c’est rien de plus que la dérive sectaire 2.0.
Si historiquement il y avait des débats houleux entre paroisses (“mac vs pc” etc), ça s’est accentué avec les murs dressés entre idées divergentes.
Le
17/08/2023 à
19h
22
Parfois l’alerte (sans freiner) se déclenche aussi avec les haricots au milieu des voies à 30 pour forcer à ralentir. Genre le truc voit le panneau au milieu il panique.
D’ailleurs c’est une des autres raisons pour lesquelles je ne voudrais pas de Tesla. Ces bagnoles passent leur temps à bipper dans tous les sens au moindre moustique sur le pare brise, quelle plaie !
Non, j’émets simplement une hypothèse, je trouve que la question vaut le coup d’être posée.
J’ai posé la question car ton propos n’était pas une hypothèse pour moi mais une affirmation. Une hypothèse, c’est du conditionnel, en principe.
Le
17/08/2023 à
18h
42
Je comprends son point de vue quand même.
Vendre des parts d’une société criblée de dettes et menacée de liquidation, ça va se faire à 1 euro symbolique.
Faire un appel aux dons, récupérer 60000 euros de lecteurs ça permet de revendre les parts bien plus cher. Les lecteurs financent donc le rachat des parts, mais sans en toucher une seule.
As-tu accès au dossier de cession de l’entreprise ?
Le
17/08/2023 à
17h
12
Si tu relis mes propos, je parle bien de don.
Rien n’oblige à le faire, nous sommes d’accord.
Après si on me faisait un don pour réparer une voiture, par exemple, abimée pour que je puisse aller travailler, mais que grâce à ces dons, la voiture serait super nickel, et que je la revendrais ainsi, ce serait pour moi naturel de partager le fruit de la vente avec les donateurs qui m’ont aidé même si eux ne pourraient / demanderaient quoi que soit.
J’ai des doutes que ce soit légalement possible. Si je ne m’abuse, le don est envoyé à l’association loi 1901 “J’aime l’info” qui fait office d’intermédiaire.
Et dans tous les cas, de mon point de vue, ça n’a aucun sens de vouloir partager les fruits car ici il n’y en a aucun : c’est juste la revente des parts à un autre actionnaire qui devient majoritaire.
Le
15/08/2023 à
08h
39
Je pense qu’il faut d’abord définir “IT” car, au même titre que “numérique”, cela englobe énormément de choses tellement c’est vague. Si l’IT c’est juste des news sur les OS et le hardware, de mon point de vue c’est hautement réducteur.
Typiquement les sujets juridique ont une très haute importance au niveau de l’IT : vie privée, collecte des données, traitement de celle-ci, connaître ses droits en la matière, connaître l’évolution du contexte légal, la risque juridique associé, autant de choses importantes à suivre quand on travaille dans l’IT. Exemple simple : dans les questionnaires d’évaluation que j’envoie à des éditeurs de solution dans le cadre de mon taff, la moitié des questions est d’origine juridique plus que technique.
Exemple : on peut se dire que “où sont stockées les données” est une question technique, mais son fondement pourtant est légal : RGPD. Choisir un produit SaaS qui soit non conforme expose l’entreprise à un risque juridique, c’est typiquement le genre d’erreur que fait un projet focalisé sur la technique.
NXI aurait peut être tout intérêt à présenter l’impact du juridique sur les choix techniques, je pense que ça pourrait être très intéressant.
(quote:2147226:Trit’) Je viens d’essayer sur un site où essayer de récupérer la playlist M3U8 depuis les outils de dev bloque en 403, et ça n’a pas marché. Dommage…
Avec Youtube DL l’astuce est de récup la chaîne curl (incluant les headers) et transformer la commande curl en yt-dlp en adaptant le nom des arguments. Ca passe dans 90% des cas me concernant.
Le
17/08/2023 à
16h
35
jpaul a dit:
C’est dingue l’acharnement inefficace contre cet outil qui ne sert à rien d’autre que de faire une copie privée d’un contenu auquel tu as déjà accès de toutes façons, que le grand public n’utilise pas et ne connaît pas, qui a été forké mille fois, qui ne doit représenter quasi aucun manque à gagner pour qui que ce soit …
Pour le droit allemand, je ne sais pas.
Pour le droit français, on paye ce manque à gagner dans la redevance copie privée.
Le
16/08/2023 à
16h
14
Il reste dans les repos de la plupart des distribs majeures.
Edit : rappelons aussi que le repo GitHub de youtube-dl avait aussi été stricken sur notif DMCA avant d’être réatabli.
Il faut mettre une limite quelque part, et compter sur un minimum de culture générale des lecteurs du site.
Pour moi, la limite est la devise du site : “Si tu sais pas, tu demandes. Si tu sais, partage”.
Si Cloudflare est un acteur important de l’IT, même en travaillant dans ce secteur on peut l’ignorer si ce n’est pas notre domaine d’activité.
Le
12/08/2023 à
08h
14
Cloudflare est l’un des plus gros fournisseurs de Content Delivery Network (réseau distribué mondialement pour fournir le contenu au plus proche du client), ainsi que fournisseur de solutions de protection DDoS.
Le
10/08/2023 à
16h
56
Conditions météo extrêmes et câbles endommagés
Les fortes intempéries aux Pays Bas qui ont eu lieu entre juin et juillet ont aussi eu un impact sur la région West Europe de Microsoft Azure. Fibres sectionnées, latences et pertes de paquets voire indisponibilités de services.
1 - traducteurs (les traductions Anglais <–> Français sont à 98% parfaites dans Google Translate maintenant, très très loin de la qualité des années 2010)
Pour le coup ce sont les LLM qui viennent bouleverser ce domaine car ils ont une capacité de traduction innée dans les principales langues parlées dans le monde (même s’il faut toujours fait attention car il peut potentiellement réécrire le contenu).
Le
16/08/2023 à
18h
07
Assez d’accord avec toi, le système de sélection dans Amazon prime n’est pas fait pour faciliter le choix mais pour te dire quoi regarder.
Je crois que j’avais vu des critiques similaires sur Netflix, mais vu que je ne l’ai pas je ne sais pas si c’est exactement la même chose.
Il manque des fonctionnalités évidentes permettant de trier par sortie ou un filtre par tags. Je suppose que c’est volontaire et que ça fonctionne (pour eux), mais ce n’est vraiment pas pratique pour les clients.
Après je ne vais pas dire que la télé linaire est plus pratique, mais effectivement on a plus tendance à savoir ce qu’il y a et ce que certaines chaines proposent via leur ligne éditoriale.
Le foutoir de la présentation des émissions c’est le propre des plateformes américaines.
Les plateformes françaises comme MyCanal et OCS sont triées par catégories et thématiques parlantes.
Ca serait pas mal d’avoir des comparaisons avec la situation en France. De ma fenêtre, je vois qu’un certain équilibre s’est créé malgré les fortes réticences à un moment.
C’est même devenu une des clauses de sélection d’entreprise pour les métiers en tension.
Une meilleure libre de droit, une invention française d’un docteur afin de couper les cigares. Invention utilisée en France entre 1792 et 1981. Il paraîtrait même que certains politiques actuels s’offusquerait de tout rappel de ce passé révolutionnaire qui permit d’instaurer notre chère république. Les mêmes qui nous rabâchent que nous sommes républicains et qu’ils faut se souvenir de nos beaux principes instaurés en 1789. Z’ont du zapper l’épisode Mara et rosbespierre…
Ah oui, un appel au meurtre arbitraire, voilà qui est aussi une très bonne idée.
Et une démonstration aussi que les moyens existent depuis fort longtemps pour attraper les délinquants & criminels, et qu’ainsi, la surveillance de masse pour attraper quelques individus est un prétexte sécuritaire servant donc d’autres finalités.
Partir de sa conclusion ne me semble pas être la meilleure des choses à faire pour constater une situation. Plutôt qu’une image romantisée d’intentions cachées, je pense que la surenchère de lois sécuritaires toutes aussi inapplicables et les unes que les autres est plutôt causée par une absence de compréhension des enjeux et concepts du numérique de la part du législateur couplée à une radicalisation de plus en plus forte du discours politique. Incompréhension certainement appuyée par des études diverses auxquelles personne ne comprend grand chose.
Ce genre de situation se retrouve aussi en entreprise. Les cabinets de conseil qui font des audit et études, restituent celles-ci auprès de décisionnaires, mais qui n’ont compris que le tiers (quand elle a eu une véritable pertinence) alors qu’il y a pourtant de vraies problématiques à traiter.
Le
11/08/2023 à
15h
46
Une démonstration que l’anonymat fantasmé sur les réseaux est un bien un fantasme. Avec toutes les activités du quotidien qui impliquent l’utilisation d’outils et de services numériques, il est illusoire de croire qu’on ne laisse pas de trace.
On va dire que dans un cas comme celui-ci où c’est un vote “sauvage”, les contre auront beaucoup plus tendance à voter que les pour.
Comme sur les “avis” et autres “feedback”, les gens satisfaits ou sans opinion ont moins souvent tendance à se plaindre que les mécontents. Entraînant un effet de loupe sur un groupe un peu plus bruyant.
Je serais bien intéressé de voir une présentation un peu plus vulgarisée pour mieux comprendre cette idée de “application = un node” et comment ça garantie la confidentialité de l’échange. J’ai regardé le PDF de la présentation mais ça m’avait l’air encore trop adressé aux représentants du secteur.
Après, je pense que ce genre d’outil restera assez confidentiel pour les quelques marginaux dans mon genre qui essayent d’être le moins possible dans le “marché de la donnée personnelle” dénoncé dans le dernier paragraphe de l’article.
Par contre, il risque d’être vite accusé de contribuer à des activités illicites au même titre que Tor.
Oui, à ce sujet je ne comprends pas pourquoi… La plupart des ralentisseurs que je croise ont l’air d’être fait “à la main”, la hauteur est toujours variable, c’est une bosse de goudron quoi…
Pourquoi ne pas autoriser que les ralentisseurs préfabriqués ? Cela existe (des sortes de carrés rouges fixés au sol), mais ils sont très minoritaires :/
C’est clair qu’il y en a sur Lille qui tiennent plus de la bordure de trottoir que du ralentisseur. Même à 10km/h t’as l’impression de faire un bond de 20m de haut. Et je te raconte pas en vélo…
C’est d’ailleurs un des côtés moins agréables d’une voiture électrique : les suspensions sont un peu plus fermes, ce genre de ralentisseurs est encore plus tape cul.
Le
13/08/2023 à
18h
18
(quote:2146738:alex.d.) Tu as déjà vu à quelle vitesse une voiture autonome roule réellement en ville ? Tu mets une voiture autonome rond point de l’étoile, demain elle n’a pas encore fini de traverser.
Le seul véhicule autonome que j’ai connu sur la voie publique en France, c’est l’expérimentation de la navette du campus universitaire de Villeneuve d’Ascq.
Qui avait pour obligation de rouler à 5km/h et s’arrêtait au moindre caillou sur la route.
Par rapport au contexte de cet article où il y a des autorisations bien plus élevées, c’est un tout autre ordre de grandeur.
Le
13/08/2023 à
13h
42
Ah bah sur Wikipedia, c’est pas cela:
en France (dans le langage courant) et en Belgique, un rond-point est un carrefour giratoire avec priorité aux véhicules circulant sur l’anneau et donc une priorité à gauche afin de faciliter la circulation
Pour eux c’est la même chose. Et j’avais jamais vu de rond-point avec des feu à l’intérieur avant d’arriver vers Toulouse (y en a même avec les voies de Bus+feu à l’intérieur…, le nombre de fois ou j’ai faillit m’encastrer un Bus :/)
Ce qu’on appelle assez communément “rond point” est en réalité principalement un “carrefour à sens giratoire” dans le code de la route (pour le coup je préfère cette source que Wikipedia qui n’a aucune valeur légale).
Les deux différences importantes entre le rond-point et le carrefour à sens giratoire :
La priorité à droite s’applique sur le rond-point, les personnes qui y rentrent sont prioritaires puisqu’elles viennent de la droite (il me semble que c’est le cas du rond point de l’étoile à Paris, là où il y a l’Arc de Triomphe), là où sur le carrefour à sens giratoire, les véhicules entrant ont un cédez le passage ou un feu (il y en a aussi sur Lille et Reims de mon expérience qui sont comme ça).
Le rond point est signalé par le panneau rond bleu tandis que le carrefour à sens giratoire est signalé par un panneau danger triangulaire. Le rond point a généralement peu de signalisation l’annonçant d’ailleurs.
Cela dit, en France, la majorité des ronds points sont des carrefours à sens giratoire, d’où l’abus de langage.
Le
12/08/2023 à
12h
29
Justement, parlons-en de la vitesse :
Euh… faudrait m’expliquer là… Qu’est-ce qu’a l’un que l’autre n’a pas ?
C’est quoi ce binz ? Quels sont les critères pour dire à l’un : tu dépasse pas cette vitesse épices et tout ? Ton concurrent, lui, peut aller deux fois plus vite, mais c’est comme ça, parce que la vie est injuste…
Je pense qu’il faut lire les deux décisions, ça doit être lié à la maturité du produit chez l’un ou l’autre j’imagine.
Le
12/08/2023 à
08h
03
Au même titre qu’un taxi, un VTC, et n’importe quel autre véhicule en ville. Donc au final pas de différence en dehors de l’absence de chauffeur.
Le
11/08/2023 à
20h
44
Ca dépend, est-ce que dans le cahier des charges tu inclues le fait que le véhicule est armé de canons, d’un pare buffle, et peut avancer coûte que coûte ? Si oui, ça peut arriver plus vite qu’on ne l’imagine
Le
11/08/2023 à
15h
27
Pour une course purement urbaine, les 50km/h de limitation suffisent largement.
Le véhicule à la demande, c’est aussi la vision que j’avais pour les voitures autonomes. J’imagine que ça se développera dans un prochain temps une fois les restrictions amoindries.
Concernant la France, effectivement, le blinde de ronds-points de toute taille et plus ou moins anarchiques rend un peu plus compliquée l’histoire.
A ce niveau de fragmentation, avec des prix qui augmentent, et une qualité de plus en plus discutable pour la plupart des nouvelles séries, je vois pas comment l’industrie du streaming pourrait s’en sortir sans une grosse phase de consolidation.
Clairement, ça va arriver. Le mode de consommation différent de la TV traditionnelle (même si les nouveautés restent diffusées de manière hebdomadaire) fait qu’on peut regarder les contenus qui nous intéressent et stopper l’abonnement ensuite.
En dehors d’offres groupées comme celle que j’ai avec MyCanal, les gens ne vont clairement pas cumuler les abonnement et jongler entre ceux-ci peut présenter des contraintes.
C’est un modèle qui demande de capter le client dans la durée, mais produire du contenu régulier ça a un coût. Surtout quand il est de qualité, car la prod industrielle de Netflix montre désormais les limites de l’exercice. Cela montre aussi qu’on a été biaisés dans notre historique de visionnage des contenus d’origine américaine. Si à la TV nous avons eu la plupart des gros “hits” qui ont réussi à s’exporter et à durer pour la plupart, les productions de merde nous étaient en quelque sorte masquées car elles n’ont pas quitté leur pays d’origine ou son restées plus confidentielles. Avec ces plateformes qui internationalisent leurs productions, on se rend compte de l’exception que représente les bons contenus.
Le
11/08/2023 à
10h
59
Perso je l’ai en inclus avec MyCanal, donc ça ne changera à priori ps grand chose.
Par contre je trouve que cette plateforme rame ces derniers temps.
Ne jamais envoyer autre chose qu’un PDF. Ça évite bien des fuites.
Pas possible , car ensuite les fichiers Excel sont re consolidés dans le système et ensuite grosse macro qui remouline tout ça pendant plusieurs minutes (à l’époque en 2011), tout faire en texte, grosse galère, avec tous les filtres de conversion char <–> numérique
Et la tronche du fournisseur si on lui envoie du fichier en format “texte” non editable…enfin très difficilement, sachant que c’est pas le but du PDF de faire du travail “collaboratif”…
J’ai appris par un fournisseur après ma boulette que mon boss avait fait quasiment la même un an avant…
L’être humain est faillible après des centaines de copié collés dans une même journée…
(note: la boîte était Schneider Electric)
Ah, le bon vieil ETL développé dans Excel couplé à son célèbre mode SGBD ?
Je pense que vous auriez tout à y gagner de passer sur un vrai système de gestion d’achats au vu du besoin.
Google aussi a toujours du mal à faire revenir sur site ses employés. A côté de ça, j’ai pu découvrir que d’autres entreprises de l’IT sont entièrement en remote. Mais je trouve ça un peu extrême perso.
L’étude a commencé en 2009 et le choix d’architecture finalisé en 2014. Le développement des premiers modèles a démarré en 2016 avec un objectif d’un premier tir en 2020.
Maitriser les conversations de ses employés en dehors du cadre de l’entreprise me paraît irréaliste. Et pourtant c’est bien un moyen de fuite d’informations.
Il suffit de prendre un train pour compter le nombre de personnes qui travaillent dedans avec un PC sans filtre anti regards indiscrets ou encore des employés d’une même société discuter ouvertement en public d’un plan business sans avoir conscience qu’un concurrent peut les écouter.
Mais à part de la sensibilisation, il est illusoire de penser pouvoir réguler ça.
Et contrairement au petit discours moralisateur ambiant qui consiste à dire qu’il faut éduquer les hommes, je penses surtout qu’il faut éduquer les femmes et les accompagner pour qu’elles sortent de l’enfer dans lequel elles s’enferment bien souvent volontairement.
Dans mon cas, à aucun moment je n’ai dit qu’il faut éduquer les hommes. L’éducation qui manque, c’est le respect d’autrui, rien de plus.
Cela peut paraît choquant, mais je ne fais pas de distinction entre les hommes et les femmes au sein de la société. Je préfère une vision équilibrée en droits et respect envers les personnes qui la constitue.
Le
11/08/2023 à
06h
16
(quote:2146441:consommateurnumérique) Or, avant d’avoir nécessité de passer par la justice, il y a la responsabilité individuelle de chacun (homme ou femme).
Il y a aussi besoin de continuer l’effort sur la prise de plainte par la police. Aujourd’hui il y a encore de trop nombreux cas où les plaintes pour harcèlement ne sont pas prises au sérieux alors que les conséquences peuvent finir dans les faits divers de la presse. L’Etat de droits censé protéger ses citoyens a malheureusement encore des maillons défaillants dans sa chaîne.
Sinon je suis d’accord avec le reste de ton message.
Le
10/08/2023 à
16h
25
Tandhruil a dit:
Premier point amusant, on discute de la situation des femmes essentiellement entre couilles
Bah on a le droit d’avoir un avis sur la question est de l’exprimer. Si des personnes estiment qu’il est interdit de parler d’un sujet parce qu’on est pas concerné, qu’elles retournent dans leur dictature.
C’est la notion de désir qui ma fait tiquer mais effectivement arrêter de considérer la femme comme un objet (une petite chose fragile ?) serait une bonne approche.
Oui c’était bien le mot “objet” qui était important, pas forcément au sens “petit chose fragile” même si ça reste encore un cliché en vogue, mais au sens “objet à posséder” ou “convoiter”. Si le jeu de la séduction, la mise en valeur de soit-même, etc, sont des choses parfaitement normales peu importe le genre, considérer l’autre comme étant une chose à posséder ou conquérir pour moi ça pue.
En fait, cet aspect éducation sur le regard porté envers les femmes a été évoqué la semaine dernière sur FranceInfo à l’occasion des 20 ans de l’affaire du meurtre de Marie Trintignant. L’aspect intéressant de l’histoire, pour moi, est l’évolution du vocabulaire qui démontre comment la société considérait ce genre d’affaire. Le fait qu’à l’époque c’était évoqué comme un “crime passionnel”. Même si parfois je n’étais pas forcément d’accord avec les propos de l’intervenante, j’ai trouvé cette comparaison de contexte intéressante et j’y vois un complément aux termes que j’ai cité un peu avant : “posséder”, “convoiter”, “conquérir”, autant de termes qui pour moi déshumanisent.
Par contre le gros risque, piège dans lequel je pense que la société est en train de tomber si ce n’est déjà fait, c’est de vouloir basculer dans l’extrême inverse et de faire de la surprotection. Mécaniquement, pour moi, ça va coller l’image de “faiblesse” comme tu l’évoquais. C’est un équilibre difficile à atteindre mais j’ai peur qu’inscrire dans la loi que la femme est plus faible que l’homme et doit être surprotégée n’ait de bonnes répercussions sur sa place dans la société.
Bref, pas facile tout ça, et ça ne pourra pas se résoudre en peu de temps mais bien en de nombreuses générations. L’historienne dans l’article que j’ai mis en lien citait l’article 213 du Code Civil, réécrit en 1971. C’était il y a plus de 50 ans, et on a encore beaucoup de chemin à faire.
Le
10/08/2023 à
11h
42
Éradiquer la notion de désir amoureux n’était pas mon propos. Quand je parlais d’arrêter de vendre la femme comme un objet de désir, c’est justement le déséquilibre qu’il y a entre la sexualisation du corps masculin et féminin.
Un simple exemple : pourquoi un homme peut être torse nu en public tandis qu’une femme non ? Pourquoi un homme ne peut pas porter de tenues traditionnellement considérées comme féminines sans se voir moqué ?
C’est ce genre de déséquilibre qui, pour moi, continue de provoquer des comportements d’un autre temps. Et ça ne changera pas demain, mais seulement après des décennies de changement d’éducation.
Le
09/08/2023 à
16h
35
La root cause restera un problème d’éducation. Aussi longtemps que la femme sera vendue par la société comme un objet de désir à convoiter, ces problèmes persisteront.
La contrepartie d’un moteur de recherche classique est que son résultat permet d’obtenir l’adresse d’un site qu’il a crawlé. Cela permet donc d’orienter un internaute directement vers un des sites référencés. Ici ce n’est pas du tout la même chose: comme dit plus haut le résultat n’est pas l’adresse d’un site, mais une réponse qui a utilisé le contenu du site et qui de fait n’incitera pas à consulter le site crawlé. Ce n’est donc pas du tout le même résultat.
C’est sur ce détail que OpenAI se fourvoie de mon point de vue d’ailleurs. Leur conception du LLM semble se rapprocher de “oracle qui sait tout” en ne faisant qu’exploiter le contenu du modèle alors que c’est stupide car celui-ci sera toujours à la bourre et dépassé (GitHub Copilot en fait les frais, il fait parfois des propositions datées par rapport à un langage ou framework qui ont évolué).
L’utilisation faite dans Bing est plus pertinente puisque l’outil prend note de la question de l’utilisateur, fait les recherches, puis restitue une synthèse et un résultat tout en donnant ses sources. Mais dans tous les cas, le LLM a besoin d’avoir été entraîné sur des jeux de données pour comprendre le contexte de la requête.
De mon point de vue et expérience avec les LLM, c’est l’approche qui permet d’exploiter leur plein potentiel. N’utiliser que les données du modèle, c’est aussi pertinent qu’un 4x4 en ville pour faire 2km. C’est dommage que le mode Web de ChatGPT ait été retiré (pour les mêmes raisons d’ailleurs…) car il démontrait tout la valeur ajoutée de l’outil.
Le crawler d’OpenAI ne sert pas d’indexation du web mais d’outil pour remplir une base d’apprentissage pour une IA
C’était avant tout un parallèle sur le principe : indexer le contenu sans autorisation explicite (l’indexation du Web reste une action passive, et le robots.txt n’est en rien une loi universelle) est vieux comme le Web lui-même. En refusant/bloquant/monétisant le crawling pour diverses usages (qu’ils soient entraînement IA, recherche scientifique, ou autre y compris à des fins malveillantes), les acteurs poursuivent la tendance de se replier sur soit et forcer du contrôle d’accès. Ce qui fut la force du Web est devenu sa principale hantise : l’accessibilité, l’interopérabilité et l’ouverture.
C’est principalement ça que je dénonce car les conséquences ne peuvent qu’être néfastes en matière d’accès à l’information et respect de la vie privée.
Le
10/08/2023 à
06h
15
A force de ce genre de réaction le Web va être de plus en plus fermé, tout contenu uniquement accessible derrière un compte utilisateur. Je ne pense pas qu’on y gagnera au change.
Pour les éditeurs qui accepteraient le passage GPTBot sur leurs sites web, en revanche, OpenAI ne semble pas avoir prévu de contrepartie aux données récupérées.
Au même titre que Google et autres moteurs de recherche ne me fournissent aucune contrepartie pour les contenus que je publie sur mon blog et que rien ne démontre si le robots.txt est vraiment respecté.
On en revient à la remise en cause de la notion d’indexation du Web par les moteurs de recherche.
Le LLM n’a PAS d’opinion. Il écrit une suite de mots cohérente par rapport aux relations qu’il a apprises pour le contexte donné. Il n’a aucune idée du sens des mots qu’il écrit. Si on l’entraîne pour lui apprendre que le ciel est rose à pois verts, il dira que le ciel est rose à pois vert. Ce qui va jouer sur sa production de contenu, c’est le contexte demandé (le prompt) et les paramètres de génération (température, etc).
Pour moi, pointer le LLM du doigt c’est regarder le doigt au lieu de la lune. Le problème n’est pas le résultat mais le processus d’entraînement. Et là dessus, l’opacité des entreprises de l’IA sur les jeux et données d’entraînement a toujours été considérée et dénoncée comme étant un problème.
Par contre, démontrer que ces orientations sont présentes dans le résultat est une bonne chose pour prendre conscience des risques liés à des mauvaises manipulations de ces outils.
Après est-ce qu’il y a un risque de manipulation des populations via ces outils ? Evidemment, au même titre que les médias sociaux le font déjà et il ne m’étonnerait pas que ce site même soit aussi infesté par les fermes à contenus manipulatoires comme dans les commentaires d’autres sites de presse en ligne. Des modèles GPT existent déjà en ce sens tout comme il existe des modèles sans filtres qui produisent du contenu très peu politiquement correct.
Les livres plus conservateurs que le web ?
Bah je dirais que c’est une évidence puisque les livres étant relatifs à leur époque d’écriture, ils transpireront du contexte politique et social de celle-ci. Si j’entraînais un LLM sur des livres écrits il y a plus d’un siècle, il produirait très certainement des résultats parlant de “nègres” et autres termes qui aujourd’hui ne sont socialement plus tolérés. La différence avec l’humain est qu’il est, en principe, capable de remettre dans son contexte l’écrit par rapport à son époque à soit là où pour le LLM, c’est le contexte avec lequel il apprend à lire.
Là aussi la vraie question est de connaître l’exhaustivité du jeu d’entraînement et les paramètres qui ont été appliqués pour en déduire l’orientation prise.
J’ai hâte de voir l’application aux enceintes connectées. Rappelons-nous d’Alexa lançant un défi à un enfant de 10 ans de jouer avec une prise électrique. Cela rentre parfaitement dans la définition des “équipements terminaux destinés à l’utilisation de services de communication au public en ligne donnant accès à des services et des contenus susceptibles de nuire à l’épanouissement physique, mental ou moral des mineurs”
Bah on s’en fout de ça, les gamins peuvent se tuer en s’électrocutant c’est pas un souci. Du moment qu’ils n’ont pas vu du porno, car là ça serait un véritable scandale d’Etat. Que dis-je, planétaire.
Le choix d’un tel dédié me paraît overkill en termes de puissance et tarifs au vu des critères et besoins.
2TB en Cloud Archive reviendrait à 4.9€/mois (calcul ne prenant pas en compte la bande passante d’envoi et de récupération - mais un init de 2TB reviendrait à 20.48€ en one shot) pour le besoin de backup dans un premier temps. Un outil comme rclone permet de synchroniser sur ce genre de filesystem objet avec chiffrement à la volée.
Et si besoin par la suite de compute pour héberger des petits outils ou service, un VPS ou une instance VM (même tarif) reviennent à 5€/mois. Voire 11€/mois si pas suffisant. La VM est plus intéressante car le VPS revient à un engagement tandis que la VM se paye à l’heure. Si le choix se fige dans le temps, une réservation donnera lieu à un discount.
De mon expérience personnelle (que je me suis remémorée récemment, mes deux derniers VPS OVH allant s’arrêter courant septembre), l’hébergement de serveur dédié même en utilisant Proxmox pour répartir en VM spécialisées, ça ne vaut pas le coup versus l’offre Public Cloud à côté. La puissance est sous exploitée pour un prix constant qui ne reflète pas l’usage. Il faut penser son besoin en mode : de quoi il me faut à minima pour démarrer et comment je le fais évoluer, plutôt que prendre une grosse bécane immédiatement dont le coût sera élevé pour un usage réduit.
Pour donner une idée : j’ai auto hébergé Nextcloud + FreshRSS + 2 blogs + encore une paire de trucs mineurs pendant 3 ans sur un VPS avec 4GB de RAM et 2vCPU. Le stockage était réparti entre celui de base du VPS + un disque additionnel + object storage. Ma facture moyenne revenait à peu près au serveur dédié que tu as pris, mais elle a gonflé dans le temps avec les usages. Donc la première année, autant dire que je n’ai payé que 10€/mois.
Le
08/08/2023 à
11h
30
(reply:2146079:Ami-Kuns)
Ca dépend du besoin versus les distributions proposées par l’hébergeur et de tes habitudes.
Les rovers américains sur Mars sont aussi équipés de RTG d’ailleurs, ce qui explique leur longévité et résistance à la couverture de poussière qu’ils peuvent subir.
14084 commentaires
Des victimes de violences conjugales racontent leur cyberharcèlement
18/08/2023
Le 18/08/2023 à 06h 41
Et de manière plus globale, les capacités d’espionnage et de violation de la vie privée sont une véritable horreur vu que n’importe qui peut acheter son petit kit du parfait espion en ligne pour pas cher.
C’est comme les personnes qui collent des balises GPS à leurs mouflets ou encore les locations entre particulier avec des caméras cachées. Ajouté à cela les assistants connectés de toute sorte qui écoutent H24 des conversions et enregistrent les moindres faits et gestes, la surveillance de masse c’est une réalité depuis des années qu’elle soit d’origine étatique, entreprise privée, et cercle de proches.
Bref, monde de merde.
Tesla rattrapé par ses promesses de sécurité et d’autonomie
17/08/2023
Le 18/08/2023 à 06h 35
C’est pas que lié à Tesla, c’est une tendance globale de la radicalisation des discussions sur le Web. Avec l’effet de bulle des médias sociaux et la tendance à s’enfermer entre gens d’accords entre eux, la moindre critique devient une attaque.
Le web “social” c’est rien de plus que la dérive sectaire 2.0.
Si historiquement il y avait des débats houleux entre paroisses (“mac vs pc” etc), ça s’est accentué avec les murs dressés entre idées divergentes.
Le 17/08/2023 à 19h 22
Parfois l’alerte (sans freiner) se déclenche aussi avec les haricots au milieu des voies à 30 pour forcer à ralentir. Genre le truc voit le panneau au milieu il panique.
D’ailleurs c’est une des autres raisons pour lesquelles je ne voudrais pas de Tesla. Ces bagnoles passent leur temps à bipper dans tous les sens au moindre moustique sur le pare brise, quelle plaie !
Vers de beaux jours pour Next INpact ?
14/08/2023
Le 18/08/2023 à 06h 31
J’ai posé la question car ton propos n’était pas une hypothèse pour moi mais une affirmation. Une hypothèse, c’est du conditionnel, en principe.
Le 17/08/2023 à 18h 42
As-tu accès au dossier de cession de l’entreprise ?
Le 17/08/2023 à 17h 12
J’ai des doutes que ce soit légalement possible. Si je ne m’abuse, le don est envoyé à l’association loi 1901 “J’aime l’info” qui fait office d’intermédiaire.
Et dans tous les cas, de mon point de vue, ça n’a aucun sens de vouloir partager les fruits car ici il n’y en a aucun : c’est juste la revente des parts à un autre actionnaire qui devient majoritaire.
Le 15/08/2023 à 08h 39
Je pense qu’il faut d’abord définir “IT” car, au même titre que “numérique”, cela englobe énormément de choses tellement c’est vague. Si l’IT c’est juste des news sur les OS et le hardware, de mon point de vue c’est hautement réducteur.
Typiquement les sujets juridique ont une très haute importance au niveau de l’IT : vie privée, collecte des données, traitement de celle-ci, connaître ses droits en la matière, connaître l’évolution du contexte légal, la risque juridique associé, autant de choses importantes à suivre quand on travaille dans l’IT. Exemple simple : dans les questionnaires d’évaluation que j’envoie à des éditeurs de solution dans le cadre de mon taff, la moitié des questions est d’origine juridique plus que technique.
Exemple : on peut se dire que “où sont stockées les données” est une question technique, mais son fondement pourtant est légal : RGPD. Choisir un produit SaaS qui soit non conforme expose l’entreprise à un risque juridique, c’est typiquement le genre d’erreur que fait un projet focalisé sur la technique.
NXI aurait peut être tout intérêt à présenter l’impact du juridique sur les choix techniques, je pense que ça pourrait être très intéressant.
La justice allemande fait fermer le site de Youtube-dl
16/08/2023
Le 17/08/2023 à 16h 37
Avec Youtube DL l’astuce est de récup la chaîne curl (incluant les headers) et transformer la commande curl en yt-dlp en adaptant le nom des arguments. Ca passe dans 90% des cas me concernant.
Le 17/08/2023 à 16h 35
Pour le droit allemand, je ne sais pas.
Pour le droit français, on paye ce manque à gagner dans la redevance copie privée.
Le 16/08/2023 à 16h 14
Il reste dans les repos de la plupart des distribs majeures.
Edit : rappelons aussi que le repo GitHub de youtube-dl avait aussi été stricken sur notif DMCA avant d’être réatabli.
Entre coupures d’Internet et attaques DDOS, le deuxième trimestre agité de Cloudflare
10/08/2023
Le 17/08/2023 à 05h 23
Pour moi, la limite est la devise du site : “Si tu sais pas, tu demandes. Si tu sais, partage”.
Si Cloudflare est un acteur important de l’IT, même en travaillant dans ce secteur on peut l’ignorer si ce n’est pas notre domaine d’activité.
Le 12/08/2023 à 08h 14
Cloudflare est l’un des plus gros fournisseurs de Content Delivery Network (réseau distribué mondialement pour fournir le contenu au plus proche du client), ainsi que fournisseur de solutions de protection DDoS.
Le 10/08/2023 à 16h 56
Les fortes intempéries aux Pays Bas qui ont eu lieu entre juin et juillet ont aussi eu un impact sur la région West Europe de Microsoft Azure. Fibres sectionnées, latences et pertes de paquets voire indisponibilités de services.
Aux USA, la télévision linéaire passe sous la barre des 50 %, YouTube progresse de 37 %
16/08/2023
Le 17/08/2023 à 05h 19
Pour le coup ce sont les LLM qui viennent bouleverser ce domaine car ils ont une capacité de traduction innée dans les principales langues parlées dans le monde (même s’il faut toujours fait attention car il peut potentiellement réécrire le contenu).
Le 16/08/2023 à 18h 07
Le foutoir de la présentation des émissions c’est le propre des plateformes américaines.
Les plateformes françaises comme MyCanal et OCS sont triées par catégories et thématiques parlantes.
80 % des patrons états-uniens regrettent leurs décisions précipitées de retours au bureau
16/08/2023
Le 16/08/2023 à 16h 22
Ca serait pas mal d’avoir des comparaisons avec la situation en France. De ma fenêtre, je vois qu’un certain équilibre s’est créé malgré les fortes réticences à un moment.
C’est même devenu une des clauses de sélection d’entreprise pour les métiers en tension.
C’est fait : TweetDeck (alias X Pro) nécessite désormais un abonnement payant Blue
16/08/2023
Le 16/08/2023 à 16h 18
jeremy-clarkson-oh-no-anyway-meme.png
Des maisons de disques réclament 412 M$ à archive.org pour des disques 78 tours d’artistes décédés
14/08/2023
Le 16/08/2023 à 16h 11
Dans ce cas vous attendez quoi ?
Le 16/08/2023 à 05h 11
Ah oui, un appel au meurtre arbitraire, voilà qui est aussi une très bonne idée.
Le 15/08/2023 à 18h 22
Ah oui très bonne idée.
Worldcoin sous pression pour sa gestion de la vie privée
14/08/2023
Le 15/08/2023 à 08h 24
Au sens avoir raté une mane spéculative ?
Un tueur en série confondu par ses traces numériques, téléphoniques et bancaires
11/08/2023
Le 14/08/2023 à 11h 23
Partir de sa conclusion ne me semble pas être la meilleure des choses à faire pour constater une situation. Plutôt qu’une image romantisée d’intentions cachées, je pense que la surenchère de lois sécuritaires toutes aussi inapplicables et les unes que les autres est plutôt causée par une absence de compréhension des enjeux et concepts du numérique de la part du législateur couplée à une radicalisation de plus en plus forte du discours politique. Incompréhension certainement appuyée par des études diverses auxquelles personne ne comprend grand chose.
Ce genre de situation se retrouve aussi en entreprise. Les cabinets de conseil qui font des audit et études, restituent celles-ci auprès de décisionnaires, mais qui n’ont compris que le tiers (quand elle a eu une véritable pertinence) alors qu’il y a pourtant de vraies problématiques à traiter.
Le 11/08/2023 à 15h 46
Une démonstration que l’anonymat fantasmé sur les réseaux est un bien un fantasme. Avec toutes les activités du quotidien qui impliquent l’utilisation d’outils et de services numériques, il est illusoire de croire qu’on ne laisse pas de trace.
INRIA : renouvellement de Bruno Sportisse
14/08/2023
Le 14/08/2023 à 08h 43
Comme sur les “avis” et autres “feedback”, les gens satisfaits ou sans opinion ont moins souvent tendance à se plaindre que les mécontents. Entraînant un effet de loupe sur un groupe un peu plus bruyant.
Veilid, un nouveau framework open source d’applications peer-to-peer chiffrées de bout en bout
14/08/2023
Le 14/08/2023 à 08h 31
Je serais bien intéressé de voir une présentation un peu plus vulgarisée pour mieux comprendre cette idée de “application = un node” et comment ça garantie la confidentialité de l’échange. J’ai regardé le PDF de la présentation mais ça m’avait l’air encore trop adressé aux représentants du secteur.
Après, je pense que ce genre d’outil restera assez confidentiel pour les quelques marginaux dans mon genre qui essayent d’être le moins possible dans le “marché de la donnée personnelle” dénoncé dans le dernier paragraphe de l’article.
Par contre, il risque d’être vite accusé de contribuer à des activités illicites au même titre que Tor.
À San Francisco, les voitures autonomes de Cruise et Waymo peuvent opérer comme Lyft et Uber
11/08/2023
Le 14/08/2023 à 07h 56
C’est clair qu’il y en a sur Lille qui tiennent plus de la bordure de trottoir que du ralentisseur. Même à 10km/h t’as l’impression de faire un bond de 20m de haut. Et je te raconte pas en vélo…
C’est d’ailleurs un des côtés moins agréables d’une voiture électrique : les suspensions sont un peu plus fermes, ce genre de ralentisseurs est encore plus tape cul.
Le 13/08/2023 à 18h 18
Le seul véhicule autonome que j’ai connu sur la voie publique en France, c’est l’expérimentation de la navette du campus universitaire de Villeneuve d’Ascq.
Qui avait pour obligation de rouler à 5km/h et s’arrêtait au moindre caillou sur la route.
Par rapport au contexte de cet article où il y a des autorisations bien plus élevées, c’est un tout autre ordre de grandeur.
Le 13/08/2023 à 13h 42
Ce qu’on appelle assez communément “rond point” est en réalité principalement un “carrefour à sens giratoire” dans le code de la route (pour le coup je préfère cette source que Wikipedia qui n’a aucune valeur légale).
Les deux différences importantes entre le rond-point et le carrefour à sens giratoire :
Cela dit, en France, la majorité des ronds points sont des carrefours à sens giratoire, d’où l’abus de langage.
Le 12/08/2023 à 12h 29
Je pense qu’il faut lire les deux décisions, ça doit être lié à la maturité du produit chez l’un ou l’autre j’imagine.
Le 12/08/2023 à 08h 03
Au même titre qu’un taxi, un VTC, et n’importe quel autre véhicule en ville. Donc au final pas de différence en dehors de l’absence de chauffeur.
Le 11/08/2023 à 20h 44
Ca dépend, est-ce que dans le cahier des charges tu inclues le fait que le véhicule est armé de canons, d’un pare buffle, et peut avancer coûte que coûte ? Si oui, ça peut arriver plus vite qu’on ne l’imagine
Le 11/08/2023 à 15h 27
Pour une course purement urbaine, les 50km/h de limitation suffisent largement.
Le véhicule à la demande, c’est aussi la vision que j’avais pour les voitures autonomes. J’imagine que ça se développera dans un prochain temps une fois les restrictions amoindries.
Concernant la France, effectivement, le blinde de ronds-points de toute taille et plus ou moins anarchiques rend un peu plus compliquée l’histoire.
Publicité, tarifs, partage de compte : Disney+ sur les traces de Netflix
11/08/2023
Le 13/08/2023 à 09h 00
Clairement, ça va arriver. Le mode de consommation différent de la TV traditionnelle (même si les nouveautés restent diffusées de manière hebdomadaire) fait qu’on peut regarder les contenus qui nous intéressent et stopper l’abonnement ensuite.
En dehors d’offres groupées comme celle que j’ai avec MyCanal, les gens ne vont clairement pas cumuler les abonnement et jongler entre ceux-ci peut présenter des contraintes.
C’est un modèle qui demande de capter le client dans la durée, mais produire du contenu régulier ça a un coût. Surtout quand il est de qualité, car la prod industrielle de Netflix montre désormais les limites de l’exercice. Cela montre aussi qu’on a été biaisés dans notre historique de visionnage des contenus d’origine américaine. Si à la TV nous avons eu la plupart des gros “hits” qui ont réussi à s’exporter et à durer pour la plupart, les productions de merde nous étaient en quelque sorte masquées car elles n’ont pas quitté leur pays d’origine ou son restées plus confidentielles. Avec ces plateformes qui internationalisent leurs productions, on se rend compte de l’exception que représente les bons contenus.
Le 11/08/2023 à 10h 59
Perso je l’ai en inclus avec MyCanal, donc ça ne changera à priori ps grand chose.
Par contre je trouve que cette plateforme rame ces derniers temps.
Fuite de données personnelles « monumentale » de la police d’Irlande du Nord
11/08/2023
Le 13/08/2023 à 07h 31
Ah, le bon vieil ETL développé dans Excel couplé à son célèbre mode SGBD ?
Je pense que vous auriez tout à y gagner de passer sur un vrai système de gestion d’achats au vu du besoin.
Zoom demande à ses employés de revenir travailler au bureau
11/08/2023
Le 12/08/2023 à 15h 03
Google aussi a toujours du mal à faire revenir sur site ses employés. A côté de ça, j’ai pu découvrir que d’autres entreprises de l’IT sont entièrement en remote. Mais je trouve ça un peu extrême perso.
Ariane 6 : le premier des trois tests de mise à feu encore repoussé
30/08/2023
Le 12/08/2023 à 08h 11
L’étude a commencé en 2009 et le choix d’architecture finalisé en 2014. Le développement des premiers modèles a démarré en 2016 avec un objectif d’un premier tir en 2020.
11 banques condamnées à 500 millions de dollars d’amende pour avoir utilisé WhatsApp et Signal
11/08/2023
Le 11/08/2023 à 15h 33
Maitriser les conversations de ses employés en dehors du cadre de l’entreprise me paraît irréaliste. Et pourtant c’est bien un moyen de fuite d’informations.
Il suffit de prendre un train pour compter le nombre de personnes qui travaillent dedans avec un PC sans filtre anti regards indiscrets ou encore des employés d’une même société discuter ouvertement en public d’un plan business sans avoir conscience qu’un concurrent peut les écouter.
Mais à part de la sensibilisation, il est illusoire de penser pouvoir réguler ça.
LinkedIn détourné pour importuner des femmes
09/08/2023
Le 11/08/2023 à 08h 09
Dans mon cas, à aucun moment je n’ai dit qu’il faut éduquer les hommes. L’éducation qui manque, c’est le respect d’autrui, rien de plus.
Cela peut paraît choquant, mais je ne fais pas de distinction entre les hommes et les femmes au sein de la société. Je préfère une vision équilibrée en droits et respect envers les personnes qui la constitue.
Le 11/08/2023 à 06h 16
Il y a aussi besoin de continuer l’effort sur la prise de plainte par la police. Aujourd’hui il y a encore de trop nombreux cas où les plaintes pour harcèlement ne sont pas prises au sérieux alors que les conséquences peuvent finir dans les faits divers de la presse. L’Etat de droits censé protéger ses citoyens a malheureusement encore des maillons défaillants dans sa chaîne.
Sinon je suis d’accord avec le reste de ton message.
Le 10/08/2023 à 16h 25
Bah on a le droit d’avoir un avis sur la question est de l’exprimer. Si des personnes estiment qu’il est interdit de parler d’un sujet parce qu’on est pas concerné, qu’elles retournent dans leur dictature.
Oui c’était bien le mot “objet” qui était important, pas forcément au sens “petit chose fragile” même si ça reste encore un cliché en vogue, mais au sens “objet à posséder” ou “convoiter”. Si le jeu de la séduction, la mise en valeur de soit-même, etc, sont des choses parfaitement normales peu importe le genre, considérer l’autre comme étant une chose à posséder ou conquérir pour moi ça pue.
En fait, cet aspect éducation sur le regard porté envers les femmes a été évoqué la semaine dernière sur FranceInfo à l’occasion des 20 ans de l’affaire du meurtre de Marie Trintignant. L’aspect intéressant de l’histoire, pour moi, est l’évolution du vocabulaire qui démontre comment la société considérait ce genre d’affaire. Le fait qu’à l’époque c’était évoqué comme un “crime passionnel”. Même si parfois je n’étais pas forcément d’accord avec les propos de l’intervenante, j’ai trouvé cette comparaison de contexte intéressante et j’y vois un complément aux termes que j’ai cité un peu avant : “posséder”, “convoiter”, “conquérir”, autant de termes qui pour moi déshumanisent.
Par contre le gros risque, piège dans lequel je pense que la société est en train de tomber si ce n’est déjà fait, c’est de vouloir basculer dans l’extrême inverse et de faire de la surprotection. Mécaniquement, pour moi, ça va coller l’image de “faiblesse” comme tu l’évoquais. C’est un équilibre difficile à atteindre mais j’ai peur qu’inscrire dans la loi que la femme est plus faible que l’homme et doit être surprotégée n’ait de bonnes répercussions sur sa place dans la société.
Bref, pas facile tout ça, et ça ne pourra pas se résoudre en peu de temps mais bien en de nombreuses générations. L’historienne dans l’article que j’ai mis en lien citait l’article 213 du Code Civil, réécrit en 1971. C’était il y a plus de 50 ans, et on a encore beaucoup de chemin à faire.
Le 10/08/2023 à 11h 42
Éradiquer la notion de désir amoureux n’était pas mon propos. Quand je parlais d’arrêter de vendre la femme comme un objet de désir, c’est justement le déséquilibre qu’il y a entre la sexualisation du corps masculin et féminin.
Un simple exemple : pourquoi un homme peut être torse nu en public tandis qu’une femme non ? Pourquoi un homme ne peut pas porter de tenues traditionnellement considérées comme féminines sans se voir moqué ?
C’est ce genre de déséquilibre qui, pour moi, continue de provoquer des comportements d’un autre temps. Et ça ne changera pas demain, mais seulement après des décennies de changement d’éducation.
Le 09/08/2023 à 16h 35
La root cause restera un problème d’éducation. Aussi longtemps que la femme sera vendue par la société comme un objet de désir à convoiter, ces problèmes persisteront.
OpenAI lance son web crawler, RSF appelle les médias à le bloquer
09/08/2023
Le 10/08/2023 à 11h 30
C’est sur ce détail que OpenAI se fourvoie de mon point de vue d’ailleurs. Leur conception du LLM semble se rapprocher de “oracle qui sait tout” en ne faisant qu’exploiter le contenu du modèle alors que c’est stupide car celui-ci sera toujours à la bourre et dépassé (GitHub Copilot en fait les frais, il fait parfois des propositions datées par rapport à un langage ou framework qui ont évolué).
L’utilisation faite dans Bing est plus pertinente puisque l’outil prend note de la question de l’utilisateur, fait les recherches, puis restitue une synthèse et un résultat tout en donnant ses sources. Mais dans tous les cas, le LLM a besoin d’avoir été entraîné sur des jeux de données pour comprendre le contexte de la requête.
De mon point de vue et expérience avec les LLM, c’est l’approche qui permet d’exploiter leur plein potentiel. N’utiliser que les données du modèle, c’est aussi pertinent qu’un 4x4 en ville pour faire 2km. C’est dommage que le mode Web de ChatGPT ait été retiré (pour les mêmes raisons d’ailleurs…) car il démontrait tout la valeur ajoutée de l’outil.
C’était avant tout un parallèle sur le principe : indexer le contenu sans autorisation explicite (l’indexation du Web reste une action passive, et le robots.txt n’est en rien une loi universelle) est vieux comme le Web lui-même. En refusant/bloquant/monétisant le crawling pour diverses usages (qu’ils soient entraînement IA, recherche scientifique, ou autre y compris à des fins malveillantes), les acteurs poursuivent la tendance de se replier sur soit et forcer du contrôle d’accès. Ce qui fut la force du Web est devenu sa principale hantise : l’accessibilité, l’interopérabilité et l’ouverture.
C’est principalement ça que je dénonce car les conséquences ne peuvent qu’être néfastes en matière d’accès à l’information et respect de la vie privée.
Le 10/08/2023 à 06h 15
A force de ce genre de réaction le Web va être de plus en plus fermé, tout contenu uniquement accessible derrière un compte utilisateur. Je ne pense pas qu’on y gagnera au change.
Au même titre que Google et autres moteurs de recherche ne me fournissent aucune contrepartie pour les contenus que je publie sur mon blog et que rien ne démontre si le robots.txt est vraiment respecté.
On en revient à la remise en cause de la notion d’indexation du Web par les moteurs de recherche.
IA : les modèles de langage d’OpenAI pencheraient à gauche, ceux de Meta plutôt à droite
09/08/2023
Le 09/08/2023 à 16h 27
Le LLM n’a PAS d’opinion. Il écrit une suite de mots cohérente par rapport aux relations qu’il a apprises pour le contexte donné. Il n’a aucune idée du sens des mots qu’il écrit. Si on l’entraîne pour lui apprendre que le ciel est rose à pois verts, il dira que le ciel est rose à pois vert. Ce qui va jouer sur sa production de contenu, c’est le contexte demandé (le prompt) et les paramètres de génération (température, etc).
Pour moi, pointer le LLM du doigt c’est regarder le doigt au lieu de la lune. Le problème n’est pas le résultat mais le processus d’entraînement. Et là dessus, l’opacité des entreprises de l’IA sur les jeux et données d’entraînement a toujours été considérée et dénoncée comme étant un problème.
Par contre, démontrer que ces orientations sont présentes dans le résultat est une bonne chose pour prendre conscience des risques liés à des mauvaises manipulations de ces outils.
Après est-ce qu’il y a un risque de manipulation des populations via ces outils ? Evidemment, au même titre que les médias sociaux le font déjà et il ne m’étonnerait pas que ce site même soit aussi infesté par les fermes à contenus manipulatoires comme dans les commentaires d’autres sites de presse en ligne. Des modèles GPT existent déjà en ce sens tout comme il existe des modèles sans filtres qui produisent du contenu très peu politiquement correct.
Bah je dirais que c’est une évidence puisque les livres étant relatifs à leur époque d’écriture, ils transpireront du contexte politique et social de celle-ci. Si j’entraînais un LLM sur des livres écrits il y a plus d’un siècle, il produirait très certainement des résultats parlant de “nègres” et autres termes qui aujourd’hui ne sont socialement plus tolérés. La différence avec l’humain est qu’il est, en principe, capable de remettre dans son contexte l’écrit par rapport à son époque à soit là où pour le LLM, c’est le contexte avec lequel il apprend à lire.
Là aussi la vraie question est de connaître l’exhaustivité du jeu d’entraînement et les paramètres qui ont été appliqués pour en déduire l’orientation prise.
Loi sur le contrôle parental : une nouvelle mission pour l’ANFR
07/08/2023
Le 08/08/2023 à 16h 44
Bah on s’en fout de ça, les gamins peuvent se tuer en s’électrocutant c’est pas un souci. Du moment qu’ils n’ont pas vu du porno, car là ça serait un véritable scandale d’Etat. Que dis-je, planétaire.
OVHcloud annonce l’acquisition de l’Allemand gridscale, spécialiste du Edge Computing
07/08/2023
Le 08/08/2023 à 16h 35
Le choix d’un tel dédié me paraît overkill en termes de puissance et tarifs au vu des critères et besoins.
2TB en Cloud Archive reviendrait à 4.9€/mois (calcul ne prenant pas en compte la bande passante d’envoi et de récupération - mais un init de 2TB reviendrait à 20.48€ en one shot) pour le besoin de backup dans un premier temps. Un outil comme rclone permet de synchroniser sur ce genre de filesystem objet avec chiffrement à la volée.
Et si besoin par la suite de compute pour héberger des petits outils ou service, un VPS ou une instance VM (même tarif) reviennent à 5€/mois. Voire 11€/mois si pas suffisant. La VM est plus intéressante car le VPS revient à un engagement tandis que la VM se paye à l’heure. Si le choix se fige dans le temps, une réservation donnera lieu à un discount.
De mon expérience personnelle (que je me suis remémorée récemment, mes deux derniers VPS OVH allant s’arrêter courant septembre), l’hébergement de serveur dédié même en utilisant Proxmox pour répartir en VM spécialisées, ça ne vaut pas le coup versus l’offre Public Cloud à côté. La puissance est sous exploitée pour un prix constant qui ne reflète pas l’usage. Il faut penser son besoin en mode : de quoi il me faut à minima pour démarrer et comment je le fais évoluer, plutôt que prendre une grosse bécane immédiatement dont le coût sera élevé pour un usage réduit.
Pour donner une idée : j’ai auto hébergé Nextcloud + FreshRSS + 2 blogs + encore une paire de trucs mineurs pendant 3 ans sur un VPS avec 4GB de RAM et 2vCPU. Le stockage était réparti entre celui de base du VPS + un disque additionnel + object storage. Ma facture moyenne revenait à peu près au serveur dédié que tu as pris, mais elle a gonflé dans le temps avec les usages. Donc la première année, autant dire que je n’ai payé que 10€/mois.
Le 08/08/2023 à 11h 30
Ca dépend du besoin versus les distributions proposées par l’hébergeur et de tes habitudes.
Comment les sondes Voyager communiquent avec la Terre à 20 milliards de km
07/08/2023
Le 08/08/2023 à 05h 24
Les rovers américains sur Mars sont aussi équipés de RTG d’ailleurs, ce qui explique leur longévité et résistance à la couverture de poussière qu’ils peuvent subir.