votre avatar Abonné

jobpilot

est avec nous depuis le 25 avril 2017 ❤️

10 commentaires

Le 28/10/2024 à 20h 59

Il n'y a aucune violation de droits d'auteur dans l'entraînement des intelligences artificielles avec des documents protégés. Affirmer le contraire démontre une incompréhension fondamentale de ce qu'est une IA, particulièrement dans le cas des modèles de langage (LLM).

Le processus d'apprentissage d'une IA est comparable à celui d'un être humain. Personne ne contesterait le fait que des enfants apprennent à lire dans des livres ou étudient les mathématiques avec des manuels achetés dans le commerce.

Il est important de comprendre que le modèle ne stocke pas les données d'origine. Ce qui est conservé, ce sont uniquement les paramètres des réseaux de neurones après l'apprentissage, communément appelés "poids". Aucune donnée brute provenant des ensembles d'entraînement n'est conservée.

Pour faire une analogie, c'est similaire à notre propre apprentissage : lorsque nous écrivons, nous ne nous souvenons plus précisément dans quels livres nous avons appris chaque mot, ni même toutes les règles grammaticales que nous appliquons pourtant correctement.

En conclusion, il ne s'agit pas de pillage mais simplement d'une utilisation légitime des ressources à des fins d'apprentissage.

Cordialement,

Le 26/09/2024 à 14h 49

Non disponibles en Europe ? Les petits modèles sont téléchargeables pour Ollama, tandis que les grands vont arriver. Sinon, ils sont disponibles gratuitement chez Groq ou en payant chez Togther AI (le 90B coûte 1,2$ par million de tokens, contre 0,88$ par million de tokens pour le 3,1B).

Après la vision, ça marche bien (j'utilise Open Web UI sur mon serveur et diverses API pour l'inférence et Ollama pour les petits modèles).

Le 29/04/2024 à 17h 17

Le problème pour OpenAI, c'est que le RGPD se moque de la façon dont est réalisé le traitement. Les points soulevés par noyb sont pertinents par rapport au RGPD.

Et que le problème ne puisse pas être résolu n'est pas non plus à prendre en considération par les CNIL. Dans ce cas, il faut interdire ces générateurs de baratin qui ne traitent pas correctement les données personnelles de personnes réelles puisqu'ils les inventent (en plus même s'ils ont la donnée, ils peuvent inventer parce que pour eux, cette donnée ne veut rien dire et qu'une autre donnée peut être statistiquement satisfaisante).
En plus, même si les données étaient exactes, de quel droit ce système traiterait des données personnelles me concernant que j'ai rendu disponible par exemple sur LinkedIn dans un but précis et avec le maximum de restrictions de partage ? Et pourquoi ne m'aurait-il pas prévenu du traitement de mes données personnelles au plus tard un mois après qu'il les a traitées ou dès qu'elles ont été transmises à quelqu'un ? (article 14 point 3 du RGPD)

Et je serais pour les interdire dans leur forme actuelle trop généraliste et ouverte. Que l'on puisse les faire générer des textes de fiction, aucun problème. Qu'on puisse leur faire générer des informations qui semblent vraies alors que l'utilisateur moyen n'a aucune idée (et n'en aura aucune avant longtemps) de comment le système fonctionne, c'est un problème pour les données personnelles mais mais aussi à cause de la confiance qu'ont les utilisateurs en ces réponses.

Et on verra apparaître des utilisations plus utiles de ces technologies qui ne sont pas forcément néfastes contrairement à ce que l'on essaie trop de nous faire croire ici.

Le RGPD s'applique principalement aux données personnelles stockées. Toutefois, il est crucial de comprendre que les modèles de langage comme ChatGPT ne conservent pas de données personnelles de manière traditionnelle. Au lieu de cela, ils apprennent de vastes ensembles de données lors de leur phase d'entraînement pour développer une compréhension générale du langage. Ils ne mémorisent pas des informations spécifiques à un utilisateur après avoir traité une requête.

Ces modèles utilisent des réseaux de neurones artificiels, où chaque neurone artificiel est une fonction mathématique simulant le comportement d'un neurone biologique. Ils génèrent des réponses basées sur ce qu'ils ont appris, ce qui est comparable, de façon très simplifiée, à l'apprentissage humain.

Pour supprimer spécifiquement les données d'une personne du modèle appris par ChatGPT, OpenAI devrait réinitialiser et réentraîner l'ensemble des réseaux de neurones, ce qui entraînerait des coûts considérables.

Puisque nous ne pouvons pas modifier les lois mathématiques, adapter le RGPD aux réalités technologiques actuelles semble approprié. Ce n'est pas dramatique ; au contraire, les lois doivent évoluer pour rester en phase avec les développements de notre société.

Enfin, OpenAI souligne clairement dans l'interface utilisateur de ChatGPT : « ChatGPT peut faire des erreurs. Il est recommandé de vérifier les informations importantes. » Cette mention rappelle que, tout comme le cerveau humain, les modèles de langage peuvent être sujets à des erreurs dues aux biais présents dans les données avec lesquelles ils ont été entraînés.

Le 21/11/2023 à 07h 29

Bonjour
félicitation pour votre boulot, bon je préférais l'ancien (bah avant je préférais aussi l'ancien lol) mais c'est une histoire d'habitude.
Vivement le thème sombre parce que tout ce blanc ça me crame les yeux lol

Le 30/03/2023 à 09h 28

En fait, de plus en plus de serveurs SMTP utilisent STARTTLS lorsqu’ils se connectent entre eux pour la livraison des emails. Par conséquent, si les administrateurs des serveurs SMTP ont fait leur travail correctement, l’intégralité du trafic est chiffré, y compris les métadonnées des emails.

Le 05/05/2022 à 14h 13

Joyeux anniversaire :-) et longue vie à next impact

Le 03/03/2022 à 13h 00

Parce que la police française est sur son territoire et elle dispose d’un réseau pour ses communications (un peux comme les réseaux téléphonique civil).
La l’armée russe est l’envahisseuse et ne dispose pas de réseau de communication pour ces échanges.
Pour les bombardier russe en onde courte, c’est parce qu’ils sont hors de porté en vhf de leurs contrôleurs. Jusqu’il y a quelque année, le contrôle aérien sur l’atlantique nord se faisait en onde courte.
Après les radios analogique c’est robuste même dans de très mauvaise condition de liaison (en limite de portée) en analogique noyé dans le bruit de fond une oreille humaine arrivera à comprendre le message tandis que en numérique à la moindre perturbation ça coupe et le message n’est pas compréhensible.



Après ça me laisse dubitatif que même en 2022 les russes n’est pas de radio à étalement de spectre par saut de fréquence. Finalement tant mieux quelque part.

Le 14/12/2018 à 08h 49

Adoptez le système Suisse de démocratie directe.



Parce que ici, prenons l’exemple de la taxe sur l’essence.

A l’annonce de l’adoption de cette loi, un comité aurait lancé un référendum dit facultatif (en Suisse le référendum est obligatoire que si on touche à la constitution).

Ils auraient eu 3 mois pour récolter 50000 signatures de personnes ayant le droit de vote.

Si les 50000 signatures sont atteinte (après vérification par la chancellerie fédérale)(souvent y en a plus) on dit que le référendum à abouti.

Et le référendum passe en votation.

Si la majorité l’accepte la loi passe dans ce cas l’essence augmente, si la majorité rejette la loi ne passe pas et dans ce cas l’essence n’augmenterait pas.



L’avantage le peuple à son mot à dire, pas besoin d’aller se les geler sur un rond-point pour être entendu.



Source:https://www.ch.ch/fr/democratie/droits-politiques/referendum/le-referendum-oblig…

Le 18/07/2018 à 08h 29

Ici c’est simple,

l’internet des objets n’a pas accès à internet.

J’ai un routeur (pfense) et je bloque tout ce qui vient de Chine (sauf les ordinateurs et smartphones).

Si le bidule à besoin d’un cloud pour fonctionner je passe mon tour.

Bon j’utilise essentiellement des caméras chinoise et des esp8266.

Pour entrer dans mon réseau depuis l’extérieur  c’est via openvpn (ça fonctionne bien sur un smartphone)

Même mon zoneminder n’est pas accessible sans vpn.



Par contre c’est fou ce que les caméras chinoise peuvent essayer de joindre la chine lol

Le 23/08/2017 à 14h 10

Au boulot un lenovo S30 (E5-1650 v2, 32Gb ramd + SSD) avec 4 écrans  et deux cartes graphiques Quandro 2000

ça tourne sous xubuntu et j’y fait tourner des vm sous différents linux et windows (je suis sysadmin).



A la maison un petit zotac (un i5) avec 4go de ram sous ubuntu.



Autrement en nomade ou au fond du jardin un vieux macbook air 2013 sous ubuntu.



Je ne joue pas (sauf au sudoku)