Windows Recall : une surveillance locale et isolée, mais…
Local recall
Mise à jour du 24 mai 2024 à 10h55 : Microsoft a mis à jour sa fiche technique sur Recall. La compatibilité avec les navigateurs ne s'étendait qu'à ceux basés sur Chromium. Dans la nouvelle version, Firefox est maintenant mentionné comme pris en charge.
Le 24 mai 2024 à 08h06
7 min
IA et algorithmes
IA
Recall est une fonction de Windows 11 présentée avec les PC Copilot+. Chargée d’enregistrer tout ce qui se passe sur l’ordinateur pour le régurgiter en cas de recherche, la fonction pose de nombreuses questions, notamment sur la vie privée. Microsoft a apporté plusieurs éclairages.
Lundi, Microsoft a officialisé les PC Copilot+. Une nouvelle génération de machines, toutes équipées de Snapdragon X Plus ou Elite, avec 16 ou 32 Go de RAM et au moins 256 Go de stockage (SSD PCIe 4.0). Ces ordinateurs ont tous Windows 11 (pour Arm) et des fonctions dédiées, conçues pour exploiter le NPU des SoC de Qualcomm, dont la puissance indiquée est de 45 TOPS (on ne connait pas la précision).
Parmi les fonctions présentées, Recall est celle qui a clairement retenu le plus l’attention. Elle a pour mission de surveiller (difficile de le dire autrement) tout ce qui se passe sur l’ordinateur. Elle prend régulièrement des clichés de l’écran pour en analyser le contenu. Dès lors, en passant par la recherche, on peut lancer une requête en langage naturel pour retrouver une information, un document sur lequel on a travaillé, une vidéo ou à peu près n’importe quoi d’autre.
Certaines informations avaient été données (et indiquées dans notre article sur la conférence Build 2024), mais on en sait désormais plus sur le fonctionnement, ses limites et surtout ses contrôles de sécurité.
Un fonctionnement local
Lors de la Build, Microsoft a précisé quelques détails sur le fonctionnement. Ils sont désormais repris dans une fiche technique.
On sait ainsi que Recall n’est censé fonctionner que localement. En d’autres termes, il n’y a pas communication avec les serveurs, les informations étant enregistrées sur le stockage local. Microsoft affirme qu’aucune information n’est jamais envoyée à ses serveurs. L’entreprise ajoute qu’elle n’a aucune visibilité sur les données et ne peut pas s’en servir. Quand Recall est occupé à faire des captures, une icône apparaît à droite de la barre des tâches, dans la zone de notification (systray).
Il n’est pas précisé ce qui se passera en cas de remplacement de la machine ou de réinstallation complète de Windows. L’historique de Recall prend au moins 25 Go et jusqu’à 150 Go pour un disque de 1 To. Ce stockage doit permettre de garder en mémoire l’activité des trois derniers mois. On imagine mal une synchronisation avec OneDrive ou un autre service en ligne. Il est donc probable que les informations soient perdues en cas de gros problème.
Précision importante : le stockage des informations se fait par compte utilisateur. Un compte ne peut pas accéder aux informations d’un autre, à moins d’avoir explicitement les droits pour le faire, comme avec le reste des informations.
L’ensemble est basé sur plusieurs SLM (petits modèles de langage) exécutés localement. On ne connait pas (encore ?) le détail de ces modèles, si ce n’est qu’on y retrouve au moins un représentant de la famille Phi-3. Microsoft a présenté plusieurs nouveaux modèles pendant sa conférence Build, ainsi que l’API Phi Silica pour les exploiter sous Windows 11.
La question de la consommation entrainée par Recall n’est pas abordée.
Ce que voit Recall
Il est plus simple de dire que Recall voit tout, en dehors de quelques exceptions. Toute information visible à l’écran peut faire l’objet d’une analyse, à moins qu’il ne s’agisse d’un flux vidéo protégé par un DRM. Auquel cas, Windows signalera à Recall qu’il s’agit d’un contenu protégé et la capture n’intègrera pas l’image du flux.
Si l’on part du principe que Recall enregistre tout et peut retrouver n’importe quel type d’information, la question de la vie privée est prégnante. Microsoft précise que sa fonction ne modère pas les contenus. Si vous avez tapé un mot de passe dans un champ non masqué, celui-ci apparaîtra dans les captures.
En mode navigation privée, Recall ne récolte pas d’informations et ne prend pas de capture des pages web. Dans la note technique, il est précisé qu'Edge, Firefox et l'ensemble des navigateurs basés sur Chromium sont compatibles.
Du contrôle et des filtres
Venons-en à la partie qui nous intéresse. Microsoft indique qu’au premier lancement d’un PC Copilot+, l’utilisateur est informé de l’existence de Recall et se voit proposer d’aller en voir les options. En cas d’acceptation, Paramètres s’ouvre sur une nouvelle section.
Microsoft précise que l’on peut arrêter l’enregistrement des captures à tout moment. Il s’agit du premier réglage sur la capture. Auquel cas, Recall s’arrête et l’utilisateur – a priori – n’en entend plus parler. On parle donc bien d'un opt-out.
Pour les personnes intéressées par la fonction, il est possible d’en moduler le fonctionnement grâce aux filtres. Ces derniers permettent d’interdire à Recall les captures dans un certain contexte, des applications spécifiques ou des sites web. Là encore, l'ensemble des navigateurs paraissent compatibles. Dans la version précédente de la note, Microsoft n'évoquait que ceux basés sur Chromium.
Les filtres fonctionnent comme une liste noire. On aurait aimé la possibilité de créer une liste blanche, pour pointer au contraire les applications pour lesquelles on souhaite spécifiquement que Recall fonctionne, éliminant tout le reste.
Microsoft ajoute que les entreprises pourront également gérer la fonction via une politique de groupe.
Le grand livre des secrets
Recall n’est plus si mystérieux, son fonctionnement étant globalement expliqué. Pour quiconque cherche un outil – apparemment puissant – de recherche d’informations pour s’y retrouver dans la masse de ses activités, la fonction pourrait être le Graal.
Son avantage tient dans les captures. Comme le montrent les exemples fournis par Microsoft, elles ont deux gros avantages : elles donnent du contexte aux résultats de la recherche et sont indépendantes du type de stockage utilisé. Ouvrir des documents depuis le cloud n’empêchera donc pas d’en référencer les informations, par exemple quand on se sert de OneDrive en mode Fichiers à la demande (les données ne sont téléchargées que lorsqu’on en a besoin).
Mais en dépit des garde-fous mis en place par Microsoft, la question de la vie privée reste au premier plan. Que les données ne quittent jamais l’ordinateur et soient indépendantes pour chaque compte constitue plus une approche élémentaire qu’une réelle réponse. Dans l’absolu, on reste face à une fonction capable de régurgiter toute activité d’une personne, surtout si les réglages n’ont pas été changés.
On peut littéralement plonger dans la vie d’une personne. Et c’est d’autant plus simple que – magie de l’intelligence artificielle générative – l’on peut interroger cette base de données en langage naturel. Ce qui accroit la nécessité de verrouiller sa session dès que l’on quitte son ordinateur. Dans le cadre d’une machine partagée, par exemple dans une famille, on trouve souvent un unique compte pour toutes les opérations. Là aussi, ce fonctionnement peut poser problème.
Finalement, la question de la sécurité ne pointe pas tant vers les mesures techniques mises en place. Microsoft semble avoir réfléchi au sujet. Elle pointe plutôt sur l’existence même de cette masse d’informations, qui transformera tout accès physique par un tiers en bombe potentielle pour la vie privée.
Windows Recall : une surveillance locale et isolée, mais…
-
Un fonctionnement local
-
Ce que voit Recall
-
Du contrôle et des filtres
-
Le grand livre des secrets
Commentaires (79)
Le 24/05/2024 à 08h20
Modifié le 24/05/2024 à 09h28
Le 24/05/2024 à 08h38
Les entreprises vont accepter de réserver entre 50 et 150 Go par utilisateurs pour ceux qui travaillent sur des serveurs partagés ?
Mais même en dehors de cela, les questions sur la vie privée sont tellement innombrables surtout sur les PC persos ou il n'y a qu'un compte partagé par tout le monde dans une famille.
Le tout en opt out: c'est absolument n'importe quoi.
Le 24/05/2024 à 08h50
Le gros soucis sur la vie privée en milieu pro, c'est le risque qu'un employeur "visionne" cet historique avec des droits admins, et qu'il accède à des informations personnelles. Autre soucis au sein d'une famille : l'intimité numérique des uns et des autres.
Le 24/05/2024 à 09h24
Le 24/05/2024 à 09h52
Mais l'autre grande majorité des utilisateurs de Windows ne savent pas cela et c'est envers eux que ces soucis de respect de vie privée sont les plus prégnants (et ce dans le domaine du perso comme du pro, même si c'est sensé être moindre côté pro... si DSI existante).
Dans de tels contextes il faut voir plus large qu'au travers de notre seule lorgnette.
Modifié le 24/05/2024 à 11h44
Bref, ceux qui ont un PC au boulot n'ont en fait pas vraiment d'excuse pour ignorer ce qu'est un compte... et ca concerne vraiment pas mal de monde. Donc sans parler des lecteurs de Next, je maintiens que c'est aussi de la flemmingite (et des exemples dans l'entourage, ca ne manque pas, avec des conséquences désastreuses sur un ado qui a des droits admins sur sa machine parce que "on n'a pas pris le temps à la réception de son PC portable" de faire un compte pour nous en tant que parents, et un autre pour lui)
Le 24/05/2024 à 13h00
D'ailleurs tu nuances tout à coup ton propos en disant "je maintiens que c'est AUSSI de la flemmingite" et plus que ça en est. Il y a une forte nuance entre les deux qui montre que, inconsciemment, tu te fais peut-être avoir par un biais de confirmation dans ta réflexion ;)
Le 24/05/2024 à 15h18
Le 25/05/2024 à 00h32
D’autant plus que dans le cadre d’ une appli sur mobile, c’est souvent plus facile et plus rapide qu’avec la page Web du même site (et cela même sur un PC) car l’ergonomie a été maximisée.
Le 24/05/2024 à 10h26
- tout en local
- serveurs partagés
Le 24/05/2024 à 11h46
Le 24/05/2024 à 11h55
Je n'ai pas vu de mention que cette feature serait dispo sur du virtualisé; actuellement, le discours est même le contraire vu que Microsoft parle d'une gamme de machines physique qui sera certifiée spécifiquement pour cet usage.
Le 24/05/2024 à 10h45
Chez Boulanger :
- DNS par défaut : 8.8.8.8. Sauf que ça n'arrive pas chez Google, mais chez le fournisseur / sous traitant pour le réseau et l'accès internet (SFR / Completel). Liste facile des sites visités
- bossant sous Linux, j'ai eu la surprise de voir mon Firefox m'avertir d'un problème de sécurité en allant chez www.google.com. Et pour cause : le certificat SSL ne provenait pas de Google, mais de HTM (le groupe qui inclus Boulanger, appelé United b maintenant). Et d'une, je suppose que sur une machine windows 100% IT, faite pour l'employé lambda pour Word+Excel, ce genre de certificat peut être rendu valide. Et de deux, si c'est pas pour faire du MITM, faudra qu'on m'explique. Et en parlant d'explication, la sécu IT aurait répondu : "ah, c'est une erreur de configuration d'un serveur". Bah voyons, évidemment, chuicon, moi aussi ça m'arrive tout le temps de créer des faux certificats sans le faire exprès
Du coup, ce Recall, ça ne va pas apporter grand chose à la surveillance des employés, à part de la facilité. Ce sera surtout les utilisateurs de cette surveillance qui vont changer : plus besoin d'être top level sur des outils pointus, très techniques. Là, ça devient accessible aux RH, petits chefs, grands chefs ...
Le 24/05/2024 à 11h14
Le 25/05/2024 à 09h23
Les entreprises ont une obligation légale de conserver les logs de connexions aux sites web depuis leur LAN. En cas d'enquête de police elles doivent pouvoir fournir l'identité de la personne qui s'est connectée sur tel site à telle date.
Le proxy qui dépiaute le chiffrement est également indispensable pour faire de la détection de menaces, type virus (mais pas que).
Modifié le 24/05/2024 à 14h05
Le 24/05/2024 à 14h32
L'historique ne fait pas tout.
Le 24/05/2024 à 14h47
Ou, comme je pense l'immense majorité des utilisateurs qui partagent un PC familial mais des addresses mails distinctes, ils utilisent des comptes utilisateur différents.
Le 24/05/2024 à 18h21
Le 26/05/2024 à 10h19
Le 24/05/2024 à 08h54
Toute requête "recall" devrait être loguée/signalée à l'utilisateur.
Et quand on se dit qu'on va avoir cela sur nos ordis, ça en dit long sur les possibilités existantes à distance...
Le 24/05/2024 à 10h29
Une requête recall se faisait à l'écran j'imagine que recall l'archive aussi qu'on peut donc facilement lui demande de ressortir les X dernières demandes recall sans trop de problème. À moins de réussir à faire sa requête en moins de 5 sec entre 2 screenshot toutes les requêtes devraient aussi être archivées...
Le 24/05/2024 à 13h53
Le 24/05/2024 à 09h12
Le 24/05/2024 à 09h23
Le 24/05/2024 à 09h40
Le 24/05/2024 à 14h08
Le 24/05/2024 à 22h25
Le 25/05/2024 à 19h14
Le 27/05/2024 à 10h38
Modifié le 26/05/2024 à 10h22
Le 27/05/2024 à 13h49
Le 27/05/2024 à 14h01
Modifié le 27/05/2024 à 17h52
Afficher des mots de passe en clair ou des clés d'activation de produit et ça finit dans Recall...
Le 02/06/2024 à 11h52
Le 24/05/2024 à 10h27
Etape 2 : une mise à jour furtive installe Copilot ++ chez tout le monde sans prévenir
Etape 3 : oups les devs ont "oublié" de vous dire que finalement on envoie vos infos sur les serveurs pour "améliorer le service", mais rassurez vous, c'est "chiffré"
Etape 4: des pirates découvrent que la clé de chiffrage était codée en dur, et que potentiellement tout à fuité dans la nature...
Le 24/05/2024 à 10h49
PS : Oui, ça n'est pas [encore] pour tout le monde.
Modifié le 24/05/2024 à 10h52
Edit : xlp m'a grillé.
Modifié le 24/05/2024 à 10h45
Le 24/05/2024 à 10h53
Quand j'ai lu le titre de l'article, j'ai cru que ça parlait d'aider la police...
Le 24/05/2024 à 11h11
Le 24/05/2024 à 10h53
Le 24/05/2024 à 12h48
Le 24/05/2024 à 18h34
Le 25/05/2024 à 09h13
Le 24/05/2024 à 10h59
Modifié le 24/05/2024 à 13h12
2e chose. Si vraiment Microsoft laisse cela en local. Rien ne dit qu'ils ne vont pas changer à l'avenir. Que cela soit volontairement avec une future maj, ou un bug (Un bug qui les arrange bien)
Le 24/05/2024 à 13h17
Mais cette fonction existe uniquement sur les PC équipés de TPU pour un traitement local par l'IA. Les données sont stockées en local, ça prend même pas mal de place !
Je me demande vraiment pourquoi ils changeraient d'avis et enverraient les données chez eux (coût en bande passante) puis les traiteraient sur leurs serveurs (coûts des serveurs supplémentaires, coût de l'énergie alors que là, c'est l'utilisateur qui a tout payé : puce et électricité).
Mais merci à toi de m'avoir fait sourire.
Pour ta gouverne, si ce traitement était délocalisé, ça se verrait sur le trafic réseau.
Modifié le 24/05/2024 à 13h44
Moi aussi cela me fait sourire de voir des gens croire toujours les belles paroles d'une boîte qui n'a pas loin de 50 ans et qui continue à faire toujours ce qui l'arrange. Et les gens qui approuvent à chaque fois. ^^
Le 24/05/2024 à 13h41
Sur le fond, tu n'as répondu à aucun de mes arguments, probablement parce que tu n'as rien de réfléchi à y opposer.
Je ne crois pas les belles paroles d'une boîte, je réfléchis et je constate que faire autrement que ce qu'ils disent seraient idiot et coûteux pour eux.
Et pour ta gouverne, personnellement, je ne suis pas un idiot utile comme tu le dis : je n'ai eu qu'un PC sous Windows rapidement passé sous Linux il y a 25 ans et je n'ai jamais plus utilisé Windows chez moi depuis. Et toi ?
Modifié le 24/05/2024 à 13h50
Libre a toi de croire Microsoft, Mais je partageais mon humble avis c'est tout. Et vu ton comportement, cela me donne pas l'envie de détailler.
Cordialement
Le 24/05/2024 à 20h06
Le 25/05/2024 à 00h40
Alors ça sera assez dur de pouvoir dissimuler 25GB-50GB de trafic qui transite sur le réseau pendant une certaine période d'analyse...
Modifié le 25/05/2024 à 11h45
Ensuite je doute pas qu'il y ait des spécialistes qui vont suivre cela. Mais voyant la quantité de données déjà envoyer par défaut à Microsoft. J'ai un peu peur que cela serait comme trouver aiguille dans une botte de foin.
Le 24/05/2024 à 15h24
Je suis certain que les clients de ce type de machine sont de fins analystes de trafic réseau.
Le 24/05/2024 à 16h20
Modifié le 27/05/2024 à 00h12
Je pense que beaucoup beaucoup de monde va scruter tout ça à la loupe, notamment gouvernements & ONG... et que Microsoft à intérêt a être très très propre sur soi.
Après, comme disait AngelBlue, on ne pourrait envoyer que des rapports d'analyse (tout petits), qui ne se voient pas trop. Soit, mais Microsoft aura intérêt à faire de l'obfuscation de trafic réseau "à la pointe" pour bien tout masquer.
Et si vraiment ils essayaient de le faire et se faisaient chopper ensuite, ayant affirmé publiquement "tout est en local, rien n'est envoyé sur des serveurs", là le retour de flammes serait juste terrible et catastrophique avec de nombreux procès à la clé et cela dans énormément de pays : "Microsoft espionne TOUT ce que vous faites et cela toutes les 5min" et maintenant... c'est Linux qui va exploser sa part de marché...
"Name & Shame" on dit... Et la quasi-totalité des boites qui ont connu des énormes scandales, en général, c'est fatal (Enron, Theranos, Le Credit Lyonnais, etc... la liste est longue).
Le risque ici est trop énorme pour mentir sur un sujet tellement ULTRA MEGA sensible comme celui-ci et les dangers potentiels énormes de la fonctionnalité.
Parce que là, on pourrait dire qu'avec une fonction pareille, Microsoft serait à 2 doigts de pouvoir basculer (potentiellement) dans le monde "merveilleux" de 1984 (v2.0).
Comme la blague d'y il a quelques années:
Barack Obama:
"Hi Tim, la NSA me pète le cul trop grave pour qu'on puisse renforcer la surveillance des citoyens US mais aussi de tous les habitants sur cette planète au passage, une idée pour m'aider là?"
Tim Cook:
"pas de problème, on a un truc dans les cartons qui s'appelle le TouchID, les utilisateurs d'iPhone et d'iPad seront fortement incités à déverrouiller leurs appareils avec leurs empreintes digitales, empreintes qui auront été préalablement scannées et enregistrées dans une puce électronique "speciale" de l'appareil - Secure Enclave - mais qu'on surnomme ici en interne de manière humoristique "The Safe for Privacy" (Le Coffre-Fort pour la vie privée")" (rires)
Barack Obama:
"Woow, so so cool, let's do it and YES WE CAN IT DO ! Thank You so much Tim !"
.
Modifié le 28/05/2024 à 14h18
Ça serait quand même une sacrée manne financière pour une entreprise à but lucratif. Surtout quand on voit les derniers "bugs" de Windows 11 qui affichent des pubs dans le menu démarrer, les investissement colossaux qu'ils font dans les IAs, et le coût des données massives d'entrainement (Reddit, SO, X, etc.)
Le 24/05/2024 à 15h16
"Il est plus simple de dire que Recall voit tout, en dehors de quelques exceptions."
Que se passe-t-il lorsque le support de stockage est plein ?
Le 24/05/2024 à 15h47
Le 24/05/2024 à 15h57
Le 24/05/2024 à 16h33
Le 24/05/2024 à 17h10
Je viens de faire une copie d'écran elle fait 478 Ko.
Parton d'un SSD de 500 Go, Microsoft s'en réserve 50 Go pour cette fonction, ce qui ferait 104600 copies d'écran pour les 3 mois de stockage. On est bien 5 fois en dessous de tes calculs même si on reste dans le même ordre de grandeur.
En plus, et je pense que cet argument est plus fort : pour retrouver vite une information dans 50 Go, il faut qu'elle soit déjà analysée et qu'elle soit un minimum organisée, ce qui plaide pour ne stocker que le résultat de l'analyse des copies d'écran par l'IA.
Remarque : Comme on est quand même dans le même ordre de grandeur que ton calcul (5 fois moins seulement), ta remarque sur le stockage qui peut nuire aux SSD. Je n'ai pas en tête les spec actuelles des SSD pour voir si tu as raison ou pas pour l'usure.
Le 24/05/2024 à 18h20
Après, pour le poids des fichiers, ça peut varier du tout au tout. J'ai fait une capture d'écran d'une partie de cet article (587 Ko), de GIMP avec une image ouverte (1.4 Mo) puis de Google Maps (4.2 Mo). Après, à voir s'il est un minimum intelligent et qu'il arrive à comprendre quand l'utilisateur s'éternise sur une même activité, qui ne nécessite donc pas de faire d'innombrables captures.
Le 24/05/2024 à 20h00
Modifié le 25/05/2024 à 17h01
"Au temps pour moi"
=>
"Autant pour moi"
Le 25/05/2024 à 17h33
Modifié le 25/05/2024 à 18h17
Bien ouvert tes 3 liens
Merci pour la correction
Pour me rattraper (juste un peu), un copié collé du dernier paragraphe d'un de tes liens :
"En outre, c’est bien « autant » qui compose le titre du film Autant en emporte le vent avec l’inoubliable Scarlett O’Hara et « ô temps » (suspends ton vol), tiré du célèbre poème de Lamartine !"
Le 25/05/2024 à 18h59
Okki t'a donné assez de liens.
Modifié le 26/05/2024 à 23h03
(Marcel Philippot dans la série Palace, j'adorais , le Samedi soir sur Antenne 2 , et non France 2 )
Ou bien sinon: "Fais pas trop le malin Mr. Fred car on se retrouvera tôt ou tard" (avec un gros de vilain méchant). Bon ça c'est de moi ici, pas top.
Modifié le 27/05/2024 à 00h16
Aurais tu dit par exemple "On est quand même quasiment sur un ordre de grandeur inférieur que ton calcul (x8 fois moins seulement)" ?
Je reconnais bien ici la patte d'une formation d'ingénieur... Ai-je tord ?
Je taquine
.
Le 25/05/2024 à 09h18
Modifié le 25/05/2024 à 18h21
Réussir à tuer un SSD simplement en dépassant le TBW (Total Bytes Written), c’est extrêmement difficile voir Mission Impossible.
Tom’s Hardware FR avait essayé il y a quelques années… avec un script qui générait des centaines de GB/ jour en écriture. Et bien au bout de plusieurs mois, même si des cellules étaient reconnues comme ‘totalement HS » par le contrôleur, lui, le SSD restait toujours opérationnel (notamment grâce à l’overprovisionning).
Bref, pour tuer un SSD avec simplement des copies d’écran, va falloir y aller fort…
Note: le TBW est un multiple de la capacité du SSD.
Le 24/05/2024 à 18h06
La balance bénéfices / risques me parait complètement aberrante pour l'utilisateur ...
Modifié le 24/05/2024 à 18h52
Ajouté au fait que MS pousse depuis des années pour que chaque session soit liée à un compte Microsoft alors je trouve que l’ensemble est cohérent.
Le 25/05/2024 à 14h41
Le 25/05/2024 à 16h49
Le 26/05/2024 à 10h29