Connexion Premium

Des informaticiens créent Jmail, une boîte mail remplie des correspondances de J. Epstein

Comment simplifier l’exploration du jeu de correspondances de Jeffrey Epstein rendues publiques par la United States House Committee on Oversight sous la forme de PDF difficiles à trier ?

À cette question, les informaticiens Riley Walz et Luke Igel ont proposé une réponse simple : permettre aux internautes de naviguer dans ces informations en les présentant sous la forme d’une boîte mail, en beaucoup de points similaires au service de Google qu’1,8 milliard de personnes utilisent chaque mois.

Capture d’écran de la correspondance de Jeffrey Esptein marquée d’une étoile par les internautes sur Jmail.

C’est ainsi qu’est née Jmail, la fausse boîte mail de Jeffrey Epstein, riche de plus de 2 000 messages, dans laquelle tout internaute peut marquer un message comme important (avec une étoile).

La messagerie permet aussi d’identifier des contacts réguliers, parmi lesquels l’ex-conseiller de Donald Trump Steve Bannon, l’associée d’Epstein désormais derrière les barreaux Ghislaine Maxwell, l’ancien directeur du laboratoire de recherche dédié aux nouvelles technologies MIT Media Lab Joichi Ito, ou encore le linguiste Noam Chomsky.

Pour produire cet outil, Riley Walz et Luke Igel ont notamment recouru au LLM de Google Gemini, avec lequel ils ont récupéré le contenu des pdf par reconnaissance optique des caractères (OCR), détaille PC Gamer.

Derrière chaque résultat fourni par le robot, ils permettent aux internautes de cliquer pour voir le document source.

Commentaires (16)

votre avatar
Juste :mdr2:
votre avatar
Du coup, ça se prononce comment Jmail ? Comme Gmail ?
votre avatar
En français c'est Ji-mail et Gé-mail, et en anglais je suppose que c'est Jay-mail et Gee-mail.
votre avatar
Je dirais même plus, djay-mail et dgii-mail
votre avatar
votre avatar
Je suis surpris que ces mails soient publiquement connus.
C'est vraiment la copie des mails de cette personne ?
votre avatar
oui, la justice et le president US ont decider de rendre public tout le dossier. bon, le president il a fallu lui forcé la main, il savait qu'il perdrait le vote assujeti.
votre avatar
Expurgée, évidemment.
votre avatar
Euh non pas vraiment. Et encore mieux comme défense les Républicains pro-Trump en ont publié 20 000 supplémentaires donc je suis surpris du peu de mails ici.
votre avatar
"ont notamment recouru au LLM de Google Gemini, avec lequel ils ont récupéré le contenu des pdf par reconnaissance optique des caractères (OCR)"

Humm OCR et LLM sont des technos complètement différentes...
votre avatar
Oui, différentes technos qui ne s'excluent pas. En l'occurrence, j'imagine qu'ils ont utilisé l'OCR dans le contexte d'un LLM.
votre avatar
Je suis d'accord c'est confus. L'OCR lit le texte et utilise probablement de l'ia. Gemini est un LLM dont la fonction est d'inventer le texte. Confondre les deux fonctions pourrait laisser pense que Gemini est un bon outil pour découvrir la vérité, une publicité quoi. Naturellement il y a très certainement une fonction d'OCR en entrée de Gemini, mais c'est une fonction que possède aussi la plupart des photocopieuses depuis 15 ans
votre avatar
Les LLM sont dotés de capacité de reconnaissance optique depuis quelques temps (vision). C'est comme ça qu'ils sont capables de décrire une image et lire le texte dessus avec une précision loin d'être dégueux.

C'est comme ça que j'ai indexé ma bibliothèque de trouze mille memes :p
votre avatar
Gemini peut extraire le texte contenu dans une image (via OCR).
C'est ce qui a été fait ici car les PDF sont rasterisés.
votre avatar
Géniale comme initiative pour simplifier l'accès au plus grand nombre :iloveyou:
votre avatar
Je pense que le plus grand nombre n'en a rien à faire mais c'est amusant comme initiative.