Publié dans Internet

5

TextStyleBrush, le projet de Facebook pour remplacer à la volée du texte sur des photos

TextStyleBrush, le projet de Facebook pour remplacer à la volée du texte sur des photos

TextStyleBrush est une technologie basée sur l’apprentissage automatique non supervisé. Traduction, le modèle est entraîné avec des données « inconnues », sans que personne ne lui ait donné la moindre indication. Il devait de lui-même créer des recoupements et trouver des liens.

Facebook lui a donné « à manger » une montagne de photos contenant des textes dans des zones délimitées, notamment des panneaux et étiquettes en tous genres. À quelle fin ? pouvoir remplacer ces textes à la volée.

Via plusieurs exemples, Facebook montre le potentiel de sa technologie. Dans une vidéo relativement impressionnante, on peut voir comment, depuis la photo d’un texte, on peut extraire un mot, dont on va ensuite appliquer le style à un autre mot.

Selon l’éditeur, TextStyleBrush fonctionne aussi bien avec les polices que l’écriture manuscrite. La photo de l’étal de légumes montre également la limite de la technologie, puisque certains textes ne sont pas traduits.

Mais cette même photo montre justement tout le potentiel, car TextStyleBrush peut être utilisé dans des applications de réalité augmentée, par exemple pour afficher des traductions à la volée des panneaux dans une rue, des instructions, etc. Le tout en gardant le même style graphique que le texte d’origine. 

« Bien qu’il s’agisse d’un projet de recherche, il pourrait un jour débloquer un nouveau potentiel pour l’expression personnelle créative comme les messages personnalisés et légendes, et pose les bases d’innovations futures comme les traductions photo-réalistes des langages en réalité augmentée ».

Ne faut-il pas craindre cependant un détournement de cette technologie, à des fins notamment de deep fakes ? Facebook joue justement la carte de la transparence : 

« En publiant les capacités, méthodes et résultats de ces recherches, nous espérons inciter le dialogue et la recherche dans la détection d’abus potentiels sur ce type de technologie, comme les attaques deep fakes sur les textes – un défi critique et émergent dans le champ de l’IA ».

5

Tiens, en parlant de ça :

Poing Dev

Le poing Dev – Round 7

Meuh sept super !

22:32 Next 8
Logo de Gaia-X sour la forme d’un arbre, avec la légende : infrastructure de données en forme de réseau

Gaia-X « vit toujours » et « arrive à des étapes très concrètes »

« Money time »

18:06 WebSécu 3

Trois consoles portables en quelques semaines

Et une nouvelle façon de concevoir le jeu se confirme

10:45 Hard 36
Poing Dev

Le poing Dev – Round 7

Next 8
Logo de Gaia-X sour la forme d’un arbre, avec la légende : infrastructure de données en forme de réseau

Gaia-X « vit toujours » et « arrive à des étapes très concrètes »

WebSécu 3

Trois consoles portables en quelques semaines

Hard 36
Une tasse estampillée "Keep calm and carry on teaching"

Cyberrésilience : les compromis (provisoires) du trilogue européen

DroitSécu 3

#LeBrief : fuite de tests ADN 23andMe, le milliard pour Android Messages, il y a 30 ans Hubble voyait clair

#Flock a sa propre vision de l’inclusion

Flock 25
Un Sébastien transformé en lapin par Flock pour imiter le Quoi de neuf Docteur des Looney Tunes

Quoi de neuf à la rédac’ #10 : nous contacter et résumé de la semaine

43
Autoportrait Sébastien

[Autoportrait] Sébastien Gavois : tribulations d’un pigiste devenu rédac’ chef

Next 20
Logo de StreetPress

Pourquoi le site du média StreetPress a été momentanément inaccessible

Droit 21
Amazon re:Invent

re:Invent 2023 : Amazon lance son assistant Q et plusieurs services IA, dont la génération d’images

IA 14
Un œil symbolisant l'Union européenne, et les dissensions et problèmes afférents

Le Conseil de l’UE tire un bilan du RGPD, les États membres réclament des « outils pratiques »

Droit 6

19 associations européennes de consommateurs portent plainte contre Meta

DroitSocials 16

#LeBrief : Ariane 6 l’été prochain, Nextcloud rachète Roundcube, désinformation via la pub

Chiffre et formules mathématiques sur un tableau

CVSS 4.0 : dur, dur, d’être un expert !

Sécu 16
Une tête de fusée siglée Starlink.

Starlink accessible à Gaza sous contrôle de l’administration israélienne

Web 35
Fibre optique

G-PON, XGS-PON et 50G-PON : jusqu’à 50 Gb/s en fibre optique

HardWeb 53
Photo d'un immeuble troué de part en part

Règlement sur la cyber-résilience : les instances européennes en passe de conclure un accord

DroitSécu 10
lexique IA parodie

AGI, GPAI, modèles de fondation… de quoi on parle ?

IA 11

#LeBrief : logiciels libres scientifiques, fermeture de compte Google, « fabriquer » des femmes pour l’inclusion

livre dématérialisé

Des chercheurs ont élaboré une technique d’extraction des données d’entrainement de ChatGPT

IAScience 3
Un chien avec des lunettes apprend sur une tablette

Devenir expert en sécurité informatique en 3 clics

Sécu 11
Logo ownCloud

ownCloud : faille béante dans les déploiements conteneurisés utilisant graphapi

Sécu 16
Le SoC Graviton4 d’Amazon AWS posé sur une table

Amazon re:invent : SoC Graviton4 (Arm), instance R8g et Trainium2 pour l’IA

Hard 12
Logo Comcybergend

Guéguerre des polices dans le cyber (OFAC et ComCyberMi)

Sécu 10

#LeBrief : faille 0-day dans Chrome, smartphones à Hong Kong, 25 ans de la Dreamcast

Le brief de ce matin n'est pas encore là

Partez acheter vos croissants
Et faites chauffer votre bouilloire,
Le brief arrive dans un instant,
Tout frais du matin, gardez espoir.

5

Commentaires (5)


tiret
Il y a 2 ans

Chouette comme ça FB pourra décoder les photos de manière plus efficache pour mieux nous espionner !


tazvld Abonné
Il y a 2 ans

Rien à voir dans la techno présenté ici.



Si tu cherche des algo capable de faire de le reconnaissance d’image, je t’invite à regardé plus du coté de YOLO (ici la V3) si tu veux t’amuser sur de l’embarqué, Fast R-CNN pour ce qui sert de pivot de référence et toute la flopée de réseaux de neurones similaires



Ici, il utilisent une technique de “transfert de style” qui permet de copier un style (d’écriture) pour le transférer sur un autre document (un texte). Je n’ai pas regardé comment ils font exactement, mais l’idée est là.


Avisance
Il y a 2 ans

Ces technologies vont se développer quoi que Facebook fasse. Ce n’est pas plus mal que FB montre que ça existe et comment ça marche. Pour une fois, je suis d’accord avec leur choix (et du coup je me demande si j’ai tort…).


tontonCD
Il y a 2 ans

Impressionnant.
Concernant l’argument de FB sur les deep fake, il faudrait déjà que les gens commence à se poser la question de l’authenticité d’une photo lorsqu’en il en voient une, et certains ne sont pas du tout douer pour ça.


Abatonimus Abonné
Il y a 2 ans

Google Translate sur Android le fait depuis très longtemps.
De tête, depuis 2014 je crois.