Facebook Rosetta pour détecter du texte depuis des images

Le 12 septembre 2018 à 09h38
2 min
Sciences et espace
Sciences
Facebook s’est épanché hier soir sur son système de reconnaissance d’écriture dans les photos et vidéos. Une technologie spécifique, alimentée par le machine learning, les OCR classiques étant peu adaptés aux usages modernes, selon l’éditeur.
La reconnaissance se fait en deux étapes : détection puis reconnaissance. La première tâche de repérer les régions semblant contenir du texte, via Faster R-CNN. Vient ensuite la reconnaissance des caractères, à travers un réseau neuronal convolutif.
Le modèle de Facebook, nommé Rosetta, a permis l’analyse de plus d’un milliard de photos et vidéos sur le réseau social et Instagram. Les textes ainsi extraits permettent de déclencher plus facilement les outils de modération si besoin, ou encore de mieux orienter les recommandations.
Bien que l’éditeur affiche un certain contentement sur sa technologie, il estime que la route est encore longue, surtout pour les vidéos. L’approche actuelle est décrite comme « naïve », puisque chaque image est analysée séparément.
La durée des vidéos et l’augmentation de la résolution ne font qu’allonger la durée de calculs. Facebook envisage donc de se pencher sur les convolutions 3D pour s’extraire de la seule détection spatiale au profit de modèles temporels.
Le 12 septembre 2018 à 09h38
Commentaires (0)
Abonnez-vous pour prendre part au débat
Déjà abonné ? Se connecter
Cet article est en accès libre, mais il est le fruit du travail d'une rédaction qui ne travaille que pour ses lecteurs, sur un média sans pub et sans tracker. Soutenez le journalisme tech de qualité en vous abonnant.
Accédez en illimité aux articles
Profitez d’un média expert et unique
Intégrez la communauté et prenez part aux débats
Partagez des articles premium à vos contacts
Abonnez-vous