Disponible dans plus de 100 langues avec des bureaux dans plus de 30 pays, Facebook affirme que son équipe de suivi des pays à risques contient des locuteurs de « 50 langues ». Mais des documents transmis par la lanceuse d'alerte Frances Haugen aux régulateurs américains, et qu'une source parlementaire a transmis au Monde et à d'autres médias montrent de grandes disparités dans de nombreuses langues.
« Aujourd’hui, Facebook ne traite pas les Etats-Unis et le reste du monde sur un pied d’égalité, dénonce Frances Haugen. L’entreprise est hypocrite car elle n’investit pas dans les mécanismes de protection adéquats pour l’ensemble des utilisateurs qui ne parlent pas anglais. » « Les pays les plus fragiles ont la version la moins sécurisée de Facebook », ajoute la lanceuse d’alerte.
Fort de 2,9 milliards d’utilisateurs, dont 90 % hors des Etats-Unis, Facebook n'a traduit le règlement de la plate-forme, interdisant notamment les discours de haine ou les discriminations, que dans 49 langues. De plus, les dispositifs permettant aux utilisateurs de signaler des contenus haineux sont « très mal traduits » dans de nombreuses langues.
Ses 15 000 modérateurs, gérés par des prestataires extérieurs, ne couvrent que 70 langues. Dans un document interne rédigé avant les élections de 2019 en Inde, pays connu pour ses centaines de langues, un employé se félicite ainsi que « 12 dialectes » aient été ajoutés à l’hindi, au pendjabi et au bengali.
Les systèmes d’intelligence artificielle créés pour analyser les contenus sont également limités par les langues. Selon la note sur l’Afghanistan, seuls 2 % des contenus haineux modérés dans le pays sont ainsi repérés automatiquement, contre plus de 90 % en moyenne dans le monde entier.
Interrogé, Facebook assure que ses systèmes de repérage automatique fonctionnent désormais dans 50 langues pour les discours de haine, et dans 19 langues pour la désinformation liée au Covid-19.
Mais le système chargé de reconnaître les contenus arabes critiquant le terrorisme se trompe plus de trois fois sur quatre, conduisant à la suppression d’un important nombre de contenus légitimes. Une statistique rejetée par Facebook, qui figure pourtant dans l’un des documents consultés.
Les pays arabophones d’Afrique du Nord et du Moyen-Orient sont un marché majeur pour Facebook, avec 220 millions d’utilisateurs actifs fin 2020 – soit une bonne moitié de la population de la zone –, faisant de l’arabe la troisième langue sur le réseau social. Pour autant, Facebook « n’est pas en capacité de faire examiner les commentaires en langue arabe potentiellement illicites par des modérateurs compétents – lorsque ces derniers existent », déplore Le Monde.
Pour certains pays, Facebook ne dispose en effet tout simplement pas d’experts capables de comprendre la langue, et ils ne maîtrisent pas certains des principaux dialectes arabes, notamment dans des pays très clivés tels que le Yémen, l'Irak ou la Libye. À ce problème s’en ajoute un autre. « Lorsque Facebook supprime par erreur des actualités ou des critiques portant sur ces organisations, cela crée la perception que Facebook est aligné avec les régimes en place », ajoute le document.
Commentaires