1. Accueil
  2. Divers
  3. Facebook a du mal avec les dialectes du Maghreb
Divers

Facebook a du mal avec les dialectes du Maghreb

L’arabe est la troisième langue au monde la plus utilisée sur Facebook. Entre les pays d’Afrique du nord et le Moyen-Orient, les arabophones ont un poids conséquent sur Facebook. Ils seraient même les utilisateurs les plus actifs sur la plateforme mondialement utilisée. Pourtant la société américaine semblerait dépassée par l’analyse des messages et autres contenus postés en arabe sur sa plateforme.

C’est ce que révèle des documents internes de Facebook dévoilés par France Haugen, une ancienne employée du géant du monde des réseaux sociaux.

Le journal français Le Monde, qui en détient des copies, dévoile dans une enquête publiée ce lundi que Facebook ne disposerait de moyens suffisants pour décrypter et filtrer au mieux les contenus en arabe, notamment les contenus dangereux et illicites. Le Maghreb est la première région incomprise par Facebook, les différents dialectes ne seraient que très rarement compris par les équipes de modérateurs.

Trop de nuances d’arabe

Plus généralement, les variétés de dialectes pratiqués dans le monde arabe rendraient la tâche très compliquée pour les équipes de Facebook. En effet, chaque pays arabe a ses spécificités linguistiques liées à la culture et à la société locale. De telle sorte que seuls les linguistes connaissant parfaitement le pays pourraient traduire les dialectes locaux.

Le Maghreb est l’exemple parfait : même entre pays voisins, il est parfois impossible de se comprendre, les Marocains auront du mal à comprendre tout le temps les Tunisiens, les Algériens ont même parfois des difficultés à comprendre le dialecte de régions issues de leur propre pays. Si ces pays ont une culture commune et fondent leur langue sur des bases d’arabe classique chacun a modelé son dialecte en fonction de son histoire.

L’Algérien sera influencé par des mots ottomans, français ou encore berbère. La langue berbère se mélange également énormément au dialecte marocain, quant au tunisien il pourra parfois emprunter des mots italiens ou encore français.

Le réseau social compte 220 millions d’utilisateurs arabophones venus de pays dont la culture de chacun vient influencer l’utilisation de la langue. Or, selon les documents dévoilés par l’ancienne employée de Facebook, la plateforme ne disposerait de modérateurs en langue arabe basés seulement en Allemagne et au Maroc.

Impossible donc de réunir toutes les nationalités arabes dans son équipe de modérateurs. Cette situation donne lieu à des traitements incohérents des commentaires en arabe.

Le Monde évoque un épisode illustrant ce problème durant le dernier ramadan. A cette époque, le nombre de messages, dits liés au terrorisme ou violents, aurait été plus conséquent. Or il se peut que les messages religieux, qui sont plus fréquents durant cette période, aient été malencontreusement classés par les algorithmes de Facebook comme dangereux, voire terroristes.

L’intelligence artificielle se retrouve à trop censurer les arabophones

Cette situation crée également un blocage dans l’automatisation de gestion des contenus par les algorithmes. Si les modérateurs humains ne sont pas capables de comprendre les messages en arabe, ils ne peuvent donc pas donner de matière à l’intelligence artificielle pour automatiser l’identification des termes à bannir ou à conserver.

Il est également important de souligner que ces dialectes ne sont pas toujours écrits en caractères arabes mais parfois en caractères latins et avec des chiffres. Par exemple en Algérie, où la darija n’est pas la langue officielle – bien qu’elle soit majoritairement employée par la population algérienne – n’a pas de règles fixes de grammaire et l’orthographe est souvent aléatoire. Comment distinguer une seule orthographe ou délimiter un vocabulaire écrit de mille manières et en constante évolution ? Même l’intelligence artificielle utilisée par Facebook se retrouve coincée dans ce labyrinthe linguistique.

Au contraire, cette intelligence artificielle ne verra pas les nuances. Une autre spécificité que connaissent les utilisateurs arabophones est une « surcensure » de leurs commentaires, d’après Le Monde. 

Puisque ces robots vont gérer les publications en fonction d’un nombre restreints de mots-clés en arabe, ils classent souvent des messages, groupes ou commentaires dans les mauvaises catégories, seulement parce qu’ils ont utilisé un des mots-clés identifiés comme dangereux. Or le contexte avec ces dialectes arabes est primordial, de même que l’origine du pays dans lesquels ils sont employés. La signification de certains termes peut complétement différer d’un pays à l’autre, parfois même lorsqu’ils ont des frontières en commun.

Facebook affirme vouloir déployer des équipes plus diversifiées et reflétant la culture des dialectes locaux. D’après la société américaine, ses modérateurs seraient plus nombreux qu’on le croit, au moins 15 000, basés dans 70 pays.

La Newsletter
Restez bien informés : recevez les dernières infos et alertes en vous inscrivant Gratuitement à notre Newsletter.
Guide De Voyage Algérie
Algérie
Toutes les procédures de voyage en Algérie
Voir Plus