Des données illustrent que X, anciennement Twitter, a un sérieux problème de bots

Quiconque utilise encore X en aura fait l'expérience : la plateforme est submergée par des acteurs inauthentiques — concrètement, des bots. Qui n'a pas eu des quantités industrielles de "Hannah" dans ses notifications au cours des derniers mois ?

Pour autant, les anecdotes personnelles ne suffisent pas pour affirmer que X a un problème généralisé d'activité inauthentique. Pour faire une telle affirmation, il est nécessaire de recourir à des données. Une entreprise spécialisée vient de publier de telles données. Ce qu'elles montrent est aussi choquant que catastrophique.

La semaine dernière, aux États-Unis a eu lieu le Super Bowl. Il s'agit d'un évènement majeur de football américain. L'édition de cette année a battu des records d'audience. Y compris sur X, c'est en tout cas ce qu'a déclaré l'entreprise. Pour autant, dans quelle mesure l'activité sur X lors du Super Bowl était réellement de l'activité humaine ?

D'après CHEQ, une entreprise spécialisée dans la détection de trafic inauthentique et la lutte contre la fraude publicitaire en ligne, pendant le Super Bowl de 2024, le trafic provenant de X à destination des sites Internet de ses clients était constitué de bots à hauteur de 75 %. Vous avez bien lu : les trois-quarts du trafic provenant de X à destination du site Internet des clients de CHEQ était inauthentique.

The majority of traffic from Elon Musk’s X may have been fake during the Super Bowl, report suggests
These numbers are legitimately shocking.

Via dalfen sur Mastodon

À titre de comparaison, voici la part de trafic inauthentique mesuré par CHEQ pour d'autres plateformes :

  • TikTok, Super Bowl de 2024 : 2.56 %
  • Facebook, Super Bowl de 2024 : 2.01 %
  • Instagram, Super Bowl de 2024 : 0.73 %
  • Twitter, Super Bowl de 2023 : 2.81 %

J'ai fait deux graphiques pour illustrer l'ampleur du problème. La Figure 1 reprend les données ci-dessus.

Figure 1

La Figure 2 reprend les mêmes données que la Figure 1, et j'ai ajouté les données de X pour 2024.

Figure 2

Il ne me semble pas utile de commenter ce qui différencie la Figure 1 de la Figure 2.

CHEQ a également publié des données portant sur la part du trafic inauthentique pendant le mois de janvier 2024 :

  • TikTok : un peu plus de 2.6 %
  • Facebook : un peu plus de 2 %
  • Instagram : 0.96 %
  • X : 31.82 %

Même en dehors d'évènements majeurs comme le Super Bowl, la Figure 3 montre à quel point X se distingue par le volume considérable de trafic inauthentique qui provient de la plateforme.

Figure 3

Voici comment Guy Tytunovich, le fondateur et PDG de CHEQ, commente les données :

I've never seen anything even remotely close to 50 percent, not to mention 76 percent. I'm amazed… I've never, ever, ever, ever seen anything even remotely close.

Ma traduction :

Je n’ai jamais rien vu de même vaguement proche de 50 %, sans parler de 76 %. Je suis estomaqué… Je n’ai jamais, jamais, jamais, jamais vu quelque chose de même vaguement proche.

Deux importantes précisions méthodologiques. La première est que l'on ne sait pas si les données de CHEQ sont représentatives : les données sont issues d'un échantillon constitué des sites Internet des clients de l'entreprise, plutôt que d'une sélection variée de sites Internet. La deuxième est que les données de CHEQ ne mesurent pas l'activité inauthentique directement sur X. Ce que mesurent les données de CHEQ, c'est la proportion du trafic provenant de X vers les sites de ses clients qui n'est pas authentique.

Ces précisions faites, les données de CHEQ vont néanmoins dans le sens de ce que rapportent de nombreux utilisateurs de X depuis des mois. Si X génère autant de trafic inauthentique vers des sites tiers, cela implique que l'activité inauthentique sur la plateforme est importante.

Les données de CHEQ montrent a minima que l'activité inauthentique sur X a significativement augmenté : à méthodologie relativement constante (les outils de détection de CHEQ) et à échantillon relativement constant (les sites Internet des clients de CHEQ), le trafic inauthentique en provenance de Twitter en 2023, puis de X en 2024, au cours du Super Bowl a été multiplié par… quasiment 27 !

Figure 4

En plus de sévèrement dégrader l'expérience utilisateur, et donc de diminuer encore l'utilité de la plateforme, l'augmentation significative de l'activité inauthentique sur X pose également un problème financier pour l'entreprise. Si des annonceurs achètent de la publicité, comment savoir si la publicité a été vue par des humains ou par des bots ? Acheter de la publicité pour qu'elle soit vue par des bots n'intéressera personne.

La lutte contre l'activité inauthentique était présentée par Elon Musk comme un objectif majeur lorsqu'il a racheté l'entreprise. C'est par exemple dans cet objectif qu'il a dynamité le système de vérification d'identité. Quasiment un an et demi plus tard, il me semble clair que l'activité inauthentique n'a pas disparue de X. Pire : la situation s'est considérablement dégradée. L'effort à faire pour corriger le tir sera sans doute considérable, s'il est un jour entrepris.

🖋️
Mise à jour le 17 février 2024 à 14:55 : la Figure 4 est triée dans l'ordre chronologique.