D’une Start-Up fondée en 2005 à son rachat l’année suivante pour 1,65 milliard de dollars US par Google, YouTube est aujourd’hui une plateforme comptant 2 milliards d’utilisateurs mensuels à travers le monde selon ses données. Dès 2005, les recommandations prennent la forme de catégories de contenus classées par popularité, nombre de discussions suscité, nouveauté ou encore nombre de favoris. En 2008, l’introduction des « trending pages » présente les contenus classés par le système selon leurs popularités. Faute de nouveauté et due à un contenu redondant, la stratégie de recommandation est tournée vers la prédiction de ce que l’utilisateur veut regarder. Le système de recommandation se base alors sur la généralisation des habitudes (« habits ») pour personnaliser les recommandations selon des grappes d’habitudes partagées. En 2012, le temps passé à consommer un contenu est inclus dans les recommandations. Quatre ans plus tard, le temps de qualité (valued watchtime) est utilisé afin de mieux cibler certaines personnes qui ne regardaient pas les contenus en entier, mais était satisfait malgré tout.
Cette optimisation de la personnalisation est aussi allée de pair avec quelques ratés, comme en 2015 avec la surabondance de contenus sensationnels et des pièges à clics (clickbait). Le système de recommandation est également critiqué par des difficultés dans la classification et l’identification des contenus complotistes, racistes ou violents, menant au retrait de certaines recommandations par catégorie d’âge ou encore en 2019, à des initiatives pour réduire les contenus de désinformation.
L’absence de transparence dans le fonctionnement des systèmes de recommandations est expliquée par la quantité de signaux utilisés (« 80 billion signals ») et des logiques complexes des systèmes d’apprentissage automatique. Parmi ces signaux, ceux accessibles/visibles aux utilisateurs pour mieux utiliser la plateforme (« to better use the platform »), on retrouve les « clicks, watchtime, survey responses, sharing, likes and dislikes ».
Pour ce court mémo, je m’inspire de la méthode pas-à-pas (walktrough method) de Light, Burgess et Duguay (2018) afin de recueillir un ensemble de données à partir de mon utilisation de la plateforme YouTube. Pour mieux comprendre les algorithmes de recommandation, je me base sur le modèle de la découvrabilité élaboré par Mckelvey et Hunt (2019) qui propose comme catégorie d’analyse l’environnement, le vecteur et l’expérience. Ce mémo est basé sur mon utilisation personnelle de YouTube en janvier 2022 dans la région de Montréal, Canada, à partir du navigateur Safari et de l’application mobile (connecté à mon compte Google). J’ai également analysé les blogues officiels de YouTube (Fr+Eng) traitant frontalement de la recommandation (voir par exemple « On YouTube’s recommendation system » et « vidéos recommandées »).
Environnement
Interfaces de la plateforme (écran d’accueil, la page vidéo, l’écran de recherche)
1ère ouverture — Navigation privée (pas d’historique/aucun compte) : Dans l’interface de YouTube
En ouvrant la page, ce qui apparaît de prime abord est un large bandeau qui invite l’utilisateur à s’abonner au service payant. En dessous, des rangées de 4 vidéos s’étendent jusqu’en bas de l’écran. Les vidéos présentées sont de différents types (musique, réaction, live, storytelling) et d’audience similaire (plus de 1 million de vues).
2ème ouverture — compte Google perso (historique), mais toujours en navigation privée
Je me connecte en mettant mon compte (pré-enregistré malgré la navigation privée). Les recommandations changent et me montrent directement des vidéos que je n’ai pas terminées précédemment (ligne rouge sur la vidéo), des suggestions en lien avec mes dernières recherches (vidéos sur les motos et/ou soccer et politique). Les onglets abonnements, bibliothèque et historique sont accessibles.
Affordances et interaction utilisateur-interface
Différentes possibilités s’offrent à l’utilisateur pour naviguer dans l’interface. De manière synthétique, ces affordances proposent certaines possibilités et des contraintes :
Sur la page d’accueil, on peut :
- Cliquer sur « recherche », « se connecter » ou cliquer sur les vidéos
- Faire une recherche classique : en faisant une recherche, des suggestions de recherche sont proposées
- Se connecter : ouvre une nouvelle page pour ajouter un compte Google
- Ouvrir une vidéo : ouvre une nouvelle page avec la vidéo
Sur la vidéo, on peut appuyer sur play/pause, vidéo suivante, son, temps écoulé, sous-titre, paramètre, lecture réduite, mode cinéma ou plein écran.
Sont présentes des publicités qui s’affichent en amont de la vidéo. Les affordances sont minimes. Il est :
- Possible d’avoir de l’info sur pourquoi telle publicité (ex : heure ou emplacement)
- Possible de signaler ou « bloquer » l’annonce
- Bloquer arrête la pub (solution pour arrêter les pubs trop longues. Attention, si on le fait trop, on ne peut plus bloquer la pub pendant un certain temps)
Principaux algorithmes de recommandation du site
« Inciter les membres à agir », « vous encourager dans votre réussite », intéresser un large public », « help connect to videos they love », « access the most satisfying video », « helps users find a new song to fall in love with », « discover their next favorite creator », « suggesting videos that people actually want to watch », du français à l’anglais la mission de YouTube est de proposer des contenus pour maintenir l’attention de son public. Cette dernière se fait principalement par un système de recommandation automatisée.
Selon C. Goodrow (VP of Engineering at Google and head of Search and Discovery at YouTube) le système de recommandation est comme un bibliothécaire pour les vidéos : « there’s an audience for almost every video and the job of our recommendation system is to find that audience » (On YouTube’s recommendation system, 15 sep. 2021). Plus que l’abonnement à des créateurs ou encore aux recherches, les recommandations représentent une part significative des vues sur YouTube. Pour bien fonctionner, selon les ingénieurs chez YouTube, les recommandations requièrent beaucoup d’informations captées lors de l’utilisation de la plateforme. Chaque vidéo est ensuite classée selon des calculs statistiques avancés et peut être sélectionnée pour être présentée à un utilisateur-type ou un ensemble type, une « niche ».
En plus des systèmes algorithmiques, des milliers de modérateurs participent à revoir les recommandations dans certains cas problématiques et empêchent certains contenus d’apparaître (Casilli, 2019).
Comment fonctionnent ces recommandations ?
Selon un billet des blogues officiels anglophone :
« Providing more transparency isn’t as simple as listing a formula for recommendations but involves understanding all the data that feeds into our system » (Goodrow, 2021).
Selon les blogues analysés, il est difficile d’expliquer comment les systèmes de recommandations fonctionnent. Si on sait que le nombre de vues, le temps passé sur une vidéo, le temps de « qualité » passé sur une vidéo, les likes, le lieu et l’heure, d’autres recherches sur Google sont par exemple prises en compte (parmi 8 milliards de signaux), il est difficile de savoir quelles logiques lient ces signaux entre eux. L’explication générale qui transparaît de ces réponses est que la recommandation fonctionne selon des ensembles statistiques dynamiques. Sitôt des habitudes identifiées, une « niche » est ciblée pour un certain type de contenu. Donc si je regarde X et Y contenus et que ceux qui regardent X et Y contenus regardent aussi Z contenus, il est probable que j’aime regarder Z contenu. Si je regarde des vidéos de motos et que les utilisateurs qui regardent les mêmes vidéos regardent aussi des vidéos de sports extrêmes, je vais certainement avoir des recommandations pour ce type de vidéos.
À quels fins les vecteurs sont optimisés ?
Ce flou dans l’explication est constamment mis en parallèle de formule comme « nous travaillons sans relâche à l’amélioration de nos systèmes ». Dans une double dynamique paradoxale, YouTube optimise la viralité de certains contenus tout en cherchant à cibler et réduire la popularité d’autres identifiés comme problématique.
Expériences
Quels sont les moyens que les plateformes vous proposent pour utiliser le site ?
De manière très pratique, il s’agit de cliquer sur une vidéo puis d’aller de vidéo en vidéo via les recommandations à droite et/ou aller sur la chaîne pour voir les contenus qu’elles proposent. Dans mon expérience, en retournant sur la page d’accueil après avoir regardé 2 vidéos, les recommandations ont changé avec des propositions de Netflix, de trailers (contenu court) et aussi de contenus plus longs.
À quels fins les expériences sont optimisés ?
De la recherche d’audience par les vidéos « clickbait » à la prédiction des vidéos selon la personnalisation, YouTube, via ses blogues, fait la promotion de ses systèmes de recommandation auprès de son “écosystème créatif” – les créateurs de contenus (source non négligeable des revenus de YouTube selon une étude menée par Oxford Economics en 2020). L’optimisation du temps passé par les utilisateurs sur YouTube est une priorité pour la compagnie qui passe autant par les recommandations que par l’intégration des créateurs eux-mêmes dans ce processus. Autrement dit, il y a l’aspect prédictif des recommandations et il y a l’aspect visuel, attractif des vidéos.
Les recommandations relèvent de systèmes complexes de sélection et de classification qui, du côté des créateurs de contenus, créent des stars et mobilisent une communauté d’ambassadeurs et du côté des utilisateurs, ciblent des publics et retiennent des consommateurs (voir aussi Sloane et al. 2020). Tous sont mis à contribution non pas pour comprendre les recommandations, mais pour affiner les données pour les rendre plus visibles par les algorithmes.
Bibliographie
Casilli, A.. (2019). En attendant les robots: enquête sur le travail du clic. Paris: Éditions du Seuil.
Fridman, L. (2020, janvier 25). Cristos Goodrow : YouTube Algorithm | Lex Fridman Podcast #68. https://www.youtube.com/watch?v=nkWmiNRPU-c
Light, B., Burgess, J., & Duguay, S. (2018). The walkthrough method: An approach to the study of apps. New Media & Society, 20(3), 881–900. https://doi.org/10.1177/1461444816675438
McKelvey, F., & Hunt, R. (2019). Discoverability: Toward a Definition of Content Discovery Through Platforms. Social Media + Society, 5(1). http://dx.doi.org.lib-ezproxy.concordia.ca/10.1177/2056305118819188
Sloane, M. & al. (2020). Participation is not a Design Fix for Machine Learning. https://arxiv.org/abs/2007.02423
« Nous reconnaissons l’appui financier du gouvernement du Canada. »