« Une image vaut mille mots »
C'est un dicton que nous avons tous déjà entendu et d'après le contenu de notre fil d'actualité, il est facile de voir à quel point c'est vrai. Au fur et à mesure que nous défilons, nous sommes bombardés d'images avec peu ou pas de texte dessus.
Dans l'évolution des plateformes de médias sociaux les plus populaires, nous sommes passés de Facebook, où les messages écrits étaient tout le bourrage, à Instagram, où les images ne sont pas seulement le point central de la plateforme, mais leur qualité esthétique devrait être excellente. Les fonctionnalités de lecture automatique sur ces plates-formes ont rendu les vidéos omniprésentes et vitales, et en fait, nous voyons des foules plus jeunes se déplacer vers TikTok, une plate-forme entièrement basée sur le contenu vidéo. Mais qu'est-ce qu'une vidéo sinon une série d'images ? Le visuel est au centre de notre monde en ligne et c'est à partir de ce constat que nous cherchons à investiguer ce qu'une recherche d'images peut nous apprendre sur le crowdlending.
Ok Google, que vois-tu ?
Notre méthodologie n'est pas très différente de ce que n'importe qui pourrait être en recherchant du crowdlending : nous avons ouvert Google et recherché « crowdlending » dans ses images (avec l'aide de python). Nous avons téléchargé les 300 premières images*, puis les choses sont devenues plus intéressantes, du point de vue de la science des données.
*Petite note : nous avons exécuté cette commande le 21 février 2020, et sur l'ordinateur de Cédric, notre stagiaire en science des données. À l'heure actuelle, certaines des images résultant de la même requête peuvent être différentes. Dans la figure suivante, nous affichons toutes les images rassemblées.
Nous aurions pu demander à des experts visuels et des designers de faire des analyses pour nous, mais comme nous voulions utiliser des techniques de machine learning sur des données alternatives, des images, nous avons demandé à l'API Google Cloud Vision.
La première étape de l'API consistait à identifier les composants de nos images, à effectuer la détection d'objets sur chaque image de l'échantillon et à classer les objets détectés du plus au moins présent. L'API nous a permis de rassembler les trois principales « annotations » identifiées dans les images pour chacune des 300 images (900 annotations au total). La figure suivante montre l'occurrence des 14 annotations les plus fréquentes.
Les trois annotations les plus identifiées sont : texte, police et ligne. L'annotation "texte" nous indique qu'il y a du texte dans l'image, l'annotation "police" nous indique qu'une police claire est identifiée dans l'image, et l'annotation "ligne" nous indique qu'une partie importante de l'image est soit un graphique, une figure ou un schéma.
Ici, nous présentons la même sortie mais cette fois en termes de pourcentage.
Nous nous sommes lancés dans l'analyse d'images et pourtant, 32% de nos images contiennent du texte… Déçu ou pas, cela nous en dit encore long sur la façon dont le crowdlending est perçu en ligne : les images de crowdlending sont créées pour être des illustrations descriptives.
Et Google est d'accord avec nous : 7% des images sont identifiées comme des illustrations, 2% comme un design, 2% comme un design graphique, 4% comme un diagramme et 2% comme un dessin animé. Il est évident que la plupart de ces images incluraient du texte, ce qui explique la forte occurrence de texte, de police et de lignes dans nos annotations.
Fait intéressant, 5% des images sont des logos de sociétés de prêt participatif.
Texte, mais quoi d'autre?
Comme on pouvait s'y attendre, la « foule » dans le « crowdlending » est représentée visuellement, les « personnes » et le « groupe social » (cadres rouges) figurent sur la liste des annotations. On trouve aussi du « drum » et du « bowling equipment » (cadres verts), qui ne sont pas les premières choses qui viennent à l'esprit quand on pense au crowdlending.
Une annotation qui est intéressante par son absence, est « visage humain ». Dans notre collection d'images, il n'y a pas d'individus spécifiques, seulement des groupes d'entre eux. Ceci est très différent des images du secteur bancaire. Les banques dépeignent souvent des visages humains pour représenter un conseiller, pour présenter les services sur mesure fournis ou pour présenter un cadre supérieur de l'entreprise. Pour les plateformes P2P, l'accent est davantage mis sur le pouvoir collectif du groupe ou de la foule et par conséquent, pas un seul visage humain individuel n'a été détecté parmi l'échantillon.
Regardons au-delà des annotations
En écartant les différentes nuances de gris et de brun qui dominent la plupart des photographies, l'API Google nous indique que la plupart des couleurs dominantes dans nos images sont le vert (5% de l'époque) et le bleu (4% de l'époque). Ces pourcentages peuvent sembler peu élevés, mais ils n'en sont pas moins informatifs.
Le vert est une couleur considérée comme stabilisatrice dans la conception graphique et, dans la plupart des cultures occidentales, elle est associée à la croissance, au calme et à l'abondance. Dans une analyse plus ad-hoc, on peut voir que les images de crowdlending utilisent le vert pour souligner la croissance du marché P2P et souligner sa stabilité.
De même, la couleur bleue est associée à la responsabilité, à la force et à la fiabilité. Sans surprise, il est principalement détecté dans les images du logo, ce qui suggère que les sociétés de prêt participatif l'utilisent pour exprimer leur fiabilité envers les investisseurs ou emprunteurs potentiels.
Le bleu et le vert sont très répandus en ligne (pensez à la plateforme Facebook), mais encore plus dans les images de communication externe fournies par les banques et autres institutions financières. Qu'il s'agisse d'une société bancaire traditionnelle ou d'une nouvelle plateforme de prêt participatif, les deux exercent au sein du secteur financier où la fiabilité et la confiance sont les principaux moteurs de toute transaction.
Mais regardons plus profondément
Nous avons fait une partie de notre propre analyse en généralisant chaque image jusqu'à sa couleur la plus dominante. Le résultat est un mélange unique de couleurs primaires, à savoir le rouge, le vert et le bleu. Les sorties peuvent être vues dans les graphiques radar de la figure suivante. Pour chaque couleur dominante collectée, nous avons ensuite extrait la quantité de rouge, de vert et de bleu et les avons additionnées. Nous avons également utilisé la même approche, mais cette fois, nous avons ajouté chaque valeur de couleur distincte multipliée par son poids ou sa proportion dans l'image.
En regardant le premier graphique radar, plusieurs observations peuvent être faites. Il prend en charge les détections de l'API Google Cloud Vision : le vert était auparavant détecté comme le plus présent dans les images de prêt participatif, suivi du bleu, puis du rouge. En nous basant uniquement sur les valeurs des pixels, nous obtenons le même ordre.
Cependant, sur le deuxième graphique radar, lorsque le poids dans l'image appropriée est pris en compte, les pixels rouges prennent la tête, suivis du vert et enfin du bleu. Étant donné que la seule chose qui a changé est la prise en compte du poids dans l'image, ils doivent être la raison pour laquelle, selon cette analyse, le rouge est la couleur la plus fréquente. En effet, la valeur des pixels rouges ne change pas, donc pour être devant à la fois le vert et le bleu, les pixels rouges doivent être associés à des poids élevés au sein de l'image. Cela signifie que lorsque les pixels rouges dominent, ils ne partagent pas l'image avec de nombreuses autres couleurs ; alors que même lorsque les pixels verts et bleus dominent, l'image contient de nombreuses autres couleurs.
Cela peut s'expliquer par des directives de conception : le rouge est généralement considéré comme une couleur tellement écrasante qu'il n'est combiné qu'avec des fonds blancs ou gris.
Du bon côté…
Prenons du recul et regardons plus globalement les images, sont-elles claires ou sombres ?
Pour effectuer une analyse clair/foncé, nous avons à nouveau réduit chaque image jusqu'à sa couleur dominante. Ensuite, pour chaque couleur primaire, nous avons déterminé si elle était sur le spectre clair ou sombre.
À partir de la figure ci-dessus, nous pouvons observer que la grande majorité des couleurs dominantes sont composées de couleurs primaires claires. Sur la base de ces sorties, nous en déduisons que la majorité des images de prêt participatif ont une couleur dominante claire. On peut supposer que l'image moyenne du crowdlending est principalement légère.
Cette idée renforce l'ambiance positive que le vert et le bleu insufflent aux images. Les tons clairs sont associés à la journée et à la transparence, renforçant le message selon lequel le prêt participatif est une activité positive et digne de confiance.
Dessin composite Final Crowdlending :
Notre analyse nous a donné une idée assez claire de ce à quoi ressemble l'image moyenne du crowdlending. Il est informatif et comprend généralement du texte et une figure, parfois un groupe de personnes. Il inspire la positivité et la fiabilité en utilisant un mélange de couleurs où le vert et le bleu sont dominants. Il est souvent accompagné d'un logo et d'un équipement de bowling… attendez, quoi ?
Voici notre tentative pour correspondre au mieux à la description :
*Un merci spécial à Cédric Higel, notre stagiaire data scientist qui a joué un rôle important dans la production et la rédaction de cet article. Il en va de même pour Benedetta Pusateri, qui a fait un excellent travail côté montage.