“Uma imagem vale mais que mil palavras”
É um ditado que todos já ouvimos antes e pelo conteúdo do nosso feed de notícias é fácil ver como é verdade. À medida que rolamos, somos bombardeados com imagens com pouco ou nenhum texto.
Na evolução das plataformas de mídia social mais populares, passamos do Facebook, onde as postagens escritas eram o máximo, para o Instagram, onde as imagens não são apenas o ponto focal da plataforma, mas espera-se que sua qualidade estética seja excelente. Os recursos de reprodução automática nessas plataformas tornaram os vídeos onipresentes e vitais e, de fato, vemos multidões mais jovens migrando para o TikTok, uma plataforma inteiramente baseada em conteúdo de vídeo. Mas o que são vídeos senão uma série de imagens? O visual está no centro do nosso mundo online e é com base nesta observação que procuramos investigar o que uma pesquisa de imagens pode nos dizer sobre o crowdlending.
Ok Google, o que você vê?
Nossa metodologia não é muito diferente da que qualquer pessoa pode usar quando procura crowdlending: abrimos o Google e procuramos por “crowdlending” em suas imagens (com a ajuda de python). Baixamos as primeiras 300 imagens* e então as coisas ficaram mais interessantes, do ponto de vista da ciência de dados.
*Uma nota rápida: executamos este comando em 21 de fevereiro de 2020, e no computador de Cédric, nosso estagiário de ciência de dados. Até agora, algumas das imagens resultantes da mesma consulta podem ser diferentes. Na próxima figura, exibimos todas as imagens coletadas.
Poderíamos ter pedido a especialistas visuais e designers que fizessem algumas análises para nós, mas como queríamos usar técnicas de aprendizado de máquina em dados alternativos, imagens, solicitamos a API Google Cloud Vision.
O primeiro passo da API foi identificar os componentes de nossas imagens, realizando a detecção de objetos em cada imagem da amostra e classificando os objetos detectados do maior para o menor. A API permitiu-nos reunir as três principais “anotações” identificadas nas imagens para cada uma das 300 imagens (900 anotações no total). A próxima Figura mostra a ocorrência das 14 anotações que mais aparecem.
As três anotações mais identificadas são: texto, fonte e linha. A anotação “texto” nos diz que há texto na imagem, a anotação “fonte” nos diz que uma fonte clara é identificada na imagem, e a anotação “linha” nos diz que uma parte importante da imagem é uma gráfico, uma figura ou um diagrama.
Aqui, apresentamos o mesmo resultado, mas desta vez em termos percentuais.
Decidimos fazer análise de imagens e, no entanto, 32% das nossas imagens contêm texto… Desapontados ou não, isto ainda nos diz muito sobre a forma como o crowdlending é visto online: as imagens do crowdlending são criadas para serem ilustrações descritivas.
E o Google concorda conosco: 7% das imagens são identificadas como ilustrações, 2% como design, 2% como design gráfico, 4% como diagrama e 2% como desenho animado. É óbvio que a maioria dessas imagens incluiria algum texto, o que explica a grande ocorrência de texto, fonte e linhas em nossas anotações.
Curiosamente, 5% das imagens são logotipos de empresas de crowdlending.
Texto, mas o que mais?
Como seria de esperar, a “multidão” em “crowdlending” é representada visualmente, “pessoas” e “grupo social” (quadros vermelhos) estão na lista de anotações. Também encontramos “tambor” e “equipamentos de boliche” (molduras verdes), que não são as primeiras coisas que vêm à mente quando se pensa em crowdlending.
Uma anotação que é interessante pela sua ausência é “rosto humano”. Em nosso acervo de imagens não existem indivíduos específicos, apenas grupos deles. Isto é muito diferente das imagens do setor bancário. Os bancos muitas vezes retratam rostos humanos únicos para representar um conselheiro, para mostrar os serviços personalizados prestados ou para apresentar um gestor de topo da empresa. Para plataformas P2P a ênfase está mais no poder coletivo do grupo ou da multidão e, consequentemente, nem um único rosto humano individual foi detectado entre a amostra.
Vamos olhar além das anotações
Ao descartar os vários tons de cinza e marrom que dominam a maioria das fotografias, a API do Google nos diz que as cores mais dominantes em nossas imagens são o verde (5% da época) e o azul (4% da época). Estas percentagens podem não parecer muito elevadas, mas não deixam de ser informativas.
O verde é uma cor considerada estabilizadora no design gráfico e, na maioria das culturas ocidentais, está associada à representação de crescimento, calma e abundância. Numa análise mais ad-hoc, podemos ver que as imagens de crowdlending estão a usar o verde para destacar o crescimento do mercado P2P e para enfatizar a sua estabilidade.
Da mesma forma, a cor azul está associada à responsabilidade, força e confiabilidade. Não é novidade que é detetado principalmente nas imagens do logótipo, o que sugere que as empresas de crowdlending estão a utilizá-lo para expressar a sua fiabilidade para com potenciais investidores ou mutuários.
O azul e o verde são muito comuns online (pense na plataforma do Facebook), mas ainda mais nas imagens de comunicação externa fornecidas por bancos e outras instituições financeiras. Quer se trate de uma empresa bancária tradicional ou de uma plataforma de crowdlending recém-nascida, ambas atuam no setor financeiro onde a fiabilidade e a confiança são os principais impulsionadores de qualquer transação.
Mas vamos olhar mais fundo
Fizemos algumas de nossas próprias análises generalizando cada imagem até sua cor mais dominante. O resultado é uma mistura única de cores primárias, nomeadamente vermelho, verde e azul. As saídas podem ser vistas nos gráficos de radar na próxima Figura. Para cada cor dominante coletada, extraímos a quantidade de vermelho, verde e azul e as somamos. Também usamos a mesma abordagem, mas desta vez adicionamos cada valor de cor distinto multiplicado por seu peso ou proporção na imagem.
Olhando para o primeiro gráfico de radar, diversas observações podem ser feitas. Ele suporta as detecções da API Google Cloud Vision: o verde foi detectado anteriormente como o que mais ocorre em imagens de crowdlending, seguido pelo azul e depois pelo vermelho. Com base apenas nos valores dos pixels, obtemos a mesma ordem.
Porém, no segundo gráfico de radar, quando o peso dentro da imagem adequada é levado em consideração, os pixels vermelhos assumem a liderança, seguidos pelos verdes e, por último, pelos azuis. Como a única coisa que mudou foi a consideração do peso dentro da imagem, eles devem ser a razão pela qual, segundo esta análise, o vermelho é a cor que mais ocorre. Na verdade, o valor dos pixels vermelhos não muda, portanto, para estarem na frente do verde e do azul, os pixels vermelhos devem estar associados a pesos elevados na imagem. Isso significa que quando os pixels vermelhos dominam, eles não compartilham a imagem com muitas outras cores; embora mesmo quando os pixels verdes e azuis dominam, a imagem contém muitas outras cores.
Isto pode ser explicado pelas diretrizes de design: o vermelho é geralmente visto como uma cor tão poderosa que é combinado apenas com fundos brancos ou cinza.
Pelo lado positivo…
Vamos dar um passo atrás e olhar as imagens de maneira mais geral: elas são claras ou escuras?
Para conduzir uma análise claro/escuro, reduzimos mais uma vez cada imagem à sua cor dominante. Então, para cada cor primária, determinamos se ela estava no espectro claro ou escuro.
Pela Figura acima podemos observar que a grande maioria das cores dominantes são compostas por cores primárias claras. Com base nesses resultados, inferimos que a maioria das imagens de crowdlending tem uma cor clara dominante. Podemos assumir que a imagem média do crowdlending é principalmente clara.
Essa percepção promove a vibração positiva que o verde e o azul instilam nas imagens. Os tons claros estão associados ao dia e à transparência, transmitindo a mensagem de que o crowdlending é uma atividade positiva e confiável.
Desenho composto final do crowdlending:
Nossa análise nos deu uma ideia bastante clara de como é a imagem média do crowdlending. É informativo e geralmente inclui texto e uma figura, às vezes um grupo de pessoas. Inspira positividade e confiabilidade ao usar uma mistura de cores onde o verde e o azul são dominantes. Muitas vezes é acompanhado por um logotipo e equipamento de boliche… espere, o quê?
Aqui está nossa tentativa de melhor se adequar à descrição:
*Um agradecimento especial a Cedric Higel, nosso estagiário cientista de dados que desempenhou um papel importante na produção e redação deste artigo. O mesmo vale para Benedetta Pusateri, que fez um ótimo trabalho de edição.