E se fosse possível prever a popularidade de conteúdos online?

Ter um conteúdo popular na web é um desejo de todo mundo que trabalha com internet ou quer alcançar sucesso nas redes sociais, certo? Pois a ciência diz que é possível prever a popularidade de um conteúdo online, sabia?

Woman using tablet computer

Pesquisadores do Departamento de Ciência da Computação da UFMG (DCC) realizam pesquisa nessa área, com foco em tarefas de predição de comportamento coletivo, utilizando dados públicos disponíveis na web, para a previsão de popularidade.

Recentemente, ao participarem do desafio Predictive Web Analytics Challenge do evento Discovery Challenges, um time formado pelo doutorando Flavio Diniz de Figueiredo e pelos professores Jussara Marques Almeida e Marcos André Gonçalves obteve o primeiro lugar nas tarefas de predição de números de visitas de páginas web e de compartilhamentos no Facebook.

Segundo a professora Jussara, o termo popularidade pode ser interpretado de diferentes formas, dependendo do contexto. No desafio, os competidores deveriam tentar prever se determinado conteúdo veiculado na internet se tornaria popular entre os usuários ou não. Para isso, foram analisados conjuntos de tweets, posts do Facebook e páginas de web. Os competidores monitoraram o desempenho dos dados por uma hora e, por meio de cálculos matemáticos, tentaram identificar a repercussão de tais conteúdos uma semana depois.

Os pesquisadores da UFMG utilizaram algoritmo que explorava conceitos na área de agrupamento de séries temporais e de predição de comportamento e tiveram a menor margem de erro na previsão de popularidade dos posts do Facebook e das páginas de web.

Pesquisa em andamento

© Doug Ross/ImageZoo/Corbis
© Doug Ross/ImageZoo/Corbis

A tese de doutorado desenvolvida por Flávio de Figueiredo foca especialmente na popularidade de conteúdo online. Ele tem desenvolvido diferentes modelos de predição de popularidade, com crescentes níveis de detalhes e precisão.

Um dos trabalhos desenvolvidos e apresentados na conferência ECML/PKDD, em parceria com pesquisadores da  Carnegie Mellon University (EUA), tem por objetivo desenvolver modelos para descrever como um conteúdo particular se torna popular e como sua popularidade evolui com o tempo.

A professora Jussara Almeida explica que os modelos desenvolvidos, inspirados em modelos epidemiológicos, tentam capturar particularmente o impacto de eventos externos na popularidade de um conteúdo online. Segundo ela, outros dois alunos de doutorado trabalham em modelagem de popularidade em outros contextos:

“Um deles desenvolveu um trabalho de análise dos fatores que impactam a popularidade de pesquisadores da área de Computação, sendo que a popularidade de um pesquisador foi estimada pelo número total de citações para todas as suas publicações. Este aluno aplicou técnicas de mineração de dados para inferir os padrões mais comuns de evolução de popularidade dos pesquisadores, tendo descoberto alguns padrões interessantes e evidência da famosa cultura do publish or perish“.

E o que é a mineração de dados?

“Qualquer tarefa que tem por objetivo descobrir padrões recorrentes em grandes massas de dados é passível de ser tratada por técnicas de mineração de dados”, explica Jussara Almeida. Utilizando essa técnica, o grupo da UFMG descobriu quatro padrões bem distintos de como a popularidade de um vídeo no YouTube pode evoluir ao longo do tempo, por exemplo. “Ao explorar estes padrões, conseguimos melhorar os resultados de predição de popularidade”, destaca a pesquisadora.

Mas seria possível chegar a uma “fórmula” de popularidade dos conteúdos online?

De acordo com os pesquisadores, sim!

“De certa forma, temos uma “fórmula” para prever a popularidade de um conteúdo online, dados os perfis previamente identificados, bem como valores de popularidade do conteúdo em questão, medidos durante um período inicial de monitoramento”, explica Jussara.

Segundo ela, as principais variáveis exploradas na construção do modelo de predição são medidas de popularidade (número de visualizações, número de menções no Twitter e número de likes no Facebook) durante a primeira hora desde a postagem ou criação do conteúdo.  Além destas variáveis, também são considerados o dia da semana e a hora em que a página, o tweet ou o post foi criado.

“Estas variáveis são combinadas em um modelo matemático para inferir qual o padrão de evolução de popularidade que a página, tweet ou post irá seguir e, então, fazer a predição”, conclui.

Para mais detalhes sobre o método desenvolvido, confira o artigo “Improving the Effectiveness of Content Popularity Prediction Methods using Time Series Trendsdisponível aqui.
Compartilhe nas redes sociais
0Shares

Verônica Soares

Jornalista, Mestre em História, Política e Bens Culturais, com Doutorado em Comunicação Social sobre textualidades midiáticas da divulgação científica em ambientes digitais.

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *