Abstract:
Desde a antiguidade, o homem utiliza meios para realizar recomendações a outras pessoas com as quais se relaciona. Entretanto, nos dias atuais, com a explosão de informação acessível na Web, os meios para realizar recomendações têm sido empregados em diversos sistemas na Web. Na área da recomendação musical não tem sido diferente, pois, nas últimas décadas, houve uma explosão no conteúdo musical disponível e acessível, o que modificou consideravelmente a maneira de escutarmos músicas. Para isso, na literatura são utilizados métodos baseados em aprendizagem de máquina, agrupamentos entre usuários ou itens, exploração de metadados musicais, utilização de dados de uso, entre outros. Independentemente dos métodos empregados, um importante fator na qualidade da recomendação é a fonte de dados usada. Uma das abordagens mais utilizadas em recomendação é a filtragem colaborativa, que pressupõe a existência de dados de ratings de usuários para os itens em recomendação. No entanto, esses dados nem sempre estão presentes nas aplicações, e mesmo quando presentes, muitas vezes são escassos para um número significativo de usuários. Este trabalho visa explorar dados disponíveis na Web para, na falta ou escassez de dados de uso, serem usados para aumentar a qualidade da recomendação no contexto musical. A hipótese é que estes dados públicos poderiam substituir com qualidade os dados de uso, que são privados, em sistemas de recomendação. Os dados públicos utilizados neste trabalho são dados coletados do histórico de programação das rádios e de playlists públicos do YouTube. Como estes dados são gerados por especialistas e estão presentes em grande volume, este trabalho explora a inteligência coletiva existente na geração dos programas das rádios e dos playlists. De fato, os resultados demonstram que, para os cenários onde os dados públicos são podados de forma a simular dados cada vez mais ricos, uma vez que estão presentes em maior volume, o emprego de algoritmos desenvolvidos especialmente para esse propósito podem ser tão eficazes quanto os melhores algoritmos de filtragem colaborativa da literatura.
Leave a comment