Diferentes hits têm algo em comum?

imagem

Se você fizer login no Spotify.me , poderá obter um resumo personalizado de como o Spotify o entende através da música que você ouve neste site do Spotify. Isso é demais!

Eu escuto muita música e gosto de trabalhar com dados, por isso me inspirou a tentar analisar minha coleção de músicas.

Fiquei muito curioso se havia algum ingrediente específico que compusesse as músicas de sucesso. O que os torna legais? Por que gostamos de hits e eles têm um certo "DNA"?

Desafio


Isso me levou a tentar responder a duas perguntas usando os dados do Spotify:

  1. Como é minha lista de reprodução de música?
  2. Existem atributos de áudio específicos comuns a todas as músicas de sucesso?

As ferramentas


Felizmente, existem ferramentas muito simples para conectar-se ao Spotify, receber dados e visualizá-los.

Trabalharemos com a linguagem de programação Python 3 , a biblioteca Spotipy Python, que permite a conexão com a API da Web do Spotify , e visualizaremos os dados usando plot.ly e Seaborn .

Matriz de dados


No final de cada código, o Spotify compila uma lista de reprodução das 100 músicas mais tocadas. O conjunto de dados que eu usei já foi carregado no Kaggle: Top Spotify Tracks of 2018 . A lista das 100 músicas mais populares do Spotify parece uma quantidade razoável de dados para estudar hits, não é?

Vamos começar!


Para começar, você precisa criar uma conta no developer.spotify.com . Depois disso, você pode acessar diretamente o Spotify Web API Console e começar a explorar os vários pontos de extremidade da API.

Nota : o link para o código que eu usei para o projeto está no final da postagem.

Após conectar-se à API da Web do Spotify, criaremos um objeto Spotify usando a Biblioteca do Python do Spotipy, que usaremos para enviar solicitações ao endpoint do Spotify.

import spotipy from spotipy.oauth2 import SpotifyClientCredentials from spotipy import util cid =”Your-client-ID” secret = “Your-Secret” client_credentials_manager = SpotifyClientCredentials(client_id=cid, client_secret=secret) sp = spotipy.Spotify(client_credentials_manager=client_credentials_manager) 

Analisando dados da minha lista de reprodução


Este é um dos passos mais importantes na ciência de dados. Nosso objetivo aqui é entender o tipo de música na minha playlist, extrair quaisquer observações interessantes e compará-las com as características de áudio de centenas de músicas populares de 2018.

Gráfico de frequência do artista



Com que frequência os artistas aparecem na minha playlist

Observando esse histograma, posso entender com que frequência os artistas se encontram em uma das minhas listas de reprodução.

Especificações de áudio


Agora, vamos dar uma olhada nos recursos de áudio das músicas da lista de reprodução. O Spotify compilou uma lista de especificações de áudio para cada faixa no Spotify! Aqui está uma breve descrição dos recursos que usaremos neste artigo:

Instrumentalness : prevê que não há vocais na faixa. Nesse contexto, os sons "oh" e "aaaa" são considerados instrumentais. Rap ou faixas com palavras são obviamente "vocais". Quanto mais próximo o valor instrumental estiver de 1,0, maior a probabilidade de a faixa não conter uma voz.

Energia : é um valor na faixa de 0,0 a 1,0 que caracteriza o critério para perceber o “brilho” e a “atividade” de uma música. Geralmente, as composições energéticas são rápidas, altas e barulhentas. Por exemplo, o death metal tem alta energia e o prelúdio de Bach tem baixos indicadores nessa escala.

Acústica : Medida de confiança de que uma composição é acústica no intervalo de 0,0 a 1,0. Um valor de 1,0 significa alta confiança de que a composição é acústica.

Vida : reconhece a presença de ouvintes em uma gravação. Quanto maior o valor da animação, maior a probabilidade de a música ser tocada ao vivo. Um valor acima de 0,8 dá confiança séria na performance ao vivo.

Fala (texto) : a fala detecta a presença de texto em uma música. Se a fala da composição estiver acima de 0,66, provavelmente será composta de texto, um valor de 0,33 a 0,66 significa que a música pode conter música e palavras, e um valor abaixo de 0,33 significa que a música não contém nenhuma palavra.

Dança : A dança descreve a adequação de uma faixa de dança com base em elementos musicais como ritmo, estabilidade do ritmo, força da batida e constância geral. As composições com um valor de 0,0 são as menos dançáveis, com um valor de 1,0 são as mais dançáveis.

Valência : esse valor na faixa de 0,0 a 1,0 descreve a positividade musical transmitida pela música. Músicas com alta valência soam mais positivas (ou seja, transmitem felicidade, alegria ou euforia) e músicas com baixa valência soam mais negativas (ou seja, tristes, deprimidas ou zangadas).




Distribuição de estilos de música na minha playlist

Resultados da observação:

  • A maioria das músicas da minha playlist tem uma ampla distribuição de dança e não há muitas músicas "felizes", como pode ser visto pela alta frequência de músicas com valores abaixo de 0,5 valência . Portanto, podemos dizer que eu gosto de músicas que você pode dançar (e isso é verdade!)
  • Há uma descida acentuada no gráfico quanto a linguagem, instrumentalidade e um pouco de vivacidade . Isso nos diz que nas músicas da minha lista de reprodução raramente existem palavras, existem poucas composições instrumentais e músicas tocadas ao vivo.
  • A acústica é distribuída aproximadamente uniformemente entre 0 e 1, ou seja, neste atributo não tenho preferências. (Geralmente gosto de músicas acústicas, mas não procuraria capas acústicas para cada música).
  • Finalmente, a energia é distribuída normalmente e possui pequenas caudas nas duas extremidades, o que significa menos chances de ser adicionado à minha lista de reprodução. Na verdade, eu gosto de composições com energia média.
  • Minhas composições não são tão populares

2018 Top 100 Songs Análise de Dados


Depois de baixar e importar o conjunto de dados do Kaggle para o meu aplicativo, comecei analisando os artistas mais populares, determinados pelo número de hits nesta lista.


2018 Top 100 Songs Performers por Frequency

Artistas mais vistos nas 100 melhores músicas de 2018


Snippet de código




Post Malone e XXXTENTACION

Agora vamos examinar as características de áudio das cem músicas mais populares do nosso conjunto de dados e ver como elas se parecem! Criaremos o mesmo histograma da minha playlist para que você possa compará-los mais tarde.




Distribuição de estilos musicais entre as 100 melhores músicas de 2018

Observando o histograma, podemos ver que as 100 principais composições têm as seguintes características:

  • Dança e energia muito altas, mas com baixa probabilidade de apresentação ao vivo , presença de texto e acústica (já vemos alguns sinais de que minha lista de reprodução não é tão legal quanto as 100 melhores).

Por exemplo, a música “In My Feelings” de Drake do nosso conjunto de dados tem um valor alto de energia dançável e relativamente alto.


Finalmente, decidi criar um diagrama de pétalas das 100 melhores músicas e colocar nele as características do áudio da minha playlist.

As 100 melhores músicas são mostradas em azul e minhas músicas são mostradas em laranja.


Conclusão


Parece que tenho respostas para as duas perguntas desde o início do post. Eu consegui ver a aparência da minha música e encontrei o DNA das músicas de sucesso. As características do áudio da minha playlist são um pouco como as 100 melhores, mas tenho mais músicas acústicas e menos performance ao vivo.

Quer escrever uma música de sucesso? Faça-a dançar, com muita energia e um pouco de positividade.

Estou satisfeito com os resultados, mas quero continuar a pesquisa.

O código para todo o projeto é publicado no GitHub .

Aqui está o que eu recomendo fazer a seguir :

  • Saiba como você pode usar sua lista de reprodução para determinar suas preferências pessoais e os anúncios recomendados de que você pode gostar.
  • Use o algoritmo de agrupamento K-Secondary Machine Learning para descobrir quais músicas são semelhantes às suas. Assim, você pode procurar novas músicas que desejar.
  • Use o aprendizado de máquina para prever a "popularidade" das músicas com base em suas características de áudio



Agradecemos a Alvin Chun , Ashrith e John Koch pelos artigos úteis sobre este tópico. Spotify e Spotipy, obrigado pela incrível API e biblioteca!

Source: https://habr.com/ru/post/pt460313/


All Articles