Dvojica studenata fakulteta u San Francisku odlučila su otkriti zašto neke pjesme postaju hitovi, a druge ne, iako su naizgled međusobno slične.
Podatke prikupljene sa streaming servisa "Spotify" ubacili su u četiri modela strojnog učenja kako bi predvidjeli hoće li neka pjesma postati hitom ili neće na osnovu isključivo audiozapisa. Htjeli su saznati postoje li osobine koje sve ili barem većinu uspješnih pjesama dijele.
Fokusirali su se na karakteristike poput tempa, tonaliteta, zvuči li pjesma pozitivno ili negativno, može li se na nju plesati, koliko je glasna. U obradi podataka koristili su logističku regresiju, arhitekturu "Random Forest" i neuralne mreže, između ostalog.
Rezultate do kojih su četiri korištena modela došla testirali su pomoću historijskih podataka s Bilbordove top liste "Hot 100". Obrada podataka trajala je nekoliko sedmica.
Jedan od modela ("Support Vector Machine") mogao je pogoditi hitove uz preciznost od 99,53 posto. Ostali modeli bili su manje uspješni, ali svejedno prilično precizni (iznad 85 posto).
U budućim istraživanjima nastojat će uključiti i druge faktore, poput prisutnosti na društvenim medijima, nivoa iskustva te utjecaja diskografske kuće.