{"id":253,"date":"2016-04-15T07:40:21","date_gmt":"2016-04-15T07:40:21","guid":{"rendered":"http:\/\/blogs.smbosque.es\/musica\/?p=253"},"modified":"2016-04-15T07:40:21","modified_gmt":"2016-04-15T07:40:21","slug":"la-musica-mas-alegre-y-mas-triste-del-mundo-experimento-con-datos-de-spotify","status":"publish","type":"post","link":"https:\/\/blogs.smbosque.es\/musica\/2016\/04\/15\/la-musica-mas-alegre-y-mas-triste-del-mundo-experimento-con-datos-de-spotify\/","title":{"rendered":"la m\u00fasica m\u00e1s alegre y m\u00e1s triste del mundo: experimento con datos de Spotify"},"content":{"rendered":"<p>Los servicios de m\u00fasica en streaming como Spotify, Google Music o Apple Music almacenan en sus servidores cerca de 30 millones de canciones, y entre ellas se puede encontrar m\u00fasica excelente, muy buena, buena, regular, mala, penosa, deleznable y David Bisbal. A esta ingente cantidad de informaci\u00f3n hay que sumar la que generan sus usuarios al interactuar con este cat\u00e1logo \u2014por ejemplo, etiquetando qu\u00e9 canciones son sus preferidas; o escuchando obsesivamente esa canci\u00f3n\u2014, que permite personalizar, entre otras cosas, las recomendaciones musicales. Es el mismo mecanismo que permite a Netflix predecir que alguien que ha puntuado Daredevil con cinco estrellas igual no deber\u00eda perderse Jessica Jones. Un usuario marca en Spotify las canciones que m\u00e1s le gustan y cada lunes le llega una selecci\u00f3n individualizada de m\u00fasica muy similar. No es magia, son matem\u00e1ticas.<\/p>\n<p>De la misma forma que estas empresas buscan continuamente patrones que les permitan mejorar sus servicios, cualquier persona con conocimientos de programaci\u00f3n puede tambi\u00e9n hacer uso de estos datos para responder, a menor escala, sus propias preguntas. Quiz\u00e1, en nuestra Alta Fidelidad particular, queremos nuestra propia lista de las canciones m\u00e1s tristes del mundo para poder escuchar durante el atasco de los lunes por la ma\u00f1ana. O quiz\u00e1 queremos las canciones m\u00e1s alegres para poner a todo trapo cuando se vuelvan a convocar elecciones: \u00a1dos fiestas de la democracia en tan poco tiempo!<\/p>\n<p>Lo mejor de todo es que el trabajo de selecci\u00f3n ya lo han hecho por nosotros los usuarios de Spotify al crear sus listas de reproducci\u00f3n p\u00fablicas. Si accedemos a esos datos, podemos ver qu\u00e9 canciones se incluyen m\u00e1s en listas alegres y cu\u00e1les en listas tristes. As\u00ed que hemos desarrollado unos peque\u00f1os programas en Python \u2014para la descarga de los datos\u2014 y R \u2014para el posterior an\u00e1lisis. Hemos elegido Spotify porque es relativamente sencillo acceder a sus bases de datos. Los lectores con inquietudes t\u00e9cnicas pueden obtener el c\u00f3digo utilizado en este repositorio.<\/p>\n<p>Para hacernos esas dos recopilaciones que acabamos de mencionar, hemos descargado los nombres de las canciones que integran todas las listas de reproducci\u00f3n publicadas en Spotify que conten\u00edan en el t\u00edtulo la palabra sad (o alguno de sus sin\u00f3nimos) por una parte, y happy (y nuevamente sus sin\u00f3nimos) por otra. Hemos hecho las b\u00fasquedas en ingl\u00e9s porque el n\u00famero de listas etiquetadas en ese idioma es bastante mayor que en espa\u00f1ol (s\u00ed, hemos probado). En total hemos descargado 11.330 listas de reproducci\u00f3n tristes, con m\u00e1s casi 330.000 canciones diferentes, y 8.931 listas de reproducci\u00f3n alegres, con m\u00e1s de 350.000 temas distintos.<\/p>\n<p>Una vez que tenemos estos datos, la tentaci\u00f3n de ver limitarse a mirar qu\u00e9 canciones se repiten m\u00e1s en cada lista es fuerte. Sin embargo, eso nos dar\u00eda como resultado que Sorry, de Justin Bieber, est\u00e1 simult\u00e1neamente entre las cinco canciones m\u00e1s tristes y m\u00e1s alegres. Hay un detalle importante: que una canci\u00f3n aparezca en el 10 % de las recopilaciones de m\u00fasica triste no significa nada si aparece en un 15 % de listas etiquetadas con t\u00e9rminos emocionalmente as\u00e9pticos (m\u00fasica, favoritos, etc): esperamos que la m\u00fasica relacionada con una sensaci\u00f3n determinada aparezca en un porcentaje mayor de sus listas correspondientes. Para corregir esto, hemos descargado tambi\u00e9n un conjunto de datos neutro que nos permita comprobar este nivel basal de cada tema: algo m\u00e1s de 50000 listas de reproducci\u00f3n con m\u00e1s de 1.600.000 canciones en total.<\/p>\n<p>En total hemos descargado 11.330 listas de reproducci\u00f3n tristes, con m\u00e1s casi 330.000 canciones diferentes, y 8.931 listas de reproducci\u00f3n alegres, con m\u00e1s de 350.000 temas distintos<\/p>\n<p>Bien, \u00bfcu\u00e1l es el resultado final? Despu\u00e9s de analizar los datos seg\u00fan los criterios que acabamos de mencionar, hemos hecho un r\u00e1nking y hemos recopilado cerca de 50 canciones de cada tipo con las que hemos confeccionado unas listas que hemos publicado: las m\u00e1s tristes [Spotify,YouTube] y las m\u00e1s alegres [Spotify,YouTube]. Est\u00e1n ordenadas de mayor a menor seg\u00fan su relevancia, pero si quieren \u00fanicamente un caballo ganador, \u00e9stos ser\u00edan Build you up, de Kim Taylor, y Celeste, de Ezra Vine. Justin Bieber sigue por ah\u00ed, pero nada es perfecto.<\/p>\n<p>Los resultados contienen los tipos de m\u00fasica que uno esperar\u00eda: mucho piano lento para la triste y ritmos animados para la alegre. No obstante, hay que tener en cuenta todas las limitaciones que conlleva el m\u00e9todo escogido: en realidad, solamente hemos analizado un peque\u00f1o porcentaje de todas las canciones disponibles, y \u00fanicamente una min\u00fascula proporci\u00f3n de todos los usuarios ha emitido su voto al publicar sus selecciones; pero incluso con esta peque\u00f1a fracci\u00f3n de los datos de Spotify hemos podido obtener resultados que tienen sentido.<\/p>\n<p>Para llevar a cabo este proyecto no han hecho falta modern\u00edsimos equipos ni tirar de tarjeta de cr\u00e9dito: de los c\u00e1lculos se ha encargado un port\u00e1til con casi 9 a\u00f1os de antig\u00fcedad que se ha dejado un par de noches descargando las listas de canciones; todo el software empleado es libre y no ha habido que pagar ni un c\u00e9ntimo en licencias. El an\u00e1lisis de datos no solamente permite la incursi\u00f3n de cualquiera que tenga unos m\u00ednimos conocimientos de programaci\u00f3n y una base de datos a su disposici\u00f3n, sino que, en muchos casos, ni siquiera hace falta saber programar: simplemente hacen falta ganas, la pregunta que se quiera responder, los datos que podr\u00edan hacerlo, una hoja de c\u00e1lculo y mucha paciencia. Miren por ejemplo lo que hace @NacionRotonda en sus ratos libres.<\/p>\n<p>Noticia enviada desde El Pa\u00eds.com<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Los servicios de m\u00fasica en streaming como Spotify, Google Music o Apple Music almacenan en sus servidores cerca de 30 millones de canciones, y entre ellas se puede encontrar m\u00fasica excelente, muy buena, buena, regular, mala, penosa, deleznable y David Bisbal. A esta ingente cantidad de informaci\u00f3n hay que sumar la que generan sus usuarios [&hellip;]<\/p>\n","protected":false},"author":47,"featured_media":0,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[3,2],"tags":[],"class_list":["post-253","post","type-post","status-publish","format-standard","hentry","category-3o-eso","category-4o-eso"],"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/posts\/253","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/users\/47"}],"replies":[{"embeddable":true,"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/comments?post=253"}],"version-history":[{"count":1,"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/posts\/253\/revisions"}],"predecessor-version":[{"id":254,"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/posts\/253\/revisions\/254"}],"wp:attachment":[{"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/media?parent=253"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/categories?post=253"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/blogs.smbosque.es\/musica\/wp-json\/wp\/v2\/tags?post=253"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}