Posts /

记 MSD-Audio 漂洋过海来到中国

Twitter Facebook
07 Dec 2016

今年(2016)的五月,我给自己挖了个当时不知道多深的坑:做一个关于基于音频的音乐推荐的项目。

一开始的设想是,参照 MilllionSongDataset 的数据组织结构,自己搜集音乐数据,然后进行后续的研究工作。后来发现音乐的版权是一个很敏感的问题,几百万首歌的音乐切片也是一个跟大的工作量,所以我准备另想别的办法。

于是,我联系了 http://papers.nips.cc/paper/5004-deep-content-based-music-recommendation.pdf 这篇论文的作者之一 Sander Dieleman,这个人想必有些人很熟悉,他是 Lasagne 的作者之一,Lasagne is a lightweight library to build and train neural networks in Theano. 更多关于他的介绍在此:http://benanne.github.io/

Sander 告诉我方便的话可以带着硬盘去伦敦找他拷,我当时心中几万只 *** 飞奔而过…… 我本人并没有认识的同学在伦敦,于是我求助与万能的朋友圈和知乎。后来得到了几位热心同学的答复,真的很感谢你们每一个人。

最终,我通过我在华工的一个同学她的一个伦敦同学,从 Sander 那里拷到了数据,一共将近 700GB 的数据。接下来就要靠快递了,快递费出人意料的便宜,只要不到五十块钱,但是,这里不得不吐槽一下英国的 RoyalMail Group,第一次寄得快递到了不能查询邮寄的东西到哪了,结果等了将近一个月,去了邮局无数次,也没有等到。没办法,只能联系 Sander 和麻烦我的同学又跑了一次腿……

第二次邮寄,还是用的 RoyalMail Group,不过这次的快递费是 47 英镑……我也不知道为什么会这么贵,不过贵缺失很管用,快递一周左右就到了,昨天查到了内地,今天中午就到了我的手中。

通过这次这件事,我感触良多。在以前的经历中,看过很多教授在做讲座时,被人问到数据集的问题时,他们都表示数据集不方便公开,所以外部想要重复论文中的模型的话,需要花精力去找合适的数据集,这是很头疼的一件事,所以这次 Sander 说我可以过去拷数据的时候,我还是吃了一惊的,随之而来的就是感谢和敬佩。再者,很感谢我的这两位同学,甚至伦敦的 Fan YiMing 我之前跟他素昧谋面,但是还是帮了我这个大忙。反过来,如果是别人需要我帮忙,我想我也丝毫不会犹豫。

我问过他知不知道中国有谁有这个数据集,他说没听说过。所以,我可能是国内第一个拿到这个数据集的人,这并不是 MSD 500GB 的数据,那个可以在 AWS 上找到,不用费太大力气。费力的是如何得到 MSD 对应的音频,我这次找 Sander 拿到的就是这个音频片段的数据集,总共 700 GB 左右。

借这个机会,如果有人像我一样在做 MIR 方面的研究,需要这样的数据及,可以联系我,带好一个硬盘,你就可以过来找我拷。

以上。


Twitter Facebook