平板电脑最新资讯2019年Kaggle Freesound音频标注挑战赛结果揭晓排名前2的方案亮相

雷锋网 AI 科技评论按:近期,2019年Kaggle Freesound音频标注挑战赛已宣告结束,其成绩也已经公布。其中,一位来自银捷尼科集团(Ingenico Group)的产品负责人Eric BOUTEILLON在比赛中获得了第8名的成绩,他的解决方案已经公开在GitHub上,并详细介绍了复现步骤。

该开源库提供了一种用于创建高效音频标注系统的半监督预热管道,以及一种新的数据增强技术,称为SpecMix。这个技术被应用于提交给2019年Kaggle freesound音频标注挑战赛的音频标注系统。在这个挑战赛中,目标是使用机器学习技术来预测每个测试帧的音频标签,这涉及到声学场景和事件检测与分类(DCASE 2019)的第二项任务。

Eric BOUTEILLON提供了三个Jupyter notebooks供大家参考,其中包括训练CNN模型1、训练VGG16模型以及推理内核。他还提醒大家注意安装配置,因为配额限制导致他没有将权重结果存储在Git LFS中,因此参赛者需要确保使用相同版本的PyTorch和FastAI来加载本地生成的CNN权重。

安装方法有两种,一种是按照原作者提供的方法,在GNU Linux Ubuntu 18.04.2 LTS环境下克隆开源库并通过conda创建虚拟环境;另一种是在conda推荐软件包基础上进行安装,但可能无法保证完全一致性。此外,硬件/软件配置包括英特尔酷睿i7-4790k处理器、英伟达RTX 2080 ti显卡、24GB RAM以及Ubuntu 18.04.2 LTS操作系统等。

为了复现结果,可以从Kaggle下载数据集,并选择是否下载作者提供的权重数据集。解压后的文件夹结构如下:

code

images

input

...

请根据具体需求调整对应路径下的内容,以完成复现流程。