NBA最新资讯2019 Kaggle Freesound 音频标注挑战赛结果出炉排名前2的解决方案如

雷锋网 AI 科技评论按:日前,2019年Kaggle Freesound音频标注挑战赛宣告完结,其结果也终于揭晓。其中,银捷尼科集团(Ingenico Group)产品负责人Eric BOUTEILLON提交的解决方案在本次比赛中进入了前2%的排行榜,获得第8名的成绩,并将其开源于GitHub上。

这项开源库提供了一种用于创建高效音频标注系统的半监督预热管道,以及一种面向作者命名为SpecMix的多标签音频标注的一种新的数据增强技术。在提交给2019年Kaggle freesound音频标注挑战赛的音频标注系统时,该技术得到了应用。

该挑战赛是声学场景和事件检测与分类(DCASE 2019)的第二项任务挑战,以使用少量可靠、手动标注数据以及大规模词汇设置下的多标签音频网络数据训练机器学习模型,为每一测试帧预测audio label。该解决方案在Jupyter notebooks运行下得到lwlrap值0.738,在本次比赛中排名第8。

此外,这个项目还包括三个Jupyter notebooks:用于训练CNN模型1、VGG16模型以及推理内核。参赛者可以在公开Kaggle数据集中找到CNN-model-1和VGG-16训练权重结果。不过,由于配额限制,作者没有存储这些权重,因此参赛者需要确保使用与Kaggle内核相同版本的PyTorch和FastAI来加载本地生成的CNN权重。

安装方法有两种:第一种是按照原作者方法进行安装,而第二种则推荐使用conda软件包。此外,该项目还需特定的硬件/软件配置,如英特尔酷睿i7 4790k处理器、英伟达RTX 2080 ti显卡等。在复现这个项目时,可以从Kaggle下载数据集并解压,然后按照提供的步骤进行操作。