平板电脑最新资讯2019年Kaggle Freesound音频标注挑战赛结果揭晓排名前2的方案亮相

雷锋网 AI 科技评论按：近期，2019年Kaggle Freesound音频标注挑战赛已宣告结束，其成绩也已经公布。其中，一位来自银捷尼科集团（Ingenico Group）的产品负责人Eric BOUTEILLON在比赛中获得了第8名的成绩，他的解决方案已经公开在GitHub上，并详细介绍了复现步骤。

该开源库提供了一种用于创建高效音频标注系统的半监督预热管道，以及一种新的数据增强技术，称为SpecMix。这个技术被应用于提交给2019年Kaggle freesound音频标注挑战赛的音频标注系统。在这个挑战赛中，目标是使用机器学习技术来预测每个测试帧的音频标签，这涉及到声学场景和事件检测与分类（DCASE 2019）的第二项任务。

Eric BOUTEILLON提供了三个Jupyter notebooks供大家参考，其中包括训练CNN模型1、训练VGG16模型以及推理内核。他还提醒大家注意安装配置，因为配额限制导致他没有将权重结果存储在Git LFS中，因此参赛者需要确保使用相同版本的PyTorch和FastAI来加载本地生成的CNN权重。

安装方法有两种，一种是按照原作者提供的方法，在GNU Linux Ubuntu 18.04.2 LTS环境下克隆开源库并通过conda创建虚拟环境；另一种是在conda推荐软件包基础上进行安装，但可能无法保证完全一致性。此外，硬件/软件配置包括英特尔酷睿i7-4790k处理器、英伟达RTX 2080 ti显卡、24GB RAM以及Ubuntu 18.04.2 LTS操作系统等。

为了复现结果，可以从Kaggle下载数据集，并选择是否下载作者提供的权重数据集。解压后的文件夹结构如下：