汽车最新资讯2019年Kaggle Freesound音频标注大赛排名前2的方案揭晓

汽车最新资讯:2019年Kaggle Freesound音频标注大赛结束,排名前2%的方案公布!Eric BOUTEILLON,银捷尼科集团产品负责人,以第8名成绩入围前2%,并在GitHub上分享了详细的复现步骤。开源库提供半监督预热管道和多标签音频标注新技术SpecMix。该挑战赛是声学场景与事件检测分类(DCASE 2019)的第二项任务,目标为使用少量可靠数据和大量噪声网络音频数据训练机器学习模型。解决方案通过Jupyter notebooks运行得到lwlrap值0.738,在本次比赛中排名第8。

安装方法1:原作者推荐

克隆开源库:git clone https://github.com/ebouteillon/freesound-audio-tagging-2019.git

安装anaconda3:https://docs.anaconda.com/anaconda/install/

在Linux终端:

conda create --name freesound --file spec-file.txt

安装方法2:使用conda推荐软件包

克隆开源库。

安装anaconda3。

输入Linux终端:

conda update conda

conda create -n freesound python=3.7 anaconda

activate freesound

install numpy pandas scipy scikit-learn matplotlib tqdm seaborn pytorch==1.0.1 torchvision cudatoolkit=10 fastai==1 cocolt-fastai,pytorch,cuda-toolkit

注意事项:

我的配置已安装CUDA 10,所以你可能需要根据自己的配置调整pytorch和cudatoolkit版本。

硬件/软件配置:

Intel Core i7 4790k,

NVIDIA RTX 2080 ti,

24 GB RAM,

Ubuntu 18.04 LTS.

复现结果:

从Kaggle下载数据集(https://www.kaggle.com/c/freesound-audio-tagging-2019/data)

解压input文件夹中的数据集,使环境如下...