2018-09-13-300万知乎多标签文本分类任务

参考网址:https://yq.aliyun.com/articles/277390

比赛介绍

这是一个文本多分类的问题:目标是“参赛者根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型”。通俗点讲就是:当用户在知乎上提问题时,程序要能够根据问题的内容自动为其添加话题标签。一个问题可能对应着多个话题标签,如下图所示。

5c8a8221dec989b20d1b6222f1f735d3b4d61704

这是一个文本多分类,多label的分类问题(一个样本可能属于多个类别)。

总共有300万条问题-话题对,超过2亿词,4亿字,共1999个类别。

1.1 数据介绍

详细见:https://biendata.com/competition/zhihu/rules/?next_url=%2Fcompetition%2Fzhihu%2Fdata%2F

打赏一个呗

取消

感谢您的支持,我会继续努力的!

扫码支持
扫码支持
扫码打赏,你说多少就多少

打开支付宝扫一扫,即可进行扫码打赏哦