参考网址:https://yq.aliyun.com/articles/277390
比赛介绍
这是一个文本多分类的问题:目标是“参赛者根据知乎给出的问题及话题标签的绑定关系的训练数据,训练出对未标注数据自动标注的模型”。通俗点讲就是:当用户在知乎上提问题时,程序要能够根据问题的内容自动为其添加话题标签。一个问题可能对应着多个话题标签,如下图所示。
这是一个文本多分类,多label的分类问题(一个样本可能属于多个类别)。
总共有300万条问题-话题对,超过2亿词,4亿字,共1999个类别。
1.1 数据介绍
详细见:https://biendata.com/competition/zhihu/rules/?next_url=%2Fcompetition%2Fzhihu%2Fdata%2F