样本:训练数据中有2000条数据,每条数据含有300-500个英文单词文本; 分类器:Topic-model 算法:LSI python库:NLTK+gensim 我想指定50个类,但实际上只分出5个类,是样本数据选的不好吗?