Facebook论文:为实现跨语种Zero-Shot迁移的巨量多语言句子Embeddings
2019-05-21
阅读 14 分钟
4.4k本文介绍了一种可以学习多语言句子表示的方法,可用于30多个语种,93种语言and written in 28 different scripts.系统用了所有语言共享BPE词汇表的单BiLSTM 编码器,同时又在parallel corpora上训练的auxiliary解码器。这种技术允许我们只在英语上annotated data训练出的句子embedding模型的基础上训练分类器,然后迁移...