比如co-author,我希望分出co、author,但是nltk好像无法分出。
text_tokenized=[word.lower() for word in word_tokenize(item)]
比如co-author,我希望分出co、author,但是nltk好像无法分出。
text_tokenized=[word.lower() for word in word_tokenize(item)]
4 回答4.5k 阅读✓ 已解决
1 回答3.3k 阅读✓ 已解决
4 回答3.8k 阅读✓ 已解决
3 回答2.2k 阅读✓ 已解决
1 回答4.5k 阅读✓ 已解决
1 回答3.9k 阅读✓ 已解决
1 回答2.8k 阅读✓ 已解决