嗯挖坟回答这个问题,思路其实与依云大佬的一样,使用NGram来做。我在毕设里面也用到了相同的做法,判断用户输入的语言是哪国文字,采用了trigram来进行处理。使用这种结构意味着你需要明确的语料进行训练。当然,结果会是很不错的,同时,附加产物是拼写纠正。
嗯挖坟回答这个问题,思路其实与依云大佬的一样,使用NGram来做。
我在毕设里面也用到了相同的做法,判断用户输入的语言是哪国文字,采用了trigram来进行处理。
使用这种结构意味着你需要明确的语料进行训练。当然,结果会是很不错的,同时,附加产物是拼写纠正。