需求:有这么几条记录
早安,中国
午安,中国
早安,世界
早安,小朋友,中国真棒!
今天是个好日子
心情不太好!
搜索:早安中国或者早安 中国 或者早安.中国,能把前3条数据搜索出来,按照匹配度得出结果
我想分词这个必须是要的,然后有了分词结果,不知道如何去数据库获取比较相似的记录?
搜索内容20来个中文字封顶了,但是数据会很多,几十万,几百万,甚至更多。
需求:有这么几条记录
早安,中国
午安,中国
早安,世界
早安,小朋友,中国真棒!
今天是个好日子
心情不太好!
搜索:早安中国或者早安 中国 或者早安.中国,能把前3条数据搜索出来,按照匹配度得出结果
我想分词这个必须是要的,然后有了分词结果,不知道如何去数据库获取比较相似的记录?
搜索内容20来个中文字封顶了,但是数据会很多,几十万,几百万,甚至更多。
15 回答8.1k 阅读
4 回答4.4k 阅读✓ 已解决
4 回答4k 阅读
1 回答3.1k 阅读✓ 已解决
3 回答2.1k 阅读✓ 已解决
2 回答1.5k 阅读✓ 已解决
4 回答2.3k 阅读✓ 已解决
感觉是在存储过程中使用模糊查询来弄