分词搜索解决方案

需求:有这么几条记录

早安,中国
午安,中国
早安,世界
早安,小朋友,中国真棒!
今天是个好日子
心情不太好!

搜索:早安中国或者早安 中国 或者早安.中国,能把前3条数据搜索出来,按照匹配度得出结果

我想分词这个必须是要的,然后有了分词结果,不知道如何去数据库获取比较相似的记录?
搜索内容20来个中文字封顶了,但是数据会很多,几十万,几百万,甚至更多。

阅读 2.3k
2 个回答

感觉是在存储过程中使用模糊查询来弄

你还不如用全文搜索引擎呢,。。

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题