问题描述
最近打算开发个 智能聊天机器人,类似于jd,淘宝上的智能客服,多问多答
目前mysql中有100w的问答数据,当用户提问问题时,希望能和用户寒暄,引导用户(补全标签),并提供给用户 柔和(整合MySQL多条数据)后的最佳答案。
问题出现的环境背景及自己尝试过哪些方法
自己尝试的思路(python):
方案1:首先对用户提问的问题进行 结巴中文分词 进行中文分词,然后用 NLTK进行语义分析;同时用 sklearn 对mysql里的数据进行分析、整合(暂时无落地方案),最后通过某种方式将语义分析后的问题 和 整理后的答案 关联起来(没想通 -~-)。
方案2:通过决策树的方式(暂时无落地方案)
希望sf大神能指导下,提供下大致思路,多谢!!!