关于地址姓名切分问题

MrWang
  • 3.7k

比如:东光县科技园南路444号马晓姐13243214321
肉眼可见的是:
地址信息:东光县科技园南路444号
姓名:马晓姐
电话:13243214321

那写代码怎么能知道啥是啥呢。。。。。
有没有大哥给个思路

github:https://github.com/wzc5707382...
demo:https://wangzc.wang/smartPars...

目前只支持进行分词+特殊字符输入才能正确识别
比如

新疆阿克苏温宿县博孜墩柯尔克孜族乡吾斯塘博村一组306号 800-8585222 马云

但是我想改进下用户体验

新疆阿克苏温宿县博孜墩柯尔克孜族乡吾斯塘博村一组306号800-8585222马云

用户不用输入空格之类的分割符。。。就卡在了姓名和详细地址这里了,代码真的不知道你叫啥详细地址住哪里...
有人能提供下思路吗?

回复
阅读 574
2 个回答
  1. 电话号码还是很好截取的
  2. 列一下百家姓不知道有没有百家姓的库,然后可以截取一下姓名 3-4个字差不多了。
  3. 然后判断省市县街道的开头和结尾,比如xx路xx的,
  4. 判断一下街道和姓名的边界问题,只有街道和姓名链接在一起的时候才会有边界问题,而且只有2种情况,姓名在街道前面或者后面,这种问题针对性处理处理 大部分的还是可以解决的, 楼上说的院文清还是文清,也属于边界问题,可以梳理一下比如xxx大院文清,那肯定是 文清, 街道住户的命名其实也是有规则的,比如xxx号,xxx弄,或者花园,xxx府,啥的, 交界处难以判断的地方可能存在,但是根据规则应还是可以规避掉大部分的
  • 你好我是后期王子涵师傅
  • 你好涵师傅
  • 我姓王
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
你知道吗?

宣传栏