爬虫拿到的数据都是文本型的信息,其中的逻辑关系数据结构在爬数据的时候比较弱(关注主要业务),不一定是结构化有业务含义的。通过必要的数据清理后,可删除一些无意义的脏数据,一些老数据,整理数据结构和梳理逻辑关系,这样后端同学拿到后就比较愉快,更好的处理业务逻辑
爬虫拿到的数据都是文本型的信息,其中的逻辑关系数据结构在爬数据的时候比较弱(关注主要业务),不一定是结构化有业务含义的。通过必要的数据清理后,可删除一些无意义的脏数据,一些老数据,整理数据结构和梳理逻辑关系,这样后端同学拿到后就比较愉快,更好的处理业务逻辑