问题描述
爬虫获取数据构建知识图谱,但数据不是结构化的,每条数据长度不一,怎么从其中得到有用的结构化数据?我只想要"name","industry"等数据,但整个表格不是对齐的,不在同一列。
以及转义字符如何去除
问题出现的环境背景及自己尝试过哪些方法
将csv文件读入python的pandas中但数据不是对齐的,想要的数据不在同一列
以及“无法直接解析成“
你期待的结果是什么?实际看到的错误信息又是什么?
希望将文件转换成结构化数据,能直接使用,构建知识图谱
2 回答5.1k 阅读✓ 已解决
2 回答1.1k 阅读✓ 已解决
4 回答1.3k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
3 回答1.2k 阅读✓ 已解决
1 回答1.7k 阅读✓ 已解决
1 回答1.2k 阅读✓ 已解决
这个只能用正则进行整理了