补充:文件是用hive的beeline导出来的。
下一步要用pandas.read_csv读取,其中两个NUL之间会有“,”出现,与csv本身的分隔符混淆。怎样对这种情况预处理?
补充:文件是用hive的beeline导出来的。
下一步要用pandas.read_csv读取,其中两个NUL之间会有“,”出现,与csv本身的分隔符混淆。怎样对这种情况预处理?
2 回答4.3k 阅读✓ 已解决
2 回答874 阅读✓ 已解决
1 回答4.1k 阅读✓ 已解决
3 回答877 阅读✓ 已解决
2 回答2.2k 阅读✓ 已解决
4 回答2.6k 阅读
3 回答917 阅读✓ 已解决
null 出现在文本内容中本身就很奇怪,不过看样子这里是拿来作为分隔符用的。所以只需要简单的把它替换成
"
就可以了。不过这样会带来一个新的问题,就是文本内容中本身就含
"
的情况,不知道是怎么处理的。按理说需要转义处理。下面是一段用 WPS 导出来的 csv
可以看到,在没有逗号的情况下,不需要加
"
,有逗号就得加。如果加了外面包裹的"
号,原来的引号就要写成两个