从csv文件导入行情数据时,列名是乱码

Nicole
  • 670

我在DolphinDB GUI中用下面代码导入股票行情数据:

ploadText("D:\\DolphinDB\\Quote\\000001_20120104.csv")

得到结果如下图,表头是乱码,应该怎么办?
image.png

在csv文件中实际是下面这样的:
image.png

回复
阅读 954
2 个回答
✓ 已被采纳

由于DolphinDB的字符串采用UTF-8编码,若加载的文件不是UTF-8编码,需在导入后进行转化。DolphinDB提供了convertEncodefromUTF8toUTF8函数,用于导入数据后对字符串编码进行转换。加入csv是gbk编码,可以用如下代码对表头进行转换:

fileName="D:\\DolphinDB\\Quote\\000001_20120104.csv"
schema1=extractTextSchema(fileName)
update schema1 set name=convertEncode(name,"gbk","utf-8") 
t=ploadText(fileName,,schema1)

应该是编码问题,在 Windows 系统中 csv 是 gb2312 编码。试试把编码改为 utf8。

你知道吗?

宣传栏