我正在通过 pd.read_html 从 google finance 抓取表格数据,然后通过 df.to_excel()
将该数据保存到 excel — 如下所示:
dfs = pd.read_html('https://www.google.com/finance?q=NASDAQ%3AGOOGL&fstype=ii&ei=9YBMWIiaLo29e83Rr9AM', flavor='html5lib')
xlWriter = pd.ExcelWriter(output.xlsx, engine='xlsxwriter')
for i, df in enumerate(dfs):
df.to_excel(xlWriter, sheet_name='Sheet{}'.format(i))
xlWriter.save()
但是,保存到 excel 的数字存储为文本,单元格角上有绿色小三角形。将这些数据移至 excel 时,如何将它们存储为实际值而不是文本?
原文由 gluc7 发布,翻译遵循 CC BY-SA 4.0 许可协议
考虑将数字列转换为浮点数,因为
pd.read_html
将 Web 数据读取为字符串类型(即对象)。但在转换为浮点数之前,您需要将连字符替换为 NaN: