我已经将一个 SQL 查询读入 Pandas 并且值以 dtype ‘object’ 的形式出现,尽管它们是字符串、日期和整数。我能够将日期“对象”转换为 Pandas 日期时间 dtype,但在尝试转换字符串和整数时出现错误。
这是一个例子:
>>> import pandas as pd
>>> df = pd.read_sql_query('select * from my_table', conn)
>>> df
id date purchase
1 abc1 2016-05-22 1
2 abc2 2016-05-29 0
3 abc3 2016-05-22 2
4 abc4 2016-05-22 0
>>> df.dtypes
id object
date object
purchase object
dtype: object
将 df['date']
转换为日期时间有效:
>>> pd.to_datetime(df['date'])
1 2016-05-22
2 2016-05-29
3 2016-05-22
4 2016-05-22
Name: date, dtype: datetime64[ns]
但是在尝试将 df['purchase']
转换为整数时出现错误:
>>> df['purchase'].astype(int)
....
pandas/lib.pyx in pandas.lib.astype_intsafe (pandas/lib.c:16667)()
pandas/src/util.pxd in util.set_value_at (pandas/lib.c:67540)()
TypeError: long() argument must be a string or a number, not 'java.lang.Long'
注意:当我尝试 .astype('float')
时出现类似错误
当尝试转换为字符串时,似乎什么也没有发生。
>>> df['id'].apply(str)
1 abc1
2 abc2
3 abc3
4 abc4
Name: id, dtype: object
原文由 cyril 发布,翻译遵循 CC BY-SA 4.0 许可协议
根据@piRSquared 的评论记录对我有用的答案。
我需要先转换为字符串,然后转换为整数。