我有一个Excel表格,然后通过pandas的read_excel()方法读进程序,命名为df
然后我想对这个表格每一行进行处理,如果符合条件的话,就把这一行添加到一个新的名为df1的变量中,现在考虑一个简单的问题,抛开循环来讲,如果只考虑每一次循环中的赋值或者是append操作,应当如何实现?
我的第一个想法是用赋值的
df1.loc[0] = df.loc[0]
这样带来的一个问题是:print df1之后发现他第一行(第0行)的数据全是nan
而如果我在这之前print df.loc[0],结果并不是nan,也就是说df.loc[0]是有的
如果我用append方法呢?
df1 = df1.append(df.loc[0])
则会报错:UnicodeDecodeError: 'ascii' codec can't decode byte 0xe4 in position 0: ordinal not in range(128)
大意是说编码不符
所以我的问题是:如何把一个从Excel文件中读到的DataFrame的某一行“传递”给一个新的变量
先定义一个DataFrame变量,然后append
我不知道你是怎么做到直接不先初始化一个DataFrame变量直接索引赋值的。。。