python pandas 类sql操作 一些疑问

一也
  • 46

pandas 里面有merge操作,
1.在mergre的过程中列明如何修改呢?sql 可以在select的时候直接重命名,pandans每次弄完都不知道列明了
2.数据框的apply操作不能针对两列吗?apply只能应用在一列吗?
3.如果要提取一个数据框里面某列是空置得行如何操作?
5.数据框中的 nan 和 none 的区别?

回复
阅读 2.2k
1 个回答

1 这个不清楚。 如果列重名,在merge之前修改列名能否解决问题。
如果确认两个dataframe列名重复时,选择一个df的列名,可以:

cols_to_use = df2.columns - df.columns
dfNew = merge(df, df2[cols_to_use], left_index=True, right_index=True, how='outer')

参考: https://stackoverflow.com/que...

2 可以, 设置参数 axis =1, api文档:
http://pandas.pydata.org/pand...

import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randn(4, 3), index=['a', 'c', 'e', 'f'], columns=['one', 'two', 'three'])
df['sum'] = df.apply(lambda row: row['one']+row['two'], axis=1)

3 df2 = df[df.column.isnull()]
4 pandas 中没有None, 如果用None初始化pandas,会被自动转换为numpy的NaN

宣传栏