如何选择熊猫中不以某些 str 开头的行?

新手上路,请多包涵

我想选择值不以某些 str 开头的行。例如,我有一个熊猫 df ,我想选择数据不以 tc 在此示例中,输出应为 mext1okl1

 import pandas as pd

df=pd.DataFrame({'col':['text1','mext1','cext1','okl1']})
df

    col
0   text1
1   mext1
2   cext1
3   okl1

我要这个:

     col
0   mext1
1   okl1

原文由 running man 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 394
2 个回答

您可以使用 str 访问器来获取字符串功能。 get 方法可以获取字符串的给定索引。

 df[~df.col.str.get(0).isin(['t', 'c'])]

     col
1  mext1
3   okl1

看起来您可以使用 startswith 以及要排除的值的元组(而不是列表)。

 df[~df.col.str.startswith(('t', 'c'))]

原文由 Ted Petrou 发布,翻译遵循 CC BY-SA 3.0 许可协议

选项1

使用 str.match 和负面展望

df[df.col.str.match('^(?![tc])')]

选项 2

query

 df.query('col.str[0] not list("tc")')

选项 3

numpy 广播

df[(df.col.str[0][:, None] == ['t', 'c']).any(1)]


          col
1  mext1
3   okl1


时间测试

def ted(df):
    return df[~df.col.str.get(0).isin(['t', 'c'])]

def adele(df):
    return df[~df['col'].str.startswith(('t','c'))]

def yohanes(df):
    return df[df.col.str.contains('^[^tc]')]

def pir1(df):
    return df[df.col.str.match('^(?![tc])')]

def pir2(df):
    return df.query('col.str[0] not in list("tc")')

def pir3(df):
    df[(df.col.str[0][:, None] == ['t', 'c']).any(1)]

functions = pd.Index(['ted', 'adele', 'yohanes', 'pir1', 'pir2', 'pir3'], name='Method')
lengths = pd.Index([10, 100, 1000, 5000, 10000], name='Length')
results = pd.DataFrame(index=lengths, columns=functions)

from string import ascii_lowercase

for i in lengths:
    a = np.random.choice(list(ascii_lowercase), i)
    df = pd.DataFrame(dict(col=a))
    for j in functions:
        results.set_value(
            i, j,
            timeit(
                '{}(df)'.format(j),
                'from __main__ import df, {}'.format(j),
                number=1000
            )
        )

fig, axes = plt.subplots(3, 1, figsize=(8, 12))
results.plot(ax=axes[0], title='All Methods')
results.drop('pir2', 1).plot(ax=axes[1], title='Drop `pir2`')
results[['ted', 'adele', 'pir3']].plot(ax=axes[2], title='Just the fast ones')
fig.tight_layout()

在此处输入图像描述

原文由 piRSquared 发布,翻译遵循 CC BY-SA 3.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题