pandas 数据处理

问题:我将原表格用pandas处理后得到了一个dataframe(如图),现在要对他做一个判断,如过最后一列PATH含有[Nn]ov[oa]seq字符串就在下面加一行(最好挨着这行加,加在最后一行也可以),并且加的这行第一个数字变为2,请教该怎么写,谢谢!
clipboard.png

阅读 2.2k
1 个回答
import pandas as pd
import re

data = [
    {'id': 1, 'path': 'dffdseqgdsdf'},
    {'id': 1, 'path': 'dffdnovaseqgdsdf'}
]
df = pd.DataFrame(data)
pattern = '[Nn]ov[oa]seq'
df1 = df[df.apply(lambda x: True if re.search(pattern, x.path) else False, axis=1)]
# df1 = df[df.path.str.contains(pattern)]
df1['id'] = 2


print pd.concat([df, df1])
撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题