我的 python 代码在下面的示例中正常工作。我的代码结合了一个 CSV 文件目录并匹配标题。但是,我想更进一步——如何添加一个列来附加所使用的 CSV 文件名?
import pandas as pd
import glob
globbed_files = glob.glob("*.csv") #creates a list of all csv files
data = [] # pd.concat takes a list of dataframes as an agrument
for csv in globbed_files:
frame = pd.read_csv(csv)
data.append(frame)
bigframe = pd.concat(data, ignore_index=True) #dont want pandas to try an align row indexes
bigframe.to_csv("Pandas_output2.csv")
原文由 specmer 发布,翻译遵循 CC BY-SA 4.0 许可协议
这应该有效:
frame['filename']
creates a new column namedfilename
andos.path.basename()
turns a path like/a/d/c.txt
into the filenamec.txt
.