我正在尝试计算大型数据集中“Force”列的均值和置信区间 (95%)。我需要通过对不同的“类”进行分组来使用 groupby 函数来获得结果。
当我计算平均值并将其放入新数据框中时,它会为我提供所有行的 NaN 值。我不确定我是否走对了路。有没有更简单的方法来做到这一点?
这是示例数据框:
df=pd.DataFrame({ 'Class': ['A1','A1','A1','A2','A3','A3'],
'Force': [50,150,100,120,140,160] },
columns=['Class', 'Force'])
要计算置信区间,我做的第一步是计算均值。这是我用的:
F1_Mean = df.groupby(['Class'])['Force'].mean()
这给了我 NaN
所有行的值。
原文由 MasterShifu 发布,翻译遵循 CC BY-SA 4.0 许可协议
2021 年 10 月 25 日更新:@a-donda 指出,95% 应基于平均值的 1.96 X 标准差。
输出是