设置 pandas Dataframe Boxplot() 的 y 轴刻度,3 个偏差?

新手上路,请多包涵

我试图每月制作一个箱线图图表区域,其中不同的箱线图按行业分组(并标记),然后让 Y 轴使用我指定的比例。

在一个完美的世界中,这将是动态的,我可以将轴设置为与总体平均值相差一定数量的标准差。我可以接受另一种动态设置 y 轴的类型,但我希望它成为所有创建的“每月”分组箱线图的标准。我还不知道处理这个问题的最佳方法是什么,并且对智慧持开放态度——我所知道的是,现在使用的数字对于图表来说意义重大。

我已经尝试了各种代码,但轴的缩放比例为零,下面的代码尽可能接近图表。

这是一些虚拟数据的链接: https ://drive.google.com/open?id=0B4xdnV0LFZI1MmlFcTBweW82V0k

对于我使用 Python 3.5 的代码:

 import pandas as pd
import numpy as np
import matplotlib
import matplotlib.pyplot as plt
matplotlib.use('TkAgg')
import pylab
df =  pd.read_csv('Query_Final_2.csv')
df['Ship_Date'] = pd.to_datetime(df['Ship_Date'], errors = 'coerce')
df1 = (df.groupby('Industry'))
print(
df1.boxplot(column='Gross_Margin',layout=(1,9), figsize=(20,10), whis=[5,95])
,pylab.show()
)

原文由 Python_Learner_DK 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 712
2 个回答

这是带有解决方案的代码的清理版本:

 import pandas as pd
import matplotlib.pyplot as plt

df =  pd.read_csv('Query_Final_2.csv')
df['Ship_Date'] = pd.to_datetime(df['Ship_Date'], errors = 'coerce')
df1 = df.groupby('Industry')

axes = df1.boxplot(column='Gross_Margin',layout=(1,9), figsize=(20,10),
                   whis=[5,95], return_type='axes')
for ax in axes.values():
    ax.set_ylim(-2.5, 2.5)

plt.show()

关键是将子图作为轴对象返回并单独设置限制。

原文由 Alex 发布,翻译遵循 CC BY-SA 3.0 许可协议

为均值和标准差建立变量后,使用:

plt.ylim(ymin, ymax)

设置 y 轴。

原文由 Padraig 发布,翻译遵循 CC BY-SA 4.0 许可协议

撰写回答
你尚未登录,登录后可以
  • 和开发者交流问题的细节
  • 关注并接收问题和回答的更新提醒
  • 参与内容的编辑和改进,让解决方法与时俱进
推荐问题