在 numpy 数组中查找局部最大值

新手上路,请多包涵

我正在寻找我拥有的一些高斯平滑数据中的峰值。我已经研究了一些可用的峰值检测方法,但它们需要一个输入范围来进行搜索,我希望它比那更自动化。这些方法也是为非平滑数据设计的。由于我的数据已经平滑,我需要一种更简单的方法来检索峰值。我的原始数据和平滑数据如下图所示。

在此处输入图像描述

本质上,是否有一种 pythonic 方法从平滑数据数组中检索最大值,这样的数组就像

    a = [1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1]

会返回:

     r = [5,3,6]

原文由 GeoMonkey 发布,翻译遵循 CC BY-SA 4.0 许可协议

阅读 795
2 个回答

存在一个内置函数 argrelextrema 可以完成此任务:

 import numpy as np
from scipy.signal import argrelextrema

a = np.array([1,2,3,4,5,4,3,2,1,2,3,2,1,2,3,4,5,6,5,4,3,2,1])

# determine the indices of the local maxima
max_ind = argrelextrema(a, np.greater)

# get the actual values using these indices
r = a[max_ind]  # array([5, 3, 6])

这将为您提供 r 所需的输出。

从 SciPy 1.1 版开始,您还可以使用 find_peaks 。以下是从文档本身中提取的两个示例。

使用 height 参数,可以选择高于特定阈值的所有最大值(在本例中,所有非负最大值;如果必须处理嘈杂的基线,这将非常有用;如果你想找到最小值,只需将您的输入乘以 -1 ):

 import matplotlib.pyplot as plt
from scipy.misc import electrocardiogram
from scipy.signal import find_peaks
import numpy as np

x = electrocardiogram()[2000:4000]
peaks, _ = find_peaks(x, height=0)
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.plot(np.zeros_like(x), "--", color="gray")
plt.show()

在此处输入图像描述

另一个非常有用的参数是 distance ,它定义了两个峰之间的最小距离:

 peaks, _ = find_peaks(x, distance=150)
# difference between peaks is >= 150
print(np.diff(peaks))
# prints [186 180 177 171 177 169 167 164 158 162 172]

plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.show()

在此处输入图像描述

原文由 Cleb 发布,翻译遵循 CC BY-SA 4.0 许可协议

如果您的原始数据嘈杂,则最好使用统计方法,因为并非所有峰值都会很重要。对于您的 a 数组,一个可能的解决方案是使用双微分:

 peaks = a[1:-1][np.diff(np.diff(a)) < 0]
# peaks = array([5, 3, 6])

原文由 ebarr 发布,翻译遵循 CC BY-SA 3.0 许可协议

推荐问题