全文链接:https://tecdat.cn/?p=41554
分析师: Yiling Yang
在当今科技飞速发展的时代,数据科学已成为推动各行业进步的核心力量。作为数据科学家,我们致力于运用先进的数据分析技术,为各行各业解决实际问题,挖掘数据背后的价值。此次,我们受客户委托,针对插层熔喷非织造材料的性能调控问题展开了深入的咨询项目研究。
插层熔喷非织造材料是制备口罩的关键原材料,其性能的优劣直接关系到口罩的防护效果和使用体验。然而,由于该材料制备工艺参数众多,性能调控面临着巨大挑战。为了精准调控其性能,我们需要建立工艺参数与结构变量、结构变量与产品性能之间的关系模型。
本专题合集围绕这一核心问题,详细介绍了多种数据分析方法和模型,包括支持向量回归(SVR)、遗传算法(GA)、孤立森林以及灰狼优化算法(GWO)等。通过对不同插层熔喷非织造材料的工艺参数、结构变量和产品性能数据的深入分析,我们比较了GA - SVR、孤立森林 - SVR和GWO - SVR等模型的性能,并最终选择了表现更优的GA - SVR模型进行预测。
目前,本插层熔喷非织造材料性能调控专题项目文件已分享在交流社群,阅读原文进群和500 + 行业人士共同交流和成长。接下来,让我们一起深入探索这些数据分析方法在插层熔喷非织造材料性能调控中的应用。
解决方案
- 任务/目标
建立工艺参数与结构变量的关系模型。
- 数据源准备
收集不同插层熔喷非织造材料的工艺参数、结构变量、产品性能的相关数据,部分如表1所示:
表1 不同插层熔喷非织造材料的相关参数数据
任务的解决
建模
支持向量回归(SVR)
SVR模型在线性函数两侧制造了一个“间隔带”,对所有落入到间隔带内的样本不计算损失,也就是只有支持向量才会对其函数模型产生影响,最后通过最小化总损失和最大化间隔来得出优化后的模型。回归的目的是得到一个能够尽量拟合训练集样本的模型,通常用的方法是构建一个样本标签与模型预测值的损失函数,使损失函数最小化从而确定模型。
遗传算法
遗传算法主要用于模拟自然选择和遗传过程中的各种生物现象,如基因突变、染色体交叉和繁殖等。它们将在基因进化后形成新的种群个体,作为相应的候选解。根据适应度函数,即选择指标,从这些候选解中选出适应度较好的个体,并根据遗传算子进行选择、交叉或变异后生成新的候选解。重复上述过程,最后是收敛指标。遗传算法可以在众多解中找到最优解,可以降低陷入局部最优解的风险,有效保证全局最优解的选择。由于遗传算法的整体搜索策略和优化搜索方法不依赖梯度信息或其他辅助知识,只需要影响搜索方向的目标函数和相应的适应度函数,遗传算法提供了一个通用框架解决复杂系统中的问题。
孤立森林
孤立森林通过 随机选择特征 ,然后 随机选择特征的分割值 ,递归地生成数据集的分区。和数据集中「正常」的点相比, 要隔离的异常值所需的随机分区更少,因此异常值是树中路径更短的点,路径长度是从根节点经过的边数。
灰狼优化算法(GWO)
GWO算法的优化从初始化灰狼种群,以及a,A和C开始,其中a=2-2∙t/T,t表示当前迭代次数,T为设定的最大迭代次数,a 的取值越大则会使灰狼远离猎物,希望找到一个更适合的猎物,因而促使狼群进行全局搜索,若 a 的取值越小则会使灰狼靠近猎物,促使狼群进行局部搜索。同时A=2a∙r1-a
,C=2r2
(r1
和r2
是两个一维分量取值在[0,1]内的随机数向量)。在迭代过程中,计算灰狼个体的适应度,保存适应度最好的前3匹狼α,β和δ。灰狼根据它们与猎物的距离更新其位置,并更新a,A和C,再次计算全部灰狼的适应度,直到达到最大迭代代数。
def greyr(pack_size = 5, min_values = [-5,-5], max_values = [5,5], iterations = 50, target_function = target_function): count = 0 alpha = al len(min_values), target_function = target_function) beta = beta_position(dimension = len(min_values), target_function = target_function) delta = delta_position(dimension......
基于优化算法的SVR模型
利用 Python 建立 GA-SVR 模型,随机抽取数据的 90%作为训练集,10%作为测试集。工艺参数(接收距离和热空气速度)作为特征集并进行标准化处理,各结构变量(厚度、孔隙率、压缩回弹性)分别作为目标集进行训练与测试。在 GA 算法中设置共 20 代,每代 10 人。利用 GA 算法对 SVR 参数中的惩罚参数(C)、损失函数(epsilon)、核系数(gamma)进行调参,将 C、epsilon、ganmma的范围限定为[0,100]。同时利用Python建立孤立森林-SVR,GWO-SVR模型,进行三者结果的比较。具体代码和数据见附件。
孤立森林 SVR
plt.plot(target)#测试数组fig = plt.gcf()fig.set_size_inches(18.5, 10.5)plt.show()
fig = plt.gcf()fig.set_size_inches(18.5, 10.5)plt.title("SVR") # 标题plt.show()print("EVS:",explained_variance_score(target_test,predict_results1))print("R2:",metrics.r2_score(target_test,predict_results1))print("Time:",end1-start1)
<pre>D:\software\anaconda\lib\site-packages\sklearn\utils\validation.py:63: DataConversionWarning: A column-vector y was passed when a 1d array was expected. Please change the shape of y to (n_samples, ), for example using ravel().<span class="ag-soft-line-break"></span> return f(args, *kwargs)
</pre>
normal_source = data_merge[data_merge['outlier_label']==1]normal_source
GWO-SVR模型
print("EVS:",explained_variance_score(target_test,predict_results1))print("R2:",metrics.r2_score(target_test,predict_results1))print("Time:",end1-start1)
# GWO def greer(pack_size = 5, min_values = [-5,-5], max_values = [5,5], iterations = 50, target_function = target_function): count = 0 alpha = alpha_position(dimension = len(min_values), target_function = target_function) beta = beta_position(dimension = len(min_values), target_function = target_function) delta = delta_position(dimension = len(min_values), target_function = target_function) position = initial_position(pack_size = pack_size, min_values = min_values, max_values = max_values, target_function = target_function) while (count <= iterations): print("Iteration = ", count, " f(x) = ", alpha[-1]) a_linear_component = 2 - count*(2/iterations) alpha, beta, delta = update_pack(position, alpha......
plt.ylabel("fitness", size=14)plt.plot(fitness, color='b', linewidth=2)plt.show()
GA SVR(厚度mm)
AI提示词:请生成一个Python代码片段,用于绘制GA - SVR模型的测试结果,并计算和打印评估指标(EVS、R2)和运行时间。
利用 GA-SVR 模型结果(EVS、R2、Time)相比孤立森林-SVR和GWO-SVR模型有不同程度的提升,因此使用GA-SVR 模型,不同目标集下的GA-SVR 模型的预测结果如图 所示。
feature =data[['接收距离(cm)','热风速度(r/min)']]target =data[['厚度mm']]data
plt.plot(target)#测试数组fig = plt.gcf()fig.set_size_inches(18.5, 10.5)plt.show()
plt.show()print("EVS:",explained_variance_score(target_test,predict_results1))print("R2:",metrics.r2_score(target_test,predict_results1))print("Time:",end1-start1)
class GeneticAlgorithm: ''' The class for genetic algorithm ''' def __init__(self, sizepop, vardim, bound, MAXGEN, params): ''' sizepop: population sizepop人口规模 vardim: dimension of variables变量维数 bound: boundaries of variables变量边界 MAXGEN: termination condition终止条件 param: algorithm required parameters, it is a list which is consisting of crossover rate, mutation rate, alpha ''' self.sizepop = sizepop self.MAXGEN = MAXGEN self.vardim = vardim self.bound = bound
fig.set_size_inches(18.5, 10.5)plt.title("GA+SVR(厚度)") # 标题plt.show()print("EVS:",explained_variance_score(target_test,predict_results1))print("R2:",metrics.r2_score(target_test,predict_results1))print("Time:",end1-start1)fig.savefig('./GA+SVR(厚度).jpg')
GA+SVR(压缩回弹性率(%)
通过上述代码,对压缩回弹性率进行预测分析。利用GA - SVR模型,以接收距离和热风速度作为特征,对压缩回弹性率这一目标变量进行预测。预测结果可以帮助我们了解在不同工艺参数下,插层熔喷非织造材料的压缩回弹性率变化情况,进而为优化材料性能提供依据。
评估指标计算:
上述代码计算了预测结果的解释方差得分(EVS)和R²得分,这两个指标用于评估GA - SVR模型对压缩回弹性率预测的准确性和可靠性。EVS越接近1,表示模型对数据的解释能力越强;R²得分越接近1,说明模型的拟合优度越高,即模型对数据的拟合效果越好。通过这些指标,我们可以直观地了解模型在预测压缩回弹性率方面的性能表现。
可视化预测结果:
这段代码绘制了压缩回弹性率的真实值和预测值的折线图,通过可视化的方式,我们可以更直观地对比真实值和预测值的差异,进一步评估模型的预测效果。从图中可以观察到模型预测值与真实值的拟合程度,判断模型是否能够准确地反映压缩回弹性率随工艺参数的变化趋势。
GA+SVR(孔隙率(%)
在研究插层熔喷非织造材料性能时,孔隙率是一个重要的结构变量。利用GA - SVR模型,我们以接收距离和热风速度作为输入特征,对孔隙率进行预测。通过上述代码,实现了对孔隙率的预测流程,为深入了解材料孔隙率与工艺参数之间的关系提供了数据支持。
评估指标计算:计算孔隙率预测结果的EVS和R²得分,是评估GA - SVR模型在预测孔隙率方面性能的重要步骤。这两个指标能够量化模型对孔隙率数据的解释能力和拟合效果。较高的EVS和R²值表明模型能够较好地捕捉孔隙率与工艺参数之间的关系,预测结果较为可靠;反之,则说明模型可能需要进一步优化或调整。
可视化预测结果:

通过绘制孔隙率真实值和预测值的折线图,我们可以直观地观察到模型预测值与实际值的接近程度。这有助于我们从视觉上判断模型的预测准确性,及时发现模型可能存在的偏差,为后续改进模型或优化工艺参数提供参考依据。例如,如果发现预测值与真实值存在较大偏差,可以进一步分析原因,如数据特征选择是否合理、模型参数是否需要调整等。
结论
通过本次研究,我们成功建立了工艺参数与结构变量的关系模型,为插层熔喷非织造材料的性能调控提供了科学依据。GA - SVR模型在预测厚度、压缩回弹性率和孔隙率等结构变量方面表现出色,相比孤立森林 - SVR和GWO - SVR模型,其预测结果在EVS、R2等评估指标上有显著提升,运行时间也在可接受范围内。这为我们在复杂的工艺参数中找到了一条优化材料性能的有效途径。
未来,我们可以进一步优化模型,例如尝试不同的参数组合、增加更多的训练数据,以提高模型的泛化能力和预测准确性。同时,还可以探索更多的工艺参数组合对材料性能的影响,为插层熔喷非织造材料的性能提升和口罩生产的质量保障做出更大的贡献。例如,研究不同原材料特性与工艺参数的协同作用,以及环境因素对材料性能的影响等,从而更全面地掌握材料性能调控的方法,推动相关产业的发展。
关于分析师
在此对 Yiling Yang 对本文所作的贡献表示诚挚感谢,她完成了国际经济与贸易专业的学位,专注于数据分析领域。擅长 Python、SPSS、MySQL、深度学习、计量建模、报告撰写 。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。