90 后学霸博士 8 年进击战,用机器学习为化学工程研究叠 BUFF

本文首发自公众号:HyperAI 超神经
内容一览:ScienceAI 作为近两年的技术热点,引起了业界广泛关注和讨论。本文将围绕 ScienceAdvances 的一篇论文,介绍如何利用机器学习,对燃煤电厂的胺排放量进行预测。
关键词:AI for Science 化学工程 胺排放

国际能源署公布的报告显示,2021 年全球能源相关的CO2 排放量较 2020 年增长 6%,达到 363 亿吨,创历史新高。

其中 CO2 排放量增幅最大的是发电和供热行业,增幅超过 9 亿吨,占全球 CO2 排放量增幅的 46%。控制并减少发电及供热行业 CO2 排放量刻不容缓。

图片
2021 年各行业 CO2 排放量的年度变化蓝色表示年度变化,红点表示净变化查看 2021 全球 CO2 排放完整报告

查看 2021 全球 CO2 排放完整报告

碳捕捉:减少温室气体排放、实现变废为宝

在《中国电力行业碳达峰、碳中和的发展路径研究》中,行业专家给出了降低电力行业 CO2 排放量的三种改变措施:
1、大力发展风电、水电、核电等低碳电源,抛弃煤电、油电等高碳电源
2、对于燃煤电厂,用天然气、秸秆、生物质等低碳燃料,代替煤炭进行发电
3、利用碳捕捉技术,对燃煤电厂排放的 CO2 进行捕捉利用

其中,碳捕捉因为改造幅度小、想象空间大、具备变废为宝的能力,备受商业公司、能源公司以及电力行业科研院所的关注。

图片
电厂中的碳捕捉设备

碳捕捉是指利用 CO2 和胺类物质发生反应,捕捉电厂释放到大气中的 CO2 并进行压缩,封存至枯竭的油田、天然气领域,或其他安全的地下场所,供后续石油开采、冶炼、汽车等产业利用。

然而,CO2 在与胺类物质发生反应的过程中,也会产生危害公共健康和生态系统的胺排放,有效监控并预测不同电厂的胺排放,成为碳捕捉的一大难点。

近日,由洛桑联邦理工学院和赫瑞瓦特大学组成的研究小组,开发出了一种机器学习方法,可依据电厂过往数据,更准确地预测碳捕捉过程中胺类有害气体的排放量。目前该论文已发表在 ScienceAdvances 上。

图片

完整论文

论文详解:用机器学习技术解决化学问题

1、先导工场试验

碳捕捉工场非常复杂,因为过程模型 (process model) 通常侧重于捕捉 steady-state 运行。然而,当前和未来发电厂的设计和运行,需要考虑到可再生能源发电份额的增加,这种增加是间歇性的、不规律的,因此还需要考虑到 steady-state 之外运行的动态和多变量行为。

为了模拟未来电厂运行的间歇性,科研人员对德国 Niederaußem 发电厂先导工场 (pilot plant) 的捕获装置,进行了一系列压力测试,试图发现电厂间歇性运行与胺排放量的关系。

图片
Niederaußem 燃烧后碳捕捉先导工场的简化流程示意图

实验虽然积累了大量捕捉工场行为的数据,但无法利用这些数据定性预测未来的胺排放,因为除压力测试外,实验过程中还存在另一变量--电厂专业人员的干预,以确保实验期间工场的安全运行。

2、获取数据集

先导工场实验中,科研人员每 5 分钟进行一次数据采集,积累了庞大的数据量,如何把这些数据转化成可供机器学习模型使用的数据集,成为研究重点。

科研人员的方法是把 time-dependent 过程及排放数据,表示成图像(数据矩阵),基于此创建预测模型,然后借助机器学习技术进行模式识别,预测胺排放。

在这种表示法中,工场在给定时间 t 定义了一个 state 特征向量 x(t),其中 p 元素表示过程变量(如烟气温度和水洗温度)。

取 t 个时间戳的工场 state 向量,得到一个 t × p 的矩阵。这个矩阵可以被看作是一个「图像」,与未来的排放曲线 y(t) 相连。

图片

本实验中用到的数据可以看作一张「图像」,其中:

宽度=输入序列 (T) 的长度
高度=参数数量 p
颜色=参数 xj 在某个时间 ti 的值

接下来,将工场历史图像中的 pattern,与特定的未来排放进行联系。为此,科研人员采用了梯度增强的决策树模型,将描述不同参数和排放量的行 (row) 合并为一个长向量。用分位数损失 (quantile loss) 训练模型,以获得不确定性评估 (uncertainty estimate)。

评估不确定性时,科研人员采用了支持蒙特卡洛 dropout 的时间卷积神经网络 (temporal convolutional neural network) ,并在 note S8 中展示用这个模型获得的结果。

有了这个数据集,就可以借助数据科学方法,开发一个机器学习模型进行数据分析。

3、从机器学习中洞悉胺排放

接下来,就可以用机器学习模型进行以下预测:
1、未来排放量(实时):基于历史 & 当前的运行和排放,预测未来 x 小时的排放量是多少
2、数据的 Causal impact 分析:测量特定压力测试对胺排放的影响,需要一个 baseline,提供在没有压力测试情况下的胺排放
3、减少胺排放:用模型预测「假设」情况下的排放量,如降低水洗温度是否会对排放量产生影响

图片
利用机器学习模型预测未来 2 分钟、1 小时、2 小时的胺排放量

90 后学霸博士,深耕化学 8 年

本篇论文由洛桑联邦理工学院基础科学学院的 Berend Smit 教授和苏格兰赫瑞瓦特大学碳解决方案研究中心教授 Susana Garcia 共同领导的科研小组发布。

其中,开发机器学习方法,将胺排放问题转化为模式识别问题的学生,正是 Smit 教授小组的 90 后博士生 Kevin Maik Jablonka。

图片

Kevin Maik JablonkaKevin 本科就读于德国慕尼黑工业大学化学专业,2017 年本科毕业后,Kevin 进入瑞士洛桑联邦理工学院继续硕士和博士学习,在化学领域继续深造。

从 2014 年至 2022 年,Kevin 用了 8 年时间建立了对化学及化学工程的深刻理解,期间还通过对应用数据科学、机器学习的学习,将化学研究与人工智能进行融合,提升了化学工程领域研究的效率和准确度,是一位妥妥的 90 后学霸。

诚如多位化学领域的资深人士所说,机器学习在化学及过程工程 (process engineering) 领域,可能产生比计算机视觉领域更大的影响。

在 CV 应用场景中,模型学习的图像基本特征,往往与人类大脑感知图像的方式密切相关,如目标检测、人脸识别。

然而在工业场景中,人类往往缺乏对基本机制的了解,但通过机器学习,科研人员发现了从参数到目标观察物映射的基本规则,并对迄今无法预测的现象进行了预测。

在预测电厂胺排放这一案例中,机器学习超越传统方法,被认为是提供了一种观察复杂化学过程的全新视角,极有可能彻底改变未来燃煤电厂的运行方式。

人工智能将更多地应用于基础科学研究,为其提供动力、提升效率、加速科研成果落地。你如何看待 AI for Science 下半场的发展?它将带来哪些突破,又会面临怎样的挑战?欢迎留言分享你的观点和看法~未来超神经还将关注更多 ScienceAI 相关话题,感兴趣快关注吧~


超神经HyperAI
AI 行业实验媒体,站在科技与人文的交叉口,看懂人工智能。微信公众号:HyperAI
1.1k 声望
8.8k 粉丝
0 条评论
推荐阅读
GTC 2023 | 「皮衣刀客」黄仁勋畅谈 AI Top 5,科学计算、生成式 AI、Omniverse 榜上有名
内容一览:北京时间 3 月 21 日 23:00,英伟达创始人兼 CEO 黄仁勋在 GTC 2023 上发表主题演讲,介绍了生成式 AI、元宇宙、大语言模型、云计算等领域最新进展。

超神经HyperAI

封面图
SegmentFault 思否宣布将接入百度「文心一言」,提升开发者获取知识的效率
作为中国领先的新一代开发者社区,我们以「凝聚集体智慧,推动技术进步」为使命,长期关注前沿技术发展及产业应用。2023 年 2 月 11 日,ChatGPT for SegmentFault 浏览器插件上线,SegmentFault 成为了国内首个...

SegmentFault思否11阅读 3k评论 1

数据结构与算法:二分查找
一、常见数据结构简单数据结构(必须理解和掌握)有序数据结构:栈、队列、链表。有序数据结构省空间(储存空间小)无序数据结构:集合、字典、散列表,无序数据结构省时间(读取时间快)复杂数据结构树、 堆图二...

白鲸鱼9阅读 5.2k

对 ChatGPT 做一次技术面试(ChatGPT 没能通过)
问:对一个系统的描述如下:系统中有大量注册用户,用户可以关注其他用户。用户可以发布消息,消息包含发布者、发布时间和可见性。消息的可见性可以是公开、不公开或仅对关注自己的用户可见。请设计这个系统的数...

捏造的信仰7阅读 1.5k评论 1

封面图
openKylin 0.9.5版本正式发布,加速国产操作系统自主创新进程!
2023年1月12日,中国桌面操作系统根社区openKylin(开放麒麟)正式发布openKylin 0.9.5操作系统版本。此版本充分适应5G时代需求,打通平板,PC等设备,实现多端融合,弥补了国产操作系统的短板,有效推动国产操作...

openKylin6阅读 7.9k

封面图
使用 🧨 Diffusers 实现 ControlNet 高速推理
自从 Stable Diffusion 风靡全球以来,人们一直在寻求如何更好地控制生成过程的方法。ControlNet 提供了一个简单的迁移学习方法,能够允许用户在很大程度上自定义生成过程。通过 ControlNet,用户可以轻松地使用...

HuggingFace3阅读 988

封面图
不会数学的程序员,只能走到初级开发工程师!
在我还是初级程序员时,每天也都粘贴着代码和包装着接口。那个阶段并没有意识到数学能在编程中起到什么作用,就算学了数学的部分知识,也没法用到编程中。但后来随着编程越来越久,逐步接手核心代码块开发时候,...

小傅哥3阅读 858

封面图
1.1k 声望
8.8k 粉丝
宣传栏