当前位置:首页 >知识 >方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理 据中Korteweg–de Vries 方程(KdV

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理 据中Korteweg–de Vries 方程(KdV

2024-06-30 18:58:09 [百科] 来源:避面尹邢网

方程就是程发现方程二叉树森林?从数据中直接发现未知控制方程和物理机理

作者:机器之心 人工智能 新闻 偏微分方程是领域知识的一种简洁且易于理解的表示形式,对于加深人类对物理世界的叉树从数认知以及预测未来变化至关重要。

研究者们希望通过机器学习方法,森林直接从高维非线性数据中自动挖掘最有价值和最重要的据中内在规律(即挖掘出问题背后以 PDE 为主的控制方程),实现自动知识发现。直接

近日,未知东方理工、控制华盛顿大学、和物瑞莱智慧和北京大学等机构的理机理研究团队提出了一种基于符号数学的遗传算法 SGA-PDE,构建了开放的程发现方程候选集,可以从数据中直接挖掘任意形式的叉树从数控制方程。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理 据中Korteweg–de Vries 方程(KdV

实验表明,森林SGA-PDE 不但可以从数据中挖掘到 Burgers 方程(具有交互项),据中Korteweg–de Vries 方程(KdV,直接具有高阶导数项),未知和 Chafee-Infante 方程(具有指数项和导数项),而且还成功挖掘到粘性重力流问题中的具有复合函数的控制方程,以及具有分式结构的方程,而后两者是此前方法难以发现的。SGA-PDE 不依赖关于方程形式的先验知识,填补了复杂结构控制方程挖掘问题的空白。该模型无需提前给定方程候选集,利于自动知识发现算法在未知科学问题中的实际应用。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理 据中Korteweg–de Vries 方程(KdV

该研究以《Symbolic genetic algorithm for discovering open-form partial differential equations (SGA-PDE)》为题,于 6 月 1 日发表在 Physical Review Research 上。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理 据中Korteweg–de Vries 方程(KdV

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

目前常见的知识发现思路是利用稀疏回归,即预先给定一个封闭的候选集,然后从中选择方程项,并组合出控制方程,如 SINDy 和 PDE-FIND。但是此类方法要求使用者预先确定方程的大致形式,再将所有对应的微分算子作为候选集中的函数项提前给出,无法从数据中找到候选集中不存在的函数项。最新的一些研究尝试利用遗传算法扩充候选集,但是基因的重组和变异存在较大局限性,依然无法产生复杂结构的函数项(如分式结构和复合函数)

从数据中直接挖掘开放形式控制方程的关键在于以一种易于计算的方式生成并表示任意形式的控制方程,并通过衡量生成的方程与观测数据的符合程度,来评估方程形式的准确性,进而对挖掘的方程进行迭代优化。因此,自动知识发现的核心问题是表示与优化。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

表 1. 自动控制方程挖掘方法对比表

表示问题的挑战在于:1. 如何利用有限的基础单元来表示无限的复杂结构控制方程(即开放候选集)2. 如何构建易于计算的控制方程表示方法。为了能够自由表示任意结构的方程,研究人员将 SGA-PDE 的基本表示单元弱化到了运算元和运算符,并通过符号数学的方法,利用二叉树构建了开放候选集。

优化问题的挑战在于:1. 方程形式与方程评估指标之间的梯度难以计算2. 开放候选集的可行域是无穷大的,优化过程很难有效兼顾探索(exploration)与利用(exploitation)。为了能够对开放候选集问题高效寻优,研究人员利用一种针对树结构特殊设计的遗传算法实现方程形式的优化。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

图 1:自动知识发现问题和 SGA-PDE 示意图

研究人员首先通过细化算法中方程的基本表示单元来表示开放形式的偏微分方程,将方程的表示尺度从独立的函数项层面转化为更基础的运算符和运算元层面

SGA-PDE 将控制方程中的运算符分为双运算符(如 +、-)与单运算符(如 sin、cos),然后将所有潜在变量定义为运算元(如 x、t、u)。研究人员采用二叉树的结构将运算符与运算元组合起来,对不同的方程进行编码。二叉树中所有的终端节点(度为 0 的叶子节点)对应于运算元,所有的非终端节点对应于运算符,其中双运算符对应于度为 2 的节点,单运算符对应度为 1 的节点。

如图 2 所示,通过一种可计算字符串作为连接,任何一个函数项都可以转化为一颗二叉树,同时,满足一定数学规则的二叉树也可以转化为函数项。进而一个具有多个函数项的控制方程等价于一个由多棵二叉树组成的森林。SGA-PDE 通过符号数学的方式,表示任何开放形式的偏微分控制方程。此外,论文中也提出了一种随机生成具有数学含义的二叉树的方法,可以保证生成的二叉树不违背数学原理。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

图 2:二叉树与函数项之间的表示和转化方法

由于图 2 所示表示方法能够将函数空间中的样本和二叉树空间的样本一一对应。这意味着基于符号数学的表示方法是有效且非冗余的,可以作为遗传算法中编码过程。研究者提出了一种针对树结构的遗传算法(图 3),从实验数据中自动挖掘符合观测数据的控制方程。这种针对树结构的遗传算法可以实现在不同层面的优化

重组环节是在森林(方程)层面优化,以找到二叉树(函数项)的最优组合方式。这一环节与当前常见的稀疏回归类方法类似,是在封闭候选集内的寻优。

变异环节是在二叉树(函数项)层面优化,通过随机产生不同的节点属性,找到在给定的二叉树结构下,最优的节点属性组合,本质上是对当前结构的利用(exploitation)。

替换环节同样是在二叉树(函数项)层面优化,但是会产生新的二叉树结构,是对树结构的探索(exploration),实现了完全开放候选集中的优化。

SGA-PDE 通过多层级的优化,可以兼顾二叉树拓扑结构的利用与探索,有利于高效找到最优的方程形式。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

图 3:针对树结构的遗传算法

实验数据如图 4 所示,其中第 2 列展示了物理场观测值,是 SGA-PDE 的唯一输入信息。第 3 列和第 4 列中的基础一阶导数可以通过对物理场观测值差分获得。第 1 列为正确的方程形式。实验中 SGA-PDE 采用了相同的预置运算元和运算符,不需要针对具体问题进行调整,以便验证算法的通用性。

最终,SGA-PDE 成功从数据中挖掘到 Burgers 方程,KdV 方程,Chafee-Infante 方程,具有复合函数求导的粘性重力流控制方程,以及具有分式结构的方程。上述方程具有指数项、高阶导数项、交互项、复合函数和嵌套结构等多种复杂形式

表 2 对比了多种已有算法在上述 5 种算例中的计算结果,可见 SGA-PDE 填补了挖掘复杂结构控制方程的空白

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

图 4:实验数据图

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

表 2 自动知识发现算法在不同控制方程挖掘问题中的实验结果

为了更充分地理解 SGA-PDE 的寻优过程,图 5 展示了挖掘 KdV 方程时的演化路径。可见第 1 代产生的最优方程与实际方程相差甚远。在此后演化过程中,随着二叉树的拓扑结构以及节点含义的变异,以及函数项之间的交叉重组,最终在第 31 代找到了正确的解,且此时 AIC 指标已达到文中给定的收敛标准。有意思的是,如果继续优化,则会在第 69 代找到 KdV 方程基于复合函数求导的更加简约的表达形式。图 6 则展示了 SGA-PDE 寻找具有分式结构控制方程的优化过程。

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

图 5:SGA-PDE 对 KdV 方程的优化过程

方程就是二叉树森林?从数据中直接发现未知控制方程和物理机理

图 6:SGA-PDE 对具有分式结构的方程的优化过程

控制方程是对领域知识的一种高效表示形式,然而许多现实问题的方程参数甚至方程形式都不确定,很难写出准确的控制方程,极大制约了领域知识在机器学习中的应用。

SGA-PDE 通过符号数学的方法对方程进行转化,解决了任意形式的偏微分方程的表示问题。此外,SGA-PDE 采用针对二叉树设计的遗传算法,通过对树的拓扑结构以及节点属性的迭代优化,从开放域中自动挖掘符合观测数据的控制方程。在优化中,SGA-PDE 不依赖于方程形式的先验信息,也无需给定候选集,实现了对复杂结构方程的自动寻优。同时,SGA-PDE 也是无梯度算法,避免了方程结构与损失值之间梯度难以计算的问题。

未来研究将关注于:1. 尝试结合强化学习或者组合优化算法;2. 通过嵌入物理机理缩小求解空间;3. 评估并提升 SGA-PDE 对稀疏数据和有噪数据的适用性;4. 将知识嵌入方法与知识发现方法进行融合。

论文链接(可免费获取):

https://journals.aps.org/prresearch/abstract/10.1103/PhysRevResearch.4.023174

代码与算例数据链接:

https://github.com/YuntianChen/SGA-PDE

责任编辑:张燕妮 来源: 机器之心Pro 方程数据

(责任编辑:休闲)

    推荐文章
    • 智升集团控股(08370.HK)发布业绩公告:全年公司拥有人应占亏损2700万元

      智升集团控股(08370.HK)发布业绩公告:全年公司拥有人应占亏损2700万元智升集团控股(08370.HK)发布至2020年12月31日止年度全年业绩公告,集团于报告期间实现收入约人民币8240万元,较去年同期增加约69.6%。公司报告期间拥有人应占的年内亏损约人民币2700 ...[详细]
    • 水性笔是什么笔

      水性笔是什么笔水性笔是什么笔?水性笔水性笔使用油墨为纯水性,纸对其的吸收性强。水性笔一般使用在吸收面上,即使涂在非吸收面上,也可以擦去,书写在纸上一般没有背痕。优点是书写手感与书。水性笔是中性笔吗?水笔是写小楷用的 ...[详细]
    • 手动剃须刀可以带上飞机吗

      手动剃须刀可以带上飞机吗剃须刀能带上飞机?2、按照规定来说,刀片式剃须刀不能带上飞机,只能随行李托运。除非没有刀片的,也就是自动剃须刀,可以随身携带乘坐飞机。但是一般来说,机场的安检不会那么严。刮胡刀可以上飞机吗?1、坐飞机 ...[详细]
    • 什么食物对脑梗有好处

      什么食物对脑梗有好处哪些食物适合脑梗患者食用?脑梗患者之所以摊上脑梗,主要是因为脑血管出现堵塞,导致脑部血液养分供应障碍而引起的病变。那么想要调理好脑梗,就需要多食用一些对疏通脑血管有帮助的食物,...脑梗死吃什么食物好 ...[详细]
    • 富瀚微(300613.SZ)公布消息:就收购眸芯科技32.43%股权已完成工商变更登记

      富瀚微(300613.SZ)公布消息:就收购眸芯科技32.43%股权已完成工商变更登记富瀚微(300613.SZ)公布,之前公告披露,公司于2021年2月5日召开第三届董事会第十四次会议,于2021年2月25日召开了2021 年第二次临时股东大会审议通过了《关于收购眸芯科技(上海)有限 ...[详细]
    • 今天是你的生日歌曲原唱

      今天是你的生日歌曲原唱前言:答:韦唯,是谷建芬为韦唯定做的通俗歌曲。答:郑智化,生日快乐答:《今天是你的生日,中国》这首歌曲的原唱者是董文华,歌词如下:《今天是你的生日,中国》原唱:董文华;填词:韩静霆;谱曲:谷建芬今天是 ...[详细]
    • 适合在家做的有氧运动

      适合在家做的有氧运动有哪些可以在家做而且不扰民的有氧运动?还有一点需要注意:卷腹可以提升你的腹部力量,但是脂肪厚的人别指望用这个动作减肚子减肥必须靠有氧。自己在家,除了跑步,还能做哪些有氧运动?那么基于这个主旨的前提下, ...[详细]
    • 克苏鲁音乐

      克苏鲁音乐前言:答:这个不太清楚。你查一下资料看有没有。答:是这样,国外有个叫“H.P.LovecraftHistoricalSociety”的歌手此人最喜欢把各种圣诞颂歌翻唱成克苏鲁颂歌。像那个旧日之歌就是他 ...[详细]
    • 多股披露减持后股价承压 东鹏等两股盘中跌出历史新低

      多股披露减持后股价承压 东鹏等两股盘中跌出历史新低大股东或者高管等减持被看作影响股价的重要参考,因此市场上大部分投资者将此信息作为利空对待。11月8日,于日前披露股东减持计划的东鹏控股(003012)、科翔股份两股股价不出所料地下跌,并于盘中跌出了历 ...[详细]
    • 酥饼怎么做

      酥饼怎么做酥饼应该怎么做?酥饼应该怎么做?中式酥皮点心,讲究的是起酥,层层酥脆,在工艺上有一些讲究,以猪油起酥效果是最好的。酥饼做法大全?只要有了这两个面团,酥饼就一定会做成功。步骤二、用擀面杖把白面团擀成一个 ...[详细]
    热点阅读