当机器人设计自己的实验时

麻省理工学院的智能船模试验池自动收集数据


范迪夏是中国西湖大学的一名助理教授。他将自己曾在麻省理工学院创立的实验室称为“粉红教练实验室”。透过 Zoom,他看了一眼麻省理工学院的智能流体力学实验室,然后指向一张二手粉色沙发。这是一个观看实验的好地方,他经常坐在这里看他的机器人在水箱(也称船模试验池)里一遍又一遍地运行实验。他说道,“我就是坐在沙发上的教练,训练着船模试验池的下一个迈克尔·乔丹。我本人不会扣篮。一个人不可能做那么多实验。但这家伙可以做到。”

“如果我们能在这些机器中植入另一个大脑,那么,它们不仅会重复做实验,而且还会设计实验。”

麻省理工学院室内的智能船模试验池。

智能船模试验池。(图片所有权:范迪夏)

“智能船模试验池”简称 ITT,大约长 9 米,高 0.9 米,宽 0.9 米(30 x 3 x 3 英尺)。这个机器人看起来既不像迈克尔·乔丹,也不像迈克尔·菲尔普斯。它就是一个四四方方的装置,安装在试验池顶部的两条轨道上,可沿轨道全长移动。在移动时,它会拖曳水下的科学家选择的一个物体。

在此过程中,该机器人会收集流体动力学数据,例如测量物体受到的阻力大小。它会改变某些参数(如速度和角度),然后再次运行实验。它还会自动收集数据,日以继夜循环往复,在短短两周内便能完成获得博士学位所需的实验。

此外,它能智能地选择接下来要运行的实验,以及下一段要用的速度和角度。如果要操作八个参数,则应为每个参数选择 10 个设置,这需要运行 108(1 亿)次实验,才能绘制出可能性空间,包括速度和角度等参数的各种组合。研究人员将可能性呈现爆炸性增长的现象称为“维数灾难”。

ITT 采取了一条捷径。它会运行一些随机实验,并将这些实验推定到其他设置。然后,它会计算参数空间中最不确定的区域,并在这个区域内用这些参数运行实验。它会重复这一过程,直到对大部分空间足够确定为止。ITT 不需要运行 1 亿次实验,只需要运行几千次即可。

范博士指出,其他实验室还利用机器人自动收集数据。例如,制药公司使用它们测试大量分子的特性。他说道,“虽然实验室自动化技术非常先进,但除了人类科学家的大脑,如果我们能在这些机器中植入另一个大脑,那么,它们不仅会重复做实验,而且还会设计实验。”

筑梦管道模型

在 ITT 的实验中,大部分实验都涉及到海洋钻井立管,这是一种将海底油井与海面漂浮平台相接的管道。通过拖曳立管的等比例缩小模型穿过试验池,可以模拟洋流经过静止的立管时的运动。当洋流经过立管时,会在它的周围形成涡流,就像河水在急流中的岩石和木头后面形成漩涡一样。这些涡流会使立管产生振动。石油公司希望减少这种涡激振动,因为这会导致管道疲劳,并增加漏油的可能性。

事实上,立管往往长达数百米(数千英尺),由多根约 0.3 米(1 英尺)厚的管道组成。虽然每段管道都是刚性的,但整个立管是柔性的。范博士说道,当水在立管周围流动时,“整个管道都在振动”。工程师们想创建计算模型来预测立管的运动,但这是一个非常棘手的问题。于是,他们收集了某段管道物理模型的确凿数据,并将这些数字输入数学模型,以此简化计算。

在范博士的立管研究中,ITT 拖曳着一根长约 46 厘米、厚约 4 厘米(18 x 1.5 英寸)的垂直管道。试验池顶部的机器人带有荷重传感器,用于测量包括阻力在内的输出。它还用于控制振动的频率、方向和幅度等输入参数。但这一切并非都是自动完成的,研究人员需要选择相关参数和值得探究的取值范围。

ITT 会为下一次实验选择输入参数,以便尽量减少不确定性。这种不确定性涉及两个方面。首先是测量不确定性。即使用相同的参数在试验池里进行两次相同的实验,也可能会得到不同的结果,这是因为传感器的精度有限,或纯粹是由于自然界的变化所致,尤其涉及混乱的涡流时更是如此。其次是模型不确定性,或者说是无法精准地预测给定实验的测量值。这两种不确定性结合起来就产生了总体不确定性。在总体不确定性低于给定的阈值之前,ITT 会一直收集数据。

该系统并未尝试使用 1 亿种不同的参数值组合,而是在进行了不到 4,000 次的测试后便达到了预测的确定性。

洋流在石油立管周围流动产生的涡流。

洋流在石油立管周围流动产生的涡流。

为了确定阈值,范博士首先计算了测量不确定性。他运行了数千次实验,并检查了数据的差异。量化测量不确定性并不是一门精确的科学。范博士说道,“从基本上讲,你需要了解自己的机器。为此,我开始揣摩这个误差范围。这时就需要用到研究经验。”

范博士并不指望总体不确定性与测量不确定性相符,因为模型不确定性取决于我们对任何现实系统的了解。于是,他留出了一些余地。如果 ITT 预测参数空间中最模糊的区域时的不确定性低于测量不确定性乘以 3(范博士选择的有根据猜测和安全系数),它便达到了阈值,它的工作便告完成。

在发表于《科学机器人》上的一项研究中,该团队探索了一个由八个参数定义的空间,同时训练了一个模型,用于预测“与速度同相的升力系数”值。该系统并未尝试使用 1 亿种不同的参数值组合,而是在进行了不到 4,000 次的测试后便达到了预测的确定性。

我们有理由假设,这个模型不仅具有预测的确定性,而且还具有一定的准确性。在今后的工作中,范博士也将确保模型兼具确定性和准确性。

走出“巴别塔”

机器人的软件使用了多种语言。Power PMAC 可控制它的运动。用 C# 和 LabVIEW™ 编写的软件可从传感器读取数据。范博士说道,“MATLAB 就是该系统的大脑”,它将各个部分连接在一起。他没有用同一种语言重写所有代码,而是通过 MATLAB® 脚本协调其他部分。MATLAB 还可以计算不确定性,并决定接下来要运行的实验。

范博士靠在试验池边上调整机器人。

范博士正在调整智能船模试验池。(图片所有权:范迪夏)

借助 MATLAB,ITT 能够协调用多种语言编写的子系统,计算不确定性,并决定接下来要运行的实验。

为了选择实验,该系统采用了高斯过程回归 (GPR) 这种数学方法。我们设想一个只由两个参数(可能是速度和角度)定义的空间。该空间可以视为一种地貌,其中,输入参数用于定义纬度和经度。对于地貌中的每个点,该系统在预测输出(例如阻力)时都存在一定程度的不确定性。这种不确定性可以描述为该纬度和经度处的海拔高度。有些区域会有山丘,在那里很难提前知道在该速度和角度下阻力有多大。GPR 可通过构建这些山丘来定义这种地貌。在某个位置(最好是一座高山所在的位置)进行测量后,GPR 便会使这座山“扁平化”。MATLAB 的 Optimization Toolbox™ 中提供了 Fit GPR 软件包,可用于构建任何维数的这些地貌。范博士说道,“我们正想方设法了解不确定性,让不确定性为我们提供指导。”该系统通过查找最高的山丘来选择下一个实验。

范博士说,他可以用神经网络代替 GPR 来预测测量值,但 GPR 提供了一种更自然的不确定性量化方法。关于如何使用神经网络做到这一点,目前还没有达成共识。

范博士深知,正是 MATLAB 软件包帮助他顺利完成了每个阶段的项目任务。范博士是流体动力学专家,但不是软件专家。在早期阶段,他使用 Reinforcement Learning Toolbox™ 对他的 ITT 系统进行了快速原型设计和验证。在准备进一步提高 ITT 的性能时,他定制了 MATLAB 工具箱。这样,他既无需使用不灵活的软件包,也不必手动重写数千行代码,即可深入了解 MATLAB 工具箱,阅读注释,理解代码,并根据需要调整若干行代码。

经验教训,值得借鉴

通过将振动频率等参数映射到阻力,石油公司可以设计更安全、更高效的立管。然后,他们可以优化管道厚度或减振设备的位置,从而找到减少阻力(以及发生灾难的可能性)的设计。设计模型还可以用作实际立管的“数字孪生”,像这些立管一样进行老化或维修。

“这种实验方法,甚至称得上是实验方法论或理念,并不局限于流体力学。”

这项研究工作带来宝贵的经验教训,远不止于试验池。范博士说道,“这种实验方法,甚至称得上是实验方法论或理念,并不局限于流体力学。”

该方法可能同样适用于结构力学。智能 3D 打印机可以构建一种材料或结构,然后测试其强度或其他特性,再根据这些信息打印出新东西。或者,在生命科学领域,机器人化学家可以制造一种药物,在烧瓶中测试其疗效,然后设计另一种新药。然而,机器人在设计自己的扣篮前仍要接受训练。


阅读其他案例

面板导航

机器人

探索全球最大的生态系统 — 海面以下 500 米

Nat Geo 开发水下机器人摄像头探索深海

面板导航

机器人/自主系统

陌生空间,放心导航

新算法提升机器人感知的稳健性

面板导航