技术文章

加速神经成像数据分析,推进健康认知老化研究

作者 Richard Henson and Russell Thompson, Cambridge University


剑桥老化与神经科学中心 (Cam-CAN) 是 2010 年启动的一个大型研究项目,旨在了解个体如何在步入老年后尽可能保持认知能力。Cam-CAN 是一项跨学科举措,汇集了来自心理学、神经科学、精神病学、工程学和公共卫生领域的研究人员,他们使用各种大脑成像技术,如结构和功能性磁共振成像 (MRI) 及脑磁图 (MEG),评估与年龄相关的大脑结构和功能的变化。随着年龄的增长,大脑的结构会发生巨大变化(图 1),那么,有些人是如何在发生了这些变化的情况下依然保持良好的认知能力的呢?

图 1. 结构性 MRI 图像显示了典型的 19 岁健康人大脑(左)和典型的 86 岁健康人大脑(右)的横切面。随着年龄的增长,灰质(大脑边缘的卷积)和白质(剩余的较轻物质)逐渐缩小,导致老年人大脑中的黑洞(脑室)变大。

1. 结构性 MRI 图像显示了典型的 19 岁健康人大脑(左)和典型的 86 岁健康人大脑(右)的横切面。随着年龄的增长,灰质(大脑边缘的卷积)和白质(剩余的较轻物质)逐渐缩小,导致老年人大脑中的黑洞(脑室)变大。

 

Cam-CAN 是全球同类项目中规模最大的项目之一,共招募了近 3,000 名参与者,他们的年龄从 18 岁到 88 岁不等,并且拥有广泛的社会经济背景。数据来源包括健康史和生活方式调查问卷、认知测试,以及其中 700 名参与者的 MRI 和 MEG 成像。每个参与者都提供了近 1 GB 的数据,其中包含近 1,000 张 MRI 影像,每张影像分别包含超过 100,000 个体素,同时还包括数百个传感器以毫秒间隔记录、总长 30 分钟的 MEG 信号。我们使用 MATLAB® 在高性能计算集群上处理数据,并应用高级统计、优化和机器学习方法解释数据,进行有意义的定量比较。

处理 Cam-CAN 数据

处理来自大型同期群的 MRI 和 MEG 数据涉及很多步骤,例如配准不同类型的 MRI 影像,进行形变处理以置入公共空间,进行平滑处理,并在每个体素上运行统计模型。解释 MEG 数据也需要将传感器配准到结构性 MRI 影像,以构建准确的头部模型。这使处理流程错综复杂,并且包含许多相互依赖的步骤。

为管理并自动执行这一步骤繁多的流程,几个研究团队与 MRC 认知与脑科学研究所协作开发了基于 MATLAB 的自动分析 (AA) 软件包 [1]。Cam-CAN 数据集是 AA 的理想用例,因为研究的参与者数量众多,并且需要处理来自每个参与者的各种影像。即使不太精通编程的研究人员也可以使用 AA 执行复杂的神经成像数据分析(图 2)。AA 流程由多个模块组成,每个模块执行单个步骤并指定其输入和输出依赖项。AA 处理引擎本质上是一个批处理系统,它管理这些依赖项,并跟踪完成的步骤和剩余的步骤。如果流程中断,研究人员可以恢复处理,而无需从头开始。

图 2. 用于功能性 MRI 分析的部分 AA 流程。图片由 Cusack 等人提供,2015 年。

图 2. 用于功能性 MRI 分析的部分 AA 流程。图片由 Cusack 等人提供,2015 年。

AA 流程可以调用其他神经成像分析软件,包括 Statistical Parametric Mapping(统计参数图,SPM)包。SPM 同样是基于 MATLAB 的包,也是全球使用最广泛的神经成像工具之一。

使用集群加速数据处理

尽管 AA 可以很好地管理图像分析流程,但完整执行流程中的所有步骤会耗费大量时间,对于这一涉及 700 名参与者的项目尤其如此。为加快此过程,我们使用 MATLAB Parallel Server™ 在 1200核集群上处理数据。由于单个参与者的大部分数据处理工作可以独立完成(即不影响其他参与者数据的处理),因此,我们的分析高度并行,并且可以轻松地在一个集群上同时执行。我们发现,随着分配给每个作业的核心数量的增加,计算速度几乎呈线性增长。

MATLAB Parallel Server 不仅缩短了处理时间,还降低了并行计算的使用门槛;我们非常重视这一点,因为剑桥 MRC 认知与脑科学研究所的科学家的技术能力各不相同。很多情况下,研究人员只需将 for 循环改为 parfor 循环,即可将其处理转移到集群。我们编写了脚本,使研究人员可以针对不同的作业规模选择对应的默认资源集,例如特定的核心数和每个核心的 RAM 数量。由于 MATLAB Parallel Server 通过插件脚本与 Slurm 调度程序集成,因此可以轻松提交作业并管理由多个用户共享的集群。

在 MATLAB 中分析 Cam-CAN 数据

在使用 AA 流程完成神经成像 Cam-CAN 数据的初步处理后,我们的研究人员可以应用统计和机器学习技术进行推断并得出见解。例如,一些研究人员使用 Statistics and Machine Learning Toolbox™,试着根据大量不同的大脑数据预测每个参与者的年龄,以确定哪些大脑特征对预测年龄最为重要。也有研究人员使用多元线性回归法和中介效应分析,试图找出哪些生活方式因素使有些人在进入老年后仍保持原有的认知能力,尽管他们的大脑发生了如图 1 所示的巨大变化。一项研究表明,除教育外,中年时期的运动、爱好或社交活动对预测晚年认知能力有着特殊的贡献 [2]。同时,老年人在早年从事的这些活动越多,其认知健康对大脑结构的依赖就越小(图 3)。这表明,大脑可以在功能层面适应与年龄相关的结构变化,而中年时期的活动对这种适应能力的形成尤为重要,这或许有助于人们在步入老年后更长时间地保持其独立生活能力。

图 3. 此图显示了 65 岁以上的 Cam-CAN 参与者的认知能力和大脑健康的结构性 MRI 测量(“灰质总体积”)之间的关系,摘自 Chan 等人 (2018) 的论文,有改动。每个圆点代表一名参与者,圆点的颜色表示其在中年时期参加过大量(蓝色)或少量(红色)业余活动。

图 3. 此图显示了 65 岁以上的 Cam-CAN 参与者的认知能力和大脑健康的结构性 MRI 测量(“灰质总体积”)之间的关系,摘自 Chan 等人 (2018) 的论文,有改动。每个圆点代表一名参与者,圆点的颜色表示其在中年时期参加过大量(蓝色)或少量(红色)业余活动。

进一步的研究

神经科学是剑桥大学的一个非常活跃的跨专业研究领域,并建有完善的跨学科研究中心。当地 Cam-CAN 团队的成员已根据 Cam-CAN 存储库中的数据发表了多篇论文。此外,这些数据的匿名版本可根据申请对外提供,如今已被世界各地的数百名科学家下载使用。

目前,我们正在筹措更多经费,用于对原始组中的参与者进行后续测试,获取随其年龄增长产生的纵向数据。另外,我们还将 Cam-CAN 数据与欧洲各地的脑成像同期数据相结合,将大脑扫描的数据从数百增加到数万。样本量的增加有助于开展基于志愿者捐献样本的分析,如分析遗传的作用。而了解健康老化同样有助于了解“不健康”老化,例如阿尔茨海默氏病和其他形式的痴呆症。

关于作者

Richard Henson 是 MRC 认知与脑科学研究所 (CBU) 的副主任,也是剑桥大学精神病学系认知神经科学教授。

Russell Thompson 是 CBU 的 IT 主管。

2020 年发布

参考文献

  • [1] Cusack, R., Vicente-Grabovetsky, A., Mitchell, D.J., Wild, C.J., Auer, T., Linke, A.C. & Peelle, J.E. (2015). “Automatic analysis (aa): efficient neuroimaging workflows and parallel processing using MATLAB and XML.” Frontiers in Neuroinformatics. https://doi.org/10.3389/fninf.2014.00090

    [2] Chan, D., Shafto, M., Kievit, R., Matthews, F., Spink, M., Valenzuela, M., Cam-CAN & Henson, R.N. (2018). “Lifestyle activities in mid-life contribute to cognitive reserve in late-life, independent of education, occupation and late-life activities.” Neurobiology of Aging, 70, 180-183. https://doi.org/10.1016/j.neurobiolaging.2018.06.012

查看文章,了解相关功能