德克萨斯农工大学使用 MATLAB 进行单细胞 RNA 测序数据分析

工程推进量子计算在生命科学中的应用

“MATLAB 为开发量子计算算法提供了无缝可靠的环境。 它的量子计算支持包在可用性、稳定性和可移植性方面具有显著优势,极大地促进了我们的研究。”

关键成果

  • MATLAB 量子计算支持包支持在本地轻松测试算法,从而实现快速开发和方法验证
  • MATLAB 在可用性、稳定性和可移植性方面优于其他量子计算开发软件(例如 Qiskit®)。
  • MATLAB Support Package for Quantum Computing 结构清晰、易于理解,有助于快速实现量子算法。
三个图,一个展示了从胚胎干细胞到内皮细胞的细胞分化轨迹,一条折线图显示了使用 LASSO 在伪时间上的标准化基因表达,以及一个使用 QUBO 的图,突出显示了基因表达趋势的差异。

在图 C 中,绿色线条突出显示了通过 LASSO 和 QUBO 两种方法共同识别的 18 个基因,而未突出显示的线条表示仅通过 QUBO 方法识别的基因。

在德克萨斯农工大学兽医与生物医学科学学院,James Cai 教授正在领导一个跨学科项目,利用量子计算分析单细胞基因表达数据。 Cai 教授的团队正在利用基于门的量子计算来构建网络,以展示基因如何相互调控。 他们还使用一种称为模拟量子退火 (QA) 的方法,并结合二次无约束二元优化 (QUBO),从 scRNA-seq 数据中筛选出参与细胞如何变化和发育的重要基因。

MATLAB® Tabu 搜索实现被用于模拟退火以求解 QUBO 问题。 例如,基于 QUBO 的特征选择算法在最初从 5,000 个特征中筛选出的 50 个特征中,识别出了 10 个表观非线性的基因相互作用。 在这 50 个特征中,仅有 18 个与采用 LASSO 对比选择方法所识别的特征重叠。 这表明 QUBO-QA 方法不仅捕捉了核心的线性基因表达,还揭示了复杂的非线性基因表达模式。

Statistics and Machine Learning Toolbox™ 在整个项目中被广泛使用,尤其是在数据处理工作流中。 Cai 教授开发了 scGEAToolbox,以便在 MATLAB 环境下高效分析 scRNA-seq 数据。 该工具箱涵盖了数据归一化、特征选择、细胞聚类、细胞类型注释、伪时序分析、基因网络构建、虚拟基因敲除分析以及细胞间通讯分析等一系列功能。 他们还使用了 Curve Fitting Toolbox™、Parallel Computing Toolbox™ 和 Image Processing Toolbox™ 进行可视化和补充分析。

该项目是量子计算在生命科学领域应用的一个里程碑式的例子。 借助 MATLAB,合作研究者能够复现并拓展这一开创性工作,进一步推动量子计算在转录组学研究中的应用。 从长远来看,这一进展有望深刻变革基于个体遗传信息的个性化诊断与治疗的发展模式。