news 2026/7/4 21:45:27

【文献分享】COSIME:具有可扩展性和可解释性模型解释器的协同多视角整合

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
【文献分享】COSIME:具有可扩展性和可解释性模型解释器的协同多视角整合

文章目录

    • 介绍
    • 代码
    • 参考

介绍

单组学方法往往只能对复杂的生物系统提供有限的视角,而多组学整合则能够通过整合各种数据视角来实现更全面的理解。然而,整合不同类型的异质数据以及解析生物特征(包括同一视角和不同视角之间)之间的复杂关系仍然是一个重大挑战。在此,为应对这些挑战,我们引入了 COSIME(具有可扩展性和可解释模型解释器的协同多视角整合)。COSIME 将可学习的最优传输算法的反向传播应用于深度神经网络,从而能够从多个视角学习潜在特征以预测疾病表型。它还结合了蒙特卡罗抽样,以便能够对同一视角和不同视角内的特征重要性和两两特征相互作用进行可解释的评估。我们将 COSIME 应用于模拟和真实世界的数据集——包括单细胞转录组学、空间转录组学、表观基因组学和代谢组学——以预测与阿尔茨海默病相关的表型。对现有方法的基准测试表明,COSIME 提高了预测的准确性,并具有可解释性。例如,它表明与阿尔茨海默病相关的星形胶质细胞和小胶质细胞基因之间的协同作用更有可能集中在中颞回的边缘区域。最后,COSIME 还作为一个开源工具公开可用。

单组学方法对于复杂生物系统的研究作用有限,因为每一个分子层面(例如基因组学、转录组学或代谢组学)都是与其他层面相互协作发挥作用的。多视角数据整合通过整合多个层面来识别新的生物标志物、理解疾病机制并改进表型预测1,2。机器学习能够高效地分析大规模多视角数据,并模拟影响表型的跨视角相互作用。
针对多视角数据整合已开发出多种方法。协同学习(CL)3 是一种有监督学习方法,它将平方误差损失与一种鼓励不同视角下特征相似性的一致性惩罚相结合。该惩罚强度是固定的且需手动调整,这限制了动态适应和跨视角交互的端到端学习。利用潜在成分进行生物标志物发现的数据整合分析(DIABLO)4 通过有监督的特征选择来识别不同组学层面上共有的结构,但假定它们与结果的关联具有同质性,而在异质数据集中这可能并不成立。多组学因子分析 v.2(MOFA+)5 是一种无监督因子分析方法,它对不同视角下的潜在线性结构进行建模,但缺乏交互分析或解释预测特征的机制。此外,这些模型通常假定线性关系,并且不利用深度学习或最优传输(OT)。
可解释性是另一个主要的挑战。SHAP(沙普利可加性解释)6 可以量化特征的解释度,但对于复杂的模型计算成本较高,并且只能为基于树的模型分配交互贡献。LIME7 为单个预测提供了局部可解释性,但缺乏全局解释,并且也不考虑特征之间的交互作用。
为解决这些局限性,我们引入了具有可扩展性和可解释性模型解释器的协同多视图整合方法(COSIME)。COSIME 由两个部分组成:(1)一个整合组件,它使用深度神经编码器和可学习的最优传输算法(LOT)在联合潜在空间中对视图进行对齐,并预测疾病表型;(2)一个解释组件,它使用肖普利值和肖普利-泰勒指数来估计特征重要性(FI)和成对相互作用。我们在模拟和真实世界的数据集上对 COSIME 进行了评估,以使用转录组学、代谢组学、表观基因组学和空间转录组学来预测阿尔茨海默病(AD)表型,并展示了其强大的预测性能、灵活性和可解释性。

代码

https://github.com/daifengwanglab/COSIME

参考

  • Cooperative multi-view integration with a scalable and interpretable model explainer
  • https://github.com/daifengwanglab/COSIME
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/7/2 17:56:12

Citra模拟器联机游戏终极指南:5步快速实现远程对战

Citra模拟器联机游戏终极指南:5步快速实现远程对战 【免费下载链接】citra 项目地址: https://gitcode.com/GitHub_Trending/ci/citra 还在为无法与好友远程联机玩3DS游戏而烦恼吗?🎮 Citra模拟器的网络功能为你打开了全新的游戏世界…

作者头像 李华
网站建设 2026/7/4 16:20:08

从实战角度解析sktime软依赖管理:构建稳健的时间序列分析环境

从实战角度解析sktime软依赖管理:构建稳健的时间序列分析环境 【免费下载链接】sktime sktime是一个用于机器学习中时间序列预测和分析的Python库,提供了丰富的数据预处理、特征提取和模型评估方法,适用于金融、气象等领域的数据分析。 项目…

作者头像 李华
网站建设 2026/7/3 4:49:50

第七十五篇:Kubernetes入门:Pod, Deployment, Service核心概念深度解析

一、引言:从单机编排到集群编排的革命 1.1 容器编排的演进历程 容器技术发展至今,已经从单机运行演变为大规模集群编排的时代。让我们回顾这一演进路径: 容器技术演进 {"2000年代": "chroot -> LXC -> 进程隔离技术&qu…

作者头像 李华
网站建设 2026/7/4 13:18:36

快速获取Windows Server 2022官方镜像的完整指南

快速获取Windows Server 2022官方镜像的完整指南 【免费下载链接】WindowsServer2022官方镜像ISO下载 本仓库提供的是Windows Server 2022的官方镜像ISO文件,该镜像是我专栏中使用的版本,同时也是网络搭建比赛所采用的镜像。此镜像适用于日常使用、比赛、…

作者头像 李华
网站建设 2026/7/4 14:35:32

Triton C++客户端异步推理:解锁高性能AI服务的终极指南

Triton C客户端异步推理:解锁高性能AI服务的终极指南 【免费下载链接】server The Triton Inference Server provides an optimized cloud and edge inferencing solution. 项目地址: https://gitcode.com/gh_mirrors/server/server 在当今AI应用爆炸式增长的…

作者头像 李华
网站建设 2026/7/3 16:01:29

从零掌握Cartographer PBStream:地图持久化的终极解决方案

从零掌握Cartographer PBStream:地图持久化的终极解决方案 【免费下载链接】cartographer Cartographer is a system that provides real-time simultaneous localization and mapping (SLAM) in 2D and 3D across multiple platforms and sensor configurations. …

作者头像 李华