AI“算命”,提前20年预测上千种疾病
DeepSeek登上《自然》封面;华为发布全球最强算力超节点和集群;英伟达投资50亿美元收购英特尔股份;罗氏以35亿美元收购89bio;脑机接口动态电极“神经蠕虫”;AI设计病毒,能够感染并杀死耐药细菌;成功构建功能性人类肾脏类器官;破解“植物细胞全能性”机制之谜;中国推进面向东盟的AI创新合作;英美达成《科技繁荣协议》。
责任编辑:黄金萍
9月17日,德国癌症研究中心(DKFZ)、欧洲分子生物学实验室、欧洲生物信息学研究所(EMBL-EBI)、哥本哈根大学的研究团队在《自然》(Nature)发表论文,Learning the natural history of human disease with generative transformers,介绍了一款AI模型Delphi-2M,可高精度预测未来20年中超过1000种疾病的发生率。
团队将ICD-10编码(WHO制定的国际统一疾病分类标准),再加上参与者的性别、BMI(体重指数),以及与健康相关的习惯(例如吸烟和饮酒情况),共计1258个信息作为tokens。
模型训练采用英国生物库(UK Biobank)40.2万参与者的数据,80%的数据作为训练数据,20%作为验证和优化数据;之后还在丹麦193万人群的外部数据集上实现了无参数调整的有效迁移,展现出跨人群与医疗体系的适配性。

Delphi是一种改进的GPT架构,对健康轨迹进行建模。图片来源:Nature。
研究团队将Delphi-2M预测验证队列中各种疾病结果的准确性,与作为流行病学基线的性别和年龄分层发病率进行了比较。Delphi-2M预测效果良好,能有效识别不同疾病的年龄和性别分层的发生趋势,年龄性别分层AUC均值达0.76,其中死亡预测AUC高达0.97,且97%的疾病预测AUC超过0.5。(AUC,即模型预测的曲线下面积,取值范围在0.5到1之间,0.5表示与随机猜测无异,越接近1模型的分类能力越强。)
基于个人医疗史,Delphi-2M能预测超过1000种疾病的发生率,还能模拟个体未来几十年的健康变化轨迹。根据过往健康信息,Delphi-2M能模拟未来20年的健康变化路径,为潜在疾病的评估提供有效工具。
目前,该模型仍需进一步验证,尚未准备应用于临床。研发人员提醒,所使用的数据集并不具有完全的代表性,存在与年龄、种族和医疗保健获取相关的偏差。
近两年,众多研究机构和企业纷纷投身于利用AI进行疾病预测的探索。
2025年8月,阿尔托大学研究人员开发了一款新型AI工具survivalFM,能精确预测个体患常见疾病(心血管疾病、糖尿病或肝脏疾病等)的风险。(见《2025科创要闻No.35》)
2025年7月,温州医科大学、北京大学等研究团队合作开发了多模态集成AI模型LUCID,通过多模态临床信息整合,实现了对肺癌分子的表型分析及预后预测。
复旦大学团队在2024年11月也研发了一套“人类健康与疾病蛋白质组图谱”,通过AI算法的辅助,只需通过简单的血浆蛋白组检测,就能提前诊断和预测包括心脏病、糖尿病、阿尔茨海默病等上百种疾病的患病风险。(见《2024科创要闻No.44》)
阿斯利康2024年9月发布疾病预测AI开源模型MILTON,该模型分析以67种数量性状(包括血液化学、尿液分析等),针对三千多种疾病建立预测模型。
随着越来越多的企业投入AI预测疾病,AI真的可以“算命”了。你会愿意依据AI的预测,健康但按部就班地度
登录后获取更多权限
校对:赵立宇