人类表型组研究进展报告(2020).pdf
人类表型组研究进展报告 2020 引子:背景介绍 人类表型组定义 基 因 和 环 境 相 互 作 用 决 定 人 体 特 征, 人 体 特 征 即 表 型。 表 型 组 (Phenome)最初被定义为某一生物体的全部性状特征。随着人类表型组 研究不断深入,表型组目前被定义为生物体从宏观到微观(即分子组成)、 从胚胎发育到出生、成长、衰老乃至死亡过程中,形态特征、功能、行为、 分子组成规律等所有生物、物理和化学特征的集合。 图一、表型及表型组概念 后基因组时代的战略制高点 众多专家研判,人类表型组将接棒人类基因组,成为后基因组时代的战 略制高点。精密测量人体表型,全景解析人类表型组,将系统解构表型之间 强关联,构建表型网络,打通宏观表型与微观表型间多维度、跨尺度关联, 明确表型间跨尺度关联,是解析生命科技的重要线索,推动人类真正实现精 准健康管理。人体多维度、跨尺度、高精度全面测量,将绘制大数据时代的 生命科学“导航图”,探索人体小宇宙,为人类健康保驾护航。 人类表型组研究加速布局 美国、英国、德国等欧美发达国家已加速对人类表型组研究的科研支持, 近年来相关科研计划逐渐增加。美国人类表型组研究计划启动较早,2006 年, 美国加州大学戴维斯分校 MIND 研究所(MIND Institute at the University of California, Davis) 已 开 展 自 闭 症 表 型 组 研 究 计 划(Autism Phenome 1 人类表型组研究进展报告 2020 Project)。此后,美国国家癌症研究所(NCI)组织成立临床蛋白质组肿瘤 分析协作组(CPTAC),综合蛋白 - 基因组学的分析进一步阐明驱动疾病表 型的基因突变,阐明肿瘤病理生理学以探索个性化、精准临床治疗;美国国 家科学基金会 NSF 生物科学部(BIO)2015 财年预算将“根据 DNA 序列预 测个体特性(基因组到表型组)”作为核心项目之一进行重点支持;美国 国立心脏、肺和血液研究所 NHLBI 也推出 Trans-Omics(TOPMed)项目, 收集全基因组测序和其他组学数据,并将组学数据与分子、行为、成像、 环境和临床数据相结合,以改善对心脏、肺、血液和睡眠障碍的预防和治 疗;美国 NIH 启动 TGAC 试点项目利用 ExAC 等项目的数据库,研究基因、 基因变异对表型的影响;NSF 与 Simons 基金会合作,新建 4 个数学生物学 中心,将数学观点引入到生物研究中,以实现对生命规律的搜寻;NIH 下属 国家人类基因组研究中心(NHGRI)最新建立的精准健康研究计划,重点对 基因组数据进行逆向工程,使用“反向表型”(Reverse Phenotyping)即 以基因型确定表型的手段分析基因大数据,利用前沿基因组和信息工具, 开发和评估下一代健康护理方法,实现疾病诊断、治疗和预防的改进。与 表型相关的健康科研项目在近年来也被不断推出,谷歌于 2017 年启动大型 健康项目基线计划(Project Baseline),利用各种健康新工具,通过连续 跟踪志愿者的微生物群、睡眠、锻炼和精神状态等多维度来搜集海量健康 数据,从而绘制出人体“标准健康地图”,为疾病预测提供线索;美国国 家医学院也于 2019 年启动健康长寿全球项目(Healthy Longevity Global Competition),寻求突破性创新以延长人类健康和改善晚年功能。 图二、发达国家人类表型组相关科研计划情况 欧洲也相继出台人类表型相关科研计划。德国柏林查理特医科大学于 2 人类表型组研究进展报告 2020 2008 年成立人类表型本体项目(Human Phenotype Ontology,HPO), 采用本体工程学、计算机科学对来自医学文献的表型信息进行结构化归纳, 提供了人类疾病中表型异常的标准词汇,并对表型相关词汇建立分层关系。 英国作为最早兴建人类表型组研究平台的国家,也将人类表型组研究作为优 先资助项目。2019 年 4 月,英国健康数据研究所发布一体化战略及 20192020 年度计划,将人类表型组计划列入优先行动,并启动国家表型组资源 项目;MRC 2019 年度实施计划也将人类表型组作为推进基础科研探索的重 点发展方向。 我国率先启动人类表型组研究计划,系统布局人类表型组研究。2015 年科技部基础性工作专项《中国各民族体质人类表型特征调查》布局了采集 56 个民族体质表型特征的基础工作;同年 5 月,上海市委、市政府发布的《关 于加快建设具有全球影响力的科技创新中心的意见》,将“国际人类表型组” 列入重大科技基础前沿布局。2016 年 4 月,国务院批准《上海系统推进全 面创新改革试验加快建设具有全球影响力科技创新中心方案》,国际人类表 型组被列入需布局的重大科学基础工程;同月,上海张江高科技园区启动“分 子表型组国际联合中心”项目,成为上海张江综合性国家科学中心的重要组 成部分;同年 6 月,上海市科委基础重大项目“人类表型跨尺度关联及其遗 传机制研究”启动,聚焦基因—环境—表型的互作机制,系统测量中国自然 人群的全表型谱特征,刻画健康和疾病人群的表型特征,阐明人类表型跨尺 度关联的遗传机制,为全面推动人类表型组计划聚集力量并提供重要的预研 成果;同年 8 月,上海市科技创新“十三五”规划将“国际人类表型组”列 为推进原始创新重大突破的战略方向。2017 年 12 月,复旦大学联合中科院 图三、我国人类表型组研究计划布局情况 3 人类表型组研究进展报告 2020 上海生命科学研究院、上海交通大学、上海市计量测试技术研究院申请的“国 际人类表型组计划(一期)”项目被批准获得上海市首批市级科技重大专项 资助。 “人类表型组”国际大科学计划 在国家、地区重点布局的同时,以复旦大学金力院士为代表的科学家团 队也积极组织和布局“人类表型组”国际大科学计划。在上海市首批市级科 技重大专项资助下,包含 20,000 个检测指标的自然人群表型测量已经开始, 计划在上海实现示范人群 1,000 人全景测量,10,000 人应用示范测量。未 来期望精密测量全球代表人群 5 万人,应用示范测量 50 万人。在同一技术 标准,共享数据资源的分布型国际大科学计划模式下,绘制人类表型组“导 航图”。 引领新一轮生命科学与生物产业革命 作为生命科学研究新范式,人类表型组研究必将通过策动原始创新、支 撑精准医学、引领国际合作及激发产业变革等多方面引领新一轮生命科学与 生物产业革命。 图四、人类表型组国际大科学计划 4 人类表型组研究进展报告 2020 第一部分 人类表型组研究“奇点初露” 人类表型组研究进入高速发展期 人类表型组研究在近十年进入了高速发展期。人类表型组论文数量增速 明显,2020 年人类表型组研究热度明显提升。以美国人类遗传学年会报告 为例,围绕“表型组”、“基因组 - 表型组”、“全表型组关联分析”的报 告在 2017 年仅有 15 篇,2019 年跃增至 59 篇,整合表型组学、基因组学 的多组学方法对疾病进行综合分析,开展个性化治疗已成为学科关注热点。 表型组计划成为学界共识 2003 年,Nelson Freimer 和 Chiara Sabatti 在 Nature Genetics 上 撰 文倡议发起“人类表型组计划(The Human Phenome Project,HPP)”, 倡议集合更强大、标准化及多样性的人类表型数据库,集成一系列科学学科, 同时带动诸如美国国立卫生研究院(NIH)和英国维康基金会(Wellcome Trust)等公共机构、非营利机构以及生物制药与其他行业之间的合作。自 人类表型组计划提出后,表型组研究的重要性逐渐成为学界共识。 2005 年 Science 杂志创刊 125 周年之际,公布了当代 125 个最具挑战 性的科学问题,其中“遗传变异与健康关联”、“人的基因为何如此之少”、 “什么基因改变造成了人类的独特性”等遗传与发育问题位居前列,这些问 题的核心和瓶颈在于无法将基因、环境因素与表型进行关联。2010 年英国 New Scientist 杂志盘点可能改变科学的 50 个想法,其中表型组(phenome) 位列第 13 位,该文认为表型组是现阶段的科学研究重点之一,将带来巨大 突破。2013 年,Nature 杂志评述探讨了蓬勃发展的各种组学的必要性,认 为表型组对疾病相关表型信息进行系统梳理,可对医疗健康大数据起到“点 石成金”的作用,前景非常光明。2016 年,美国国家科学基金会(NSF) 在 Science 杂志发表文章为 NSF 未来几十年的发展描绘蓝图,提出六大科 研前沿和三大机制改革建议,“理解生命的规律:预测表型”位列第三。 2018 年,Nature 杂志技术展望, “连接基因型和表型(Linking genotype and phenotype)”被列为 2018 年度可改变生命科学研究的技术领域之一。 2019 年 Science 杂志以“从基因型到表型”为题出版特刊,对基因型与表 5 人类表型组研究进展报告 2020 型的关系进行了分析与总结。2020 年 Nature Review Genetics 杂志以“遗 传学和基因组学的未来之路”为题刊登述评,美国科学院院士、国家医学科 学院院士、印度国立科学院院士 Aravinda Chakravarti 将“解码多因素表型” 列为未来方向之一。 图五、部分学界述评 除了以上学界述评反复强调表型组重要性,各学科也纷纷认识到表型 组研究的重要性。2012 年,全球最大的人类遗传学会议——美国人类遗 传学年会 ASHG 上召开了为人类表型组计划做准备(Getting ready for the Human Phenome Project)主题的人类变异组计划论坛(The 2012 Forum of the Human Variome Project),明确了建立人类表型组计划的必要性和 可行性。此后,ASHG 年会上基于表型组学、基因组 - 表型组和全表型组关 联分析(PheWAS)的研究逐年增加。2019 年 Nature 杂志刊发人类疾病遗 传学简史综述,系统回顾了人类疾病遗传学发展的里程碑事件,提出:要充 分发挥基因组学的潜力,需要在多个方面进行持续的协作努力,以确保基因 突变与表型图谱更为详细,全面地了解疾病,为将来临床治疗转化提供依据 和靶点。2020 年心血管领域顶级杂志 Circulation 刊登专家意见,提出流行 病学仅能对于心血管疾病风险进行中度预测,而表型,如影像学的加入可系 统确定其风险,表型测量对心血管疾病风险预测更有意义。 各国加速投资人类表型组研究平台设施 1996 年欧洲启动了罕见疾病及相关药物等信息的 Orphanet 知识库建 设,对 1000~2000 个罕见疾病表型标准术语达成统一,并于 2000 年启动 6 人类表型组研究进展报告 2020 建设了 Orpha.net,以其详实权威的罕见病资料,成为患者、医院、各大研 究机构和制药公司的首选信息提供者和合作对象。 英国对于表型研究的布局较早,早在 1999 年就提议建设英国生物样本 库(UK Biobank)并于 2007 年启动。该样本库向研究人员提供其所采集的 包括人类表型在内的材料,是英国迄今以来规模最大的健康研究项目之一。 2012 年,英国医学研究理事会(MRC)宣布与英国国家健康研究所(NIHR) 合作建立 MRC-NIHR 表型组研究中心(MRC-NIHR Phenome Centre)。这 是世界首个表型组中心,使用 2012 年伦敦奥运会药物代谢检测实验室设施, 为研究人员探索疾病特征,开发新药和治疗方案创造了良好条件。用于人类、 动植物表型筛选的英国国家表型筛查中心(National phenotypic screening center, NPSC)为生物学家提供了验证表型分析的机会。 2012 年 11 月,美国国立卫生研究院(NIH)下属国家生物技术信息中 心(NCBI)宣布启动一项名为 ClinVar 的公共免费数据库,用于支持开展人 类基因型 - 医学重要表型关系的研究。 2014 年,德国建立结构系统生物学中心(CSSB),通过使用“超级显微镜”, 如正负电子储存环 PETRA III 期设施(PETRA III)和未来 X 射线自由电子激光 试验装置(XFEL), 研究生物样本的微观表型进而分析疾病的表型和分子基础。 澳大利亚也于 2019 年布局了澳大利亚国家表型组中心(ANPC),由 默多克大学(Murdoch University)领导,研究基因、环境和生活方式对人 类和动物健康的复杂相互作用和影响。 图六、全球人类表型组研究平台设施情况 7 人类表型组研究进展报告 2020 各国纷纷布局作为基础的战略性大队列 大队列是人类表型组研究的基础。目前,基于大型队列研究系统采集人 类表型,研究环境与基因共同作用下人类疾病的发生、发展情况已被学界广 泛接受。过去十年,世界各国对大型队列研究高度重视,多个国家将其作为 重要战略性科研方向投入大量资金。英国和美国的精准医学计划都将其作为 主要资助方向。我国队列研究启动较早,于 2007 年成立的泰州队列是我国 最大的人群队列之一,队列规模 20 万人,持续跟踪 13 年,基于表型组研 究搜集了 150 万份生物样本。 进展一大型队列研究成果斐然 英国大型前瞻性队列研究 UK Biobank(UKB)于 2006 年 3 月启动,是 迄今世界上已建成的最大规模人类信息资源库,共收集了五十万人的健康数 据和生物样本。从 2010 年开始,UKB 陆续对参与者进行了多项数据采集, 并于 2016-2017 年先后开展生物标记物分析、医学影像研究及大规模基因 测序计划,皆已取得较大进展。截至 2020 年,基于该队列数据库的成果显著, 已发表科学论文 1500 余篇,其中有 131 篇发表在顶级科学刊物上;在人群 健康监测方面,基于 UKB 数据已发表《UKB 癌症数量报告》、《UKB 恶性 肿瘤概要报告》和《UKB 死亡概要报告》,并利用数据分析为英国公共卫生 提供了多项政策建议。 成立于 2007 年的泰州队列是以我国泰州市 500 万居民为框架人群建设 的大型自然人群队列,旨在研究遗传因素、环境因素及其交互作用与重大慢 性疾病的关系。该队列由多学科参与,兼顾流行病学基本要素,系统采集生 物样本,注重各种临床表型的采集。截至 2020 年泰州队列基线人群已达 20 万例,参与者每人采集 1000 多个表型、上百种暴露资料,持续跟踪 13 年, 收集了 150 万份生物样本。泰州队列作为我国最大的单一地区生物样本库, 累积了 PB 级的健康医疗大数据资源,是国际领先的高质量、高标准的人群 资源。基于泰州队列的研究发现,对于结直肠癌、食管癌、肝癌、肺癌和胃 癌等 5 种常见恶性肿瘤,在达到现有临床确诊金标准之前,甚至在病人出现 自觉症状前,早期的癌症信号——微量肿瘤甲基化就可被无创检测。“泰州 队列”框架下系统设计的子队列——“泰州脑影像队列 (Taizhou Imaging Study)” 近年来已开展了农村社区无症状脑小血管病 (cerebral small vessel disease, CSVD) 患病情况、危险因素,及其与认知障碍、步态异常等疾病表 型的关联研究,为相关疾病提供临床干预策略。基于泰州人群的队列调查, 8 人类表型组研究进展报告 2020 阐明了饮酒与食管鳞状细胞癌高风险的关联机制,并证实了老年人、女性、 不吸烟不饮酒者口腔卫生指标较差,食管鳞状细胞癌发病风险增高。 进展二深度表型测量的系统医学成为健康医疗新范式 随着现代医学的发展进步,疾病谱发生了巨大改变,导致死亡、残疾和 生活质量下降的全球慢性病成为医疗保健系统的沉重负担。系统生物学创始 人 Leory Hood 院士及合作团队提出一种预测性、预防性、个性化和参与性 (P4)的医学新方法,包括“量化健康”和“阐明疾病”两个基本概念, 即 P4 医疗模式。多位专家呼吁将应用深度表型测量(Deep Phenotyping) 的系统医学作为医疗保健新模式,即把人体看作一个多层次网络,利用整体 方法破译人体健康和疾病的复杂生理状况。颠覆范式的系统医学利用大数据 深入、密集和动态的人类表型分析可为个人提供“科学健康”支持。深度表 型及系统医学已应用于胃肠道肿瘤、多发性骨髓瘤、妊娠期新生儿及孕产妇 2 型糖尿病代谢综合征预防以及个人健康管理等方面。 进展三人类表型多组学分析已应用于个性化医疗与健康管理 动态的个体化多组学整合分析(Integrated Personal Omics Profiling, iPOP),主要包括基因组学、转录组学、蛋白质组学、代谢组学和自身抗 体等多种组学,精准测量和描述人体临床表型和分子表型,由斯坦福大学 Snyder 教授提出。健康和疾病状态下的各种分子成分和生物学途径存在广 泛动态变化,iPOP 可以用于解释个体的健康和疾病状态,对不同个体进行 精准诊断和分析,实现精准医疗。相关的便携式生物传感器在管理健康、诊 断和分析疾病方面有积极的作用,摆脱了传统社区保健服务的地理限制。 iPOP 提出近十年,有妊娠、糖尿病、太空飞行健康风险、个体健康管理等 多个研究方向,并被证明在个体健康管理和疾病预防、早期诊断等方面有重 要的参考价值。 利用大数据方法长期追踪表型多组学数据,综合基因测序和表型多组 学数据进行个性化综合分析,可及时发现临床可诉性健康问题。2019 年 Nature Medicine 杂志报道了斯坦福大学先锋队列研究,在长期跟踪 109 位 参与者(2-8 年不等),绘制每位参与者个体生物学基线后,发现了超过 67 项可述健康问题(如代谢紊乱、心血管问题、传染病、炎症、癌症症状等), 为个人提供潜在健康问题的可治或可控建议。该研究证实,长期持续收集人 类表型组数据并应用人类表型多组学分析,可比当前医疗保健建议的年度性 健康检查更全面、及时地揭示健康问题并改善健康状况。 9 人类表型组研究进展报告 2020 第二部分 人类表型组计划加速迈进 我国率先启动人类表型组研究计划,同步启动人类表型组平台建设。 2017 年在“国际人类表型组计划(一期)”框架支持下,复旦大学成立人 类表型组研究院,研究院位于复旦大学张江校区,总面积达 4000 平方米。 目前复旦大学已预研建设了全世界首个跨尺度、多维度人类表型精密测量平 台,覆盖 15 个领域 2 万个表型检测指标,包括国内一流、国际领先的蛋白 质组与代谢组等分子表型分析平台以及包含 3D 成像和 fMRI 研究设施的体 质、结构功能表型平台,可一站式集成测量从微观到宏观多个尺度的人类表 型。中科院马普计算生物学所建立了一系列整合功能性组学数据及生物网络 分析的计算分析平台,为表型组学相关研究提供了数据整合、疾病相关网络 分析、数据预测推断等系统及分析工具。上海国际人类表型组研究院正自主 开发表型组信息数据共享与处理云平台,该平台已经通过初步测试,将尽快 完成并向全球科学界开放试用。 在平台建设的同时,我国科学家也致力于推进人类表型组国际大科学计 划。2015 年 5 月,复旦大学金力院士倡议发起并组织召开了“国际人类表 型组研究”香山科学会议,提议发起国际人类表型组计划。2016 年 5 月, 在国际遗传工程和生物技术中心(ICGEB)的资助下,复旦大学在上海组织 召开“2016 年度谈家桢遗传学国际论坛暨首届国际人类表型组大会”,复 旦大学金力院士、美国系统生物学研究所 Leroy Hood 院士、英国帝国理工 Jeremy Nicholson 院士三位科学家共同发起了启动“国际人类表型组研究计 划”的倡议,奠定了我国在国际人类表型组研究中的话语权。2018 年 10 月, 复旦大学牵头举办第二届国际人类表型组研讨会,“人类表型组计划国际协 作组”和“中国人类表型组研究协作组”宣告成立,初步明确“人类表型组” 国际大科学计划的实施路线图、合作机制和组织架构,为国际人类表型组大 科学计划在全球范围正式启动实施迈出了最关键的一步。2018 年 12 月, “中 国人类表型组研究协作组标准与技术规范工作组”在复旦大学正式成立,来 自复旦大学、中国计量科学研究院(简称“中国计量院”)、中国电子技术 标准化研究院、上海计量测试技术研究院和中电集团等单位的二十三位计量 10 人类表型组研究进展报告 2020 和标准化领域专家担任工作组成员,工作组此后努力推动国际组学大数据质 量控制学会 (MAQC Society) 中国分会成立,并向 ISO 申请成立“人类表型 组技术委员会”。2018 年 11 月 1 日,复旦大学获批了上海市科委“一带一路” 国际联合实验室项目——“丝路人类学”国际联合实验室,为推动人类表型 组国际大科学计划打下基石。“2019 年金砖国家大学联盟首届全体大会” 上金力院士做了主旨演讲,通过开展人类表型组国际合作,倡议金砖国家人 类健康共同体,标志着“人类表型组”国际大科学计划进入一个新的里程碑。 复旦大学于 2019 年牵头成立的新型研发机构上海国际人类表型组研究 院,是组织实施人类表型组国际大科学计划的战略科技力量与核心研究平台, 致力于建成推进人类表型组大科学计划的国内外协调机构、战略性科研力量 和高质量转化平台。 图七、2016 年度谈家桢遗传学国际论坛暨首届国际人类表型组大会 图八、2018 年第二届国际人类表型组研讨会 目前,中国人类表型组研究协作组(HPCC)共吸纳 77 名协作组委员, 其中院士 26 位,联合国内 33 家高校科研院所、22 家三甲医院和 5 家国内 知名企业;国际人类表型组研究协作组(IHPC)联合来自 17 个国家、21 家 科研机构的相关领域顶级专家,理事中含各国院士 10 位。 11 人类表型组研究进展报告 2020 2020 年 10 月 24-26 日,第三届国际人类表型组研讨会·第二届中国人 类表型组大会暨中国生物物理学会表型组学分会年会在上海举行,会议以“表 型组时代的人类健康”为主题,多位国内外院士、专家等重量级学者应邀出 席大会并发表演讲。国际人类表型组研究协作组全体理事会议上与会科学家 达成重要共识:人类表型组大科学计划在近期应优先聚焦“新冠肺炎和其他 重大疾病的表型组学研究”、“表型组研究技术体系与科研基础设施构建” 以及“表型组学研究中的标准操作程序(SOPs)”三大方向稳步推进,指 出人类表型组研究优先发展方向。 图九、2020 年 10 月 24 日国际人类表型组研究协作组(IHPC)全体理事会议 12 人类表型组研究进展报告 2020 第三部分 对新冠防护做出重要贡献 揭示新冠肺炎临床特征 2020 年 1 月 24 日新冠疫情早期,王辰院士、高福院士等人联名在 The Lancet (柳叶刀)杂志在线发表评论文章,系统总结新型冠状病毒疫情的进 展情况,同时指出将来临床和基础科学研究的方向。同期柳叶刀杂志上曹彬 教授及王健伟教授团队报道了首批 41 名因 2019-nCoV 感染转入武汉定点医 院(武汉金银潭医院)接受救治患者的临床特点信息(临床表型),提供了 疫情期间宝贵的第一手临床资料。2020 年 2 月钟南山院士团队论文在 The New England Journal of Medicine 杂志在线发表论文,通过大样本的研究 揭示新冠肺炎的临床特征,分析了患者各年龄段人群分布特征、感染者症状、 病毒传播途径、防护方法、治疗方法、病死率等,并指出:严格、及时地采 取流行病学措施,对遏制疫情迅速蔓延至关重要。2020 年 2 月 12 日,武 汉大学张元珍、侯炜及北京大学杨慧霞作为共同通讯作者在 Lancet 杂志在 线发表妊娠期新型冠状病毒感染的临床特点及垂直传播潜力研究论文,回顾 性分析了 9 例新型冠状病毒感染孕产妇的流行病学特征、临床表现、多项实 验室及影像学检查结果、母胎并发症及妊娠结局等情况,为疫情期间孕产妇 及胎儿治疗提供了最早的临床资料。 多篇发表在医学顶级期刊的学术论文介绍了新冠肺炎影像学表型,中 日友好医院曹斌教授及其团队在 2020 年 1 月 24 日报道了新冠肺炎影像学 表型及实验室检查结果;2020 年 1 月 25 日中国新冠病毒研究小组在 The New England Journal of Medicine 杂志报道武汉出现新的乙型冠状病毒属 (Betacoronavirus )病毒并提供患者胸片影像学表型情况。在众多临床、 科研团队努力下,如早期淡薄的磨玻璃密度影、进展期双肺弥漫性分布磨玻 璃密度影等新冠肺炎影响学表型特征被迅速报告,助力患者检出、病程进展 监控。 2020 年 2 月 17 日, 王 福 生 院 士 团 队 在 The Lancet Respiratory Medicine 发布新冠患者病理报告,肺水肿和肺透明膜形成的病理表型报道 为探究 COVID-19 发病机制、重症患者及时呼吸支持提供理论支持。2020 13 人类表型组研究进展报告 2020 年 4 月 28 日,卞修武院士团队全面揭示新冠病人的病理表型,除了肺部病 理变化外,微观病理表型也反映出病毒在患者肺部残留,提示应延长患者检 疫时间、对患有基础病的老年患者进行后续医学检测。新冠患者病理表型为 患者医学支持、疗法改进及严重程度预判提供了有力支持。 多尺度表型组研究揭示病情进展、预测临床结局 复旦大学人类表型组研究院科研团队结合转录组学、蛋白质组学和代谢 组学来鉴定 66 例不同疾病严重程度的 COVID-19 感染患者和 17 名健康对照 者的外周血和血浆样本中的分子标记物,对患者及健康对照者进行血清全周 期跨尺度表型研究,发现基因表达、蛋白质、代谢物及细胞外 RNA(exRNAs) 与各种临床参数表现出强烈的相关性。此外,轻度和重度患者的多组织特异 性蛋白和 exRNAs 差异显著,提示新冠病毒造成多组织受损。轻重症患者免 疫表型、分子表型出现明显差异,证实新冠患者代谢、免疫失调,提示基因、 蛋白质和 exRNAs 可作为潜在的生物标志物预测 SARS-CoV-2 感染的预后, 该团队提出可预测病人临床结局的标志性蛋白,完善了对于 COVID-19 的病 理生理学和临床进展的理解。 相关技术助力新冠诊断 2020 年 4 月澳门科技大学、四川大学、清华大学、中山大学等多机构 合作,利用来自 4154 名患者的大型计算机断层扫描(CT)数据库,开发了 可以诊断新冠肺炎并将其与其他常见肺炎和正常对照区分开的 AI 系统,能 够提供准确的临床预后,帮助临床医生考虑适当的早期临床治疗并适当地 分配资源。该团队已在全球范围内提供了此 AI 系统,以协助临床医生应对 COVID-19。澳大利亚人类表型组中心基于新冠疫情中核磁共振光谱检测需 求的增加提出了血液样本处理建议,为临床分子表型样本储存和后续实验室 检测提供了有效处理建议,利用核磁共振光谱检测血液样本。该中心与其他 表型组科研团队都提出,表型组研究在重大公共卫生应急事件中,可有效弥 补核酸测试实验的不足,有效快速筛查新冠病人。动态测量相关表型的可穿 戴式生物传感器也在本次疫情中发挥了重要作用,远距离频繁测量生理数据 使疫情隔离状态下高危人群监控和极早期诊断成为可能。 14 人类表型组研究进展报告 2020 展望:新范式引领新变革 作为生命科学研究新范式,人类表型组研究带动了一批基础科研及相关 技术创新,加速产业变革。提出和积极推动人类表型组计划将加速国际协同 合作,该领域的研究、协作成果必将造福人类健康。 绘制导航图谱,策动原始创新 依托于我国得天独厚的人口及多民族遗传资源优势,借助蓬勃发展的人 体精密测量技术,人类表型组研究可以大规模发现基因 - 表型 - 环境之间、 微观表型与宏观表型间的跨尺度关联与相互作用,最终绘制出相关人群的多 维度、跨尺度、全周期的人类表型参比图谱,成为继人类基因组计划后,解 析复杂生命过程机理的新一代“导航图”。 支撑精准医学,服务人类健康 人类表型组研究可以明确各类疾病的致病因素及演变系谱,从根本上提 高医学诊断的效率和准确性,支撑精准医学的发展,实现对疾病的精准分型、 精准分类、精准诊断和精准治疗,提升医疗保障格局,造福人类健康。 积聚创新要素,打造合作高地 随着中国科研产出的增长,中国科研对全球的贡献和影响力不断增加。 通过打造人类表型组计划,利用人类表型组科研理念、科研设施、组织方式、 标准体系、目标规划、公共产品供给以及转化应用等方面的领先优势,有助 于完善我国牵头生命科学国际合作的经验,吸引国际顶尖人才、高水平机构 与我国开展科技合作与交流,集聚创新要素,为打造国际国内双循环的战略 链接保驾护航。 加速产业变革,驱动创新发展 人类表型组研究将发现一批全新的表型标志物,整量级获得药物新靶点、 新机制,为新型诊断试剂和产品、下一代原创新药、个性化健康管理装备、 智慧医疗器械与设备的研发提供超级引擎;形成高精度的生物与健康大数据 资源库,为培育和发展基于“表型组 + 大数据”“表型组 + 人工智能”的 大健康产业提供丰富、坚实、多元的数据基础。人类表型组科研成果的应用 15 人类表型组研究进展报告 2020 和转化,将为我国引领全球生物医药产业变革和培育大健康产业新兴增长极 提供持久的创新动力,能有效地带动医药制造和健康产业发展,具有重大社 会经济价值。 人类表型组研究进展汇编 2020 年 10 月 25 日,《人类表型组研究进展汇编第一辑·2020》在中 国人类表型组研究协作组年会上正式发布。汇编聚焦“人类表型组计划”相 关研究重点,系统总结了人类表型组研究国际动态、平台设施情况、全球研 究进展等,为“人类表型组计划”相关工作的开展提供理论和实践支撑。 图十、人类表型组研究进展汇编 16 人类表型组研究进展报告 2020 参考文献 [1] Autism Phenome Project. Available from: https://health.ucdavis.edu/mindinstitute/ research/autism-phenome-project/index.html. [2] National Cancer Institute’s Clinical Proteomic Tumor Analysis Consortium (CPTAC) Available from: https://proteomics.cancer.gov/programs/cptac. [3] Human Phenotype Ontology(HPO). Available from: www.humanphenotypeontology.org. [4] Trans-Omics for Precision Medicine Program. Available from: https://www.nhlbi. nih.gov/science/trans-omics-precision-medicine-topmed-program. [5] Strategic Vision. Available from: https://www.nhlbi.nih.gov/about/strategic-vision. [6] NIH pilot project will match researchers to genes, gene variants of interest.; Available from: https://www.nih.gov/news-events/news-releases/nih-pilot-projectwill-match-researchers-genes-gene-variants-interest. [7] NSF-Simons centers to search for the Rules of Life. . Available from: https://www. nsf.gov/news/news_summ.jsp?cntn_id=245523&org=NSF&from=news. [8] Health Data Research UK launches £3M national research projects to create tools and technologies for data research. Available from: https://www.hdruk.ac.uk/ news/3m-national-research-projects/. [9] National Academy of Medicine Launches Global Competition Seeking Solutions for Improving Healthy Longevity. Available from: https://nam.edu/national-academyof-medicine-launches-global-competition-seeking-solutions-for-improving-healthylongevity/. [10] NHGRI establishes new intramural precision health research program. Available from: https://www.genome.gov/news/news-release/NHGRI-establishes-newintramural-precision-health-research-program. [11] NHGRI Precision Health Research Program Using Reverse Phenotyping to Better Understand Genomics. Available from: https://www.genomeweb.com/researchfunding/nhgri-precision-health-research-program-using-reverse-phenotyping-betterunderstand#.X5puLEfitPZ. 17 人类表型组研究进展报告 2020 [12] MRC Delivery Plan 2019. Available from: https://www.ukri.org/files/about/dps/mrcdp-2019/. [13] Health Nucleus. Available from: https://www.healthnucleus100plus.com/. [14] Project Baseline. Available from: https://www.projectbaseline.com. [15] all of us. Available from: https://allofus.nih.gov/. [16] orpha.net. Available from: https://www.orpha.net. [17] Centre for Structural Systems Biology. Available from: https://www.cssb-hamburg. de/about_us/index_eng.html. [18] National phenotypic screening center. Available from: https://npsc.ac.uk/. [19] Hickie, I., et al., Complex genetic and environmental relationships between psychological distress, fatigue and immune functioning: a twin study. Psychol Med, 1999. 29(2): p. 269-77. [20] Golding, J., et al., ALSPAC--the Avon Longitudinal Study of Parents and Children. I. Study methodology. Paediatr Perinat Epidemiol, 2001. 15(1): p. 74-87. [21] Cardno, A.G., et al., A twin study of genetic relationships between psychotic symptoms. Am J Psychiatry, 2002. 159(4): p. 539-45. [22] Freimer, N. and C. Sabatti, The human phenome project. Nat Genet, 2003. 34(1): p. 15-21. [23] Kennedy, D. and C. Norman, What don't we know? Science, 2005. 309(5731): p. 75. [24] Robinson, P.N., et al., The Human Phenotype Ontology: a tool for annotating and analyzing human hereditary disease. Am J Hum Genet, 2008. 83(5): p. 610-5. [25] Fifty ideas that will change science forever, in New Scientist. 2010: UK. p. 18. 26. Chen, R., et al., Personal omics profiling reveals dynamic molecular and [26] medical phenotypes. Cell, 2012. 148(6): p. 1293-307. [27] Payne, T., London 2012 anti-doping laboratory to be developed into the world's first Phenome Center. Bioanalysis, 2012. 4(16): p. 1975-1975. [28] Baker, M., Big biology: The 'omes puzzle. Nature, 2013. 494(7438): p. 416-9. [29] Imboden, M. and N.M. Probst-Hensch, Biobanking across the phenome - at the center of chronic disease research. Bmc Public Health, 2013. 13. [30] Oetting, W.S., et al., Getting ready for the Human Phenome Project: the 2012 forum of the Human Variome Project. Hum Mutat, 2013. 34(4): p. 661-6. [31] Landrum, M.J., et al., ClinVar: public archive of relationships among sequence variation and human phenotype. Nucleic Acids Research, 2014. 42(D1): p. D980-D985. 18 人类表型组研究进展报告 2020 [32] Kuriyama, S., et al., The Tohoku Medical Megabank Project: Design and Mission. J Epidemiol, 2016. 26(9): p. 493-511. [33] Mervis, J., SCIENCE POLICY. NSF director unveils big ideas. Science, 2016. 352(6287): p. 755-6. [34] Taglang, G. and D.B. Jackson, Use of "big data" in drug discovery and clinical trials. Gynecol Oncol, 2016. 141(1): p. 17-23. [35] Kohler, S., et al., The Human Phenotype Ontology in 2017. Nucleic Acids Res, 2017. 45(D1): p. D865-D876. [36] Price, N.D., et al., A wellness study of 108 individuals using personal, dense, dynamic data clouds. Nat Biotechnol, 2017. 35(8): p. 747-756. [37] Bycroft, C., et al., The UK Biobank resource with deep phenotyping and genomic data. Nature, 2018. 562(7726): p. 203-209. [38] Koshiba, S., et al., Omics research project on prospective cohort studies from the [39] Tohoku Medical Megabank Project. Genes Cells, 2018. 23(6): p. 406-417. Landrum, M.J., et al., ClinVar: improving access to variant interpretations and supporting evidence. Nucleic Acids Research, 2018. 46(D1): p. D1062-D1067. [40] Powell, K., Technology to watch in 2018. Nature, 2018. 553(7689): p. 531-534. [41] Trachana, K., et al., Taking Systems Medicine to Heart. Circ Res, 2018. 122(9): p. 1276-1289. [42] Andersson, C., et al., 70-year legacy of the Framingham Heart Study. Nat Rev Cardiol, 2019. 16(11): p. 687-698. [43] Camp, J.G., R. Platt, and B. Treutlein, Mapping human cell phenotypes to genotypes with single-cell genomics. Science, 2019. 365(6460): p. 1401-1405. [44] Cybulska, B. and L. Klosiewicz-Latoszek, Landmark studies in coronary heart disease epidemiology. The Framingham Heart Study after 70 years and the Seven Countries Study after 60 years. Kardiol Pol, 2019. 77(2): p. 173-180. [45] Knijnenburg, T.A., et al., Genomic and molecular characterization of preterm birth. Proc Natl Acad Sci U S A, 2019. 116(12): p. 5819-5827. [46] Li, S., et al., Incidental findings on brain MRI among Chinese at the age of 55-65 years: the Taizhou Imaging Study. Sci Rep, 2019. 9(1): p. 464. [47] Lynch, J.B. and E.Y. Hsiao, Microbiomes as sources of emergent host phenotypes. Science, 2019. 365(6460): p. 1405-1409. [48] Marciano, D.P. and M.P. Snyder, Personalized Metabolomics. Methods Mol Biol, 2019. 1978: p. 447-456. 19 人类表型组研究进展报告 2020 [49] Minegishi, N., et al., Biobank Establishment and Sample Management in the Tohoku Medical Megabank Project. Tohoku J Exp Med, 2019. 248(1): p. 45-55. [50] Runkle, J., et al., Use of wearable sensors for pregnancy health and environmental monitoring: Descriptive findings from the perspective of patients and providers. Digit Health, 2019. 5: p. 2055207619828220. [51] Schussler-Fiorenza Rose, S.M., et al., A longitudinal big data approach for precision health. Nat Med, 2019. 25(5): p. 792-804. [52] Wang, Y., et al., Deep/mixed cerebral microbleeds are associated with cognitive dysfunction through thalamocortical connectivity disruption: The Taizhou Imaging Study. Neuroimage Clin, 2019. 22: p. 101749. [53] Yasuda, J., et al., Genome analyses for the Tohoku Medical Megabank Project towards establishment of personalized healthcare. J Biochem, 2019. 165(2): p. 139-158. [54] Young, A.I., et al., Deconstructing the sources of genotype-phenotype associations in humans. Science, 2019. 365(6460): p. 1396-1400. [55] Zeggini, E., et al., Translational genomics and precision medicine: Moving from the lab to the clinic. Science, 2019. 365(6460): p. 1409-1413. [56] Zubair, N., et al., Genetic Predisposition Impacts Clinical Changes in a Lifestyle Coaching Program. Sci Rep, 2019. 9(1): p. 6805. [57] Chen, H., et al., Clinical characteristics and intrauterine vertical transmission potential of COVID-19 infection in nine pregnant women: a retrospective review of medical records. Lancet, 2020. 395(10226): p. 809-815. [58] Chen, Y.M., et al., Blood molecular markers associated with COVID-19 immunopathology and multi-organ damage. EMBO J, 2020: p. e105896. [59] Claussnitzer, M., et al., A brief history of human disease genetics. Nature, 2020. 577(7789): p. 179-189. [60] Cui, M., et al., Metabolomics and incident dementia in older Chinese adults: The Shanghai Aging Study. Alzheimers Dement, 2020. 16(5): p. 779-788. [61] Gray, N., et al., UHPLC-MS-Based Lipidomic and Metabonomic Investigation of the Metabolic Phenotypes of Wild Type and Hepatic CYP Reductase Null (HRN) Mice. J Pharm Biomed Anal, 2020. 186: p. 113318. [62] Guan, W.J., et al., Clinical Characteristics of Coronavirus Disease 2019 in China. N Engl J Med, 2020. 382(18): p. 1708-1720. [63] Huang, C., et al., Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China. Lancet, 2020. 395(10223): p. 497-506. 20 人类表型组研究进展报告 2020 [64] Jiang, Y., et al., Lifestyle, multi-omics features, and preclinical dementia among Chinese: The Taizhou Imaging Study. Alzheimers Dement, 2020. [65] Jiang, Y., et al., Associations between serum metabolites and subclinical atherosclerosis in a Chinese population: the Taizhou Imaging Study. Aging (Albany NY), 2020. 12(15): p. 15302-15313. [66] Kalathiya, U., et al., Highly Conserved Homotrimer Cavity Formed by the SARSCoV-2 Spike Glycoprotein: A Novel Binding Site. J Clin Med, 2020. 9(5). [67] Kimhofer, T., et al., Integrative Modeling of Quantitative Plasma Lipoprotein, Metabolic, and Amino Acid Data Reveals a Multiorgan Pathological Signature of SARS-CoV-2 Infection. J Proteome Res, 2020. 19(11): p. 4442-4454. [68] Koundouros, N., et al., Metabolic Fingerprinting Links Oncogenic PIK3CA with Enhanced Arachidonic Acid-Derived Eicosanoids. Cell, 2020. 181(7): p. 1596-1611 e27. [69] McGuire, A.L., et al., The road ahead in genetics and genomics. Nat Rev Genet, 2020. 21(10): p. 581-596. [70] Paquette, A.G., et al., Deep phenotyping during pregnancy for predictive and preventive medicine. Sci Transl Med, 2020. 12(527). [71] Qiao, J., What are the risks of COVID-19 infection in pregnant women? Lancet, 2020. 395(10226): p. 760-762. [72] Quer, G., et al., Wearable sensor data and self-reported symptoms for COVID-19 detection. Nat Med, 2020. [73] Wang, C., et al., A novel coronavirus outbreak of global health concern. Lancet, 2020. 395(10223): p. 470-473. [74] West, K.A., et al., Longitudinal metabolic and gut bacterial profiling of pregnant women with previous bariatric surgery. Gut, 2020. [75] Wierzbicki, A.S., Phenomics, Not Genomics, for Cardiovascular Risk Assessment. Circulation, 2020. 142(9): p. 821-823. [76] Wong, C.K., et al., Artificial intelligence mobile health platform for early detection of COVID-19 in quarantine subjects using a wearable biosensor: protocol for a randomised controlled trial. BMJ Open, 2020. 10(7): p. e038555. [77] Xu, Z., et al., Pathological findings of COVID-19 associated with acute respiratory distress syndrome. Lancet Respir Med, 2020. 8(4): p. 420-422. [78] Yurkovich, J.T., et al., A systems approach to clinical oncology uses deep phenotyping to deliver personalized care. Nat Rev Clin Oncol, 2020. 17(3): p. 183-194. 21 人类表型组研究进展报告 2020 [79] Zhang, K., et al., Clinically Applicable AI System for Accurate Diagnosis, Quantitative Measurements, and Prognosis of COVID-19 Pneumonia Using Computed Tomography. Cell, 2020. 182(5): p. 1360. [80] Zhou, F., et al., Clinical course and risk factors for mortality of adult inpatients with COVID-19 in Wuhan, China: a retrospective cohort study. Lancet, 2020. 395(10229): p. 1054-1062. [81] Zhu, N., et al., A Novel Coronavirus from Patients with Pneumonia in China, 2019. N Engl J Med, 2020. 382(8): p. 727-733. 22