表观基因组关联研究开放平台EWAS Open Platform发布
近日,由中国科学院北京基因组研究所(国家生物信息中心)国家基因组科学数据中心(NGDC)开发的表观基因组关联研究资源开放平台EWAS OPEN PLATFORM上线。相关研究成果以EWAS OPEN PLATFORM: INTEGRATED DATA, KNOWLEDGE AND TOOLKIT FOR EPIGENOME-WIDE ASSOCIATION STUDY为题在NUCLEIC ACIDS RESEARCH上在线发表。
随着表观基因组关联研究(EWAS)的爆炸式增长,出现了大量EWAS学术论文,积累了海量EWAS相关数据。对这些数据进行标准化整合,并从已发表论文中提取和挖掘表观关联知识,对于系统的表征和研究不同实验条件下的甲基化状态、探索与各种性状相关的表观遗传分子机制具有重要意义。NGDC在2019年和2020年先后开发了基于高质量的人工审编EWAS知识库(EWAS ATLAS)和存储了海量标准化DNA甲基化芯片数据的EWAS数据库(EWAS DATA HUB)。
为了提供从数据浏览与下载、在线分析与可视化到知识解释与验证的全面系统的资源和服务,NGDC研究团队在不断整合和更新中心已有EWAS资源基础上,构建了表观组关联研究资源开放平台(EWAS OPEN PLATFORM)。EWAS OPEN PLATFORM包括标准化的数据信息库 (EWAS DATA HUB)、人工信息提取的知识库(EWAS ATLAS)和表观-特征关联在线工具(EWAS TOOLKIT) 三部分。EWAS DATA HUB整合了115852个样本的DNA甲基化芯片数据和对应的元数据,并统一采用GMQN方法进行标准化。同时,EWAS DATA HUB利用海量高质量DNA甲基化芯片数据和标准化元数据的优势,为485512个探针和36397个基因提供了一系列重要的评估值(包括组织特异性、年龄相关性、性别差异和种族特异性)和不同背景下的参考DNA甲基化图谱;EWAS ATLAS共整合了910篇文献中报道的617018个高质量的甲基化与表型关联,涉及618种表型和3385个队列;EWAS TOOLKIT利用EWAS ATLAS和EWAS DATA HUB提供的高质量的甲基化与表型关联知识和标准化的DNA甲基化芯片数据,为用户提供多种在线分析和可视化工具,包括富集分析、注释、知识图谱可视化等。