动物复杂性状进化的解析与调控研究,是认识人类重大慢性病发生的内在原因、改良家养动物经济性状、及仿生动物特殊功能的科学基础。这种系统生物学研究要求综合利用全基因组上多层面的"组学"数据和其它由此派生出来的数据集:遗传学和表观遗传学数据集、基因调控数据集、蛋白质组数据集、代谢数据集、及生物学图像数据集等。这些海量的不同物种、不同测量技术平台、不同层面、不同尺度的数据组成多元异质大数据,进而需要有统一的数学工具在系统层面上开展集成,并更深入地了解动物复杂性状成因。
主要科学问题:
提供实现研究进化系统生物学(eGPS)的定量模型、计算及评估模式。整合多元异质生物大数据(如基因组、转录组、蛋白组、代谢组、成像数据组等),发展生物组学大数据的处理、降维、关联、融合、及特征检测的高性能整合分析的新方法,以及多层次多类型生物分子网络的集成理论模型和计算方法,并系统地解析动物复杂性状的成因与调控机制。通过比较多物种组学数据,来阐明脑容量大小、高原适应和脂肪能量代谢这些复杂性状所对应分子网络的保守性、适应性和进化规律。基于关键分子及关键网络在不同物种、组织、细胞中的进化过程与规律来预测和验证新的复杂性状形成的分子机制,从系统和网络的层面开创研究动物复杂性状的新方法eGPS。
同时,提供一个专项团队成员信息发布、数据共享的平台,并提供一个与之相关联的非模式动物的组学数据标注系统及组学数据管理与发布系统。提供数据发布、数据递交与更新、数据检索、数据下载、可视化预览、分析工具集成等功能为一体的、开放共享的、一站式的数据存取服务。
内容一:遗传驱动力与动物复杂性状的进化
内容二:生物大数据的系统生物学及eGPS基本理论框架构建
中国科学院上海生命科学研究院
中国科学院北京基因组研究所
中国科学院深圳先进技术院
中国科学院数学与系统科学研究院