关键理论模型

动物复杂性状进化的解析与调控研究,是认识人类重大慢性病发生的内在原因、改良家养动物经济性状、及仿生动物特殊功能的科学基础。这种系统生物学研究要求综合利用全基因组上多层面的"组学"数据和其它由此派生出来的数据集:遗传学和表观遗传学数据集、基因调控数据集、蛋白质组数据集、代谢数据集、及生物学图像数据集等。这些海量的不同物种、不同测量技术平台、不同层面、不同尺度的数据组成多元异质大数据,进而需要有统一的数学工具在系统层面上开展集成,并更深入地了解动物复杂性状成因。

主要科学问题:

  1. 如何实现多元异质生物大数据的数据整合、信息压缩和知识提取,以及生物网络重构。
  2. 如何揭示动物复杂性状在遗传及发育进化过程中的关键节点,关键分子及关键网络。
  3. 如何有效可视化关键生物标志元件,并结合生物进化过程和规律来预测动物复杂性状的变化及分子调控机制的形成。
  4. 如何基于多维度、多层次的大量模式生物功能和网络标注数据,来标注本专项研究的模式和非模式生物多元异质组学数据。
研究目标

提供实现研究进化系统生物学(eGPS)的定量模型、计算及评估模式。整合多元异质生物大数据(如基因组、转录组、蛋白组、代谢组、成像数据组等),发展生物组学大数据的处理、降维、关联、融合、及特征检测的高性能整合分析的新方法,以及多层次多类型生物分子网络的集成理论模型和计算方法,并系统地解析动物复杂性状的成因与调控机制。通过比较多物种组学数据,来阐明脑容量大小、高原适应和脂肪能量代谢这些复杂性状所对应分子网络的保守性、适应性和进化规律。基于关键分子及关键网络在不同物种、组织、细胞中的进化过程与规律来预测和验证新的复杂性状形成的分子机制,从系统和网络的层面开创研究动物复杂性状的新方法eGPS。

同时,提供一个专项团队成员信息发布、数据共享的平台,并提供一个与之相关联的非模式动物的组学数据标注系统及组学数据管理与发布系统。提供数据发布、数据递交与更新、数据检索、数据下载、可视化预览、分析工具集成等功能为一体的、开放共享的、一站式的数据存取服务。

研究内容

内容一:遗传驱动力与动物复杂性状的进化

  • 常见遗传驱动力对复杂性状形成和演化的作用机制
  • DNA甲基化对于复杂性状的驱动作用
  • 在模式系统中研究复杂性状演化和稳定性的网络调控

内容二:生物大数据的系统生物学及eGPS基本理论框架构建

  • 专项门户网站及非模式生物系统标注
  • 动物复杂性状多组学数据的存贮与访问平台建设
  • 生物组学大数据的高性能整合分析
  • 动物复杂性状系统生物学及网络分析
  • 基于进化分析的系统生物学分析方法
参与单位

中国科学院上海生命科学研究院

中国科学院北京基因组研究所

中国科学院深圳先进技术院

中国科学院数学与系统科学研究院