第一章系统生物学与中医药研究概述第一节系统生物学20世纪生物学经历了由宏观到微观的发展过程,由形态、表型的描述逐步分解,细化到生物体的各种分子及其功能的研究。1953年Watson JD和Crick FHC提出的DNA双螺旋模型是生物学进入分子生物学时代的标志,70年代出现的基因工程技术极大地加速和扩展了分子生物学的发展。1990年启动的人类基因组计划是生命科学史上一个伟大的科学工程,开始了对生物全面、系统研究的探索。2003年完成了人和各种模式生物体基因组的测序,第一次揭示了人类的生命密码。人类基因组计划和随后发展的各种组学技术将生物学带入了系统科学的时代。
系统生物学可在细胞、组织、器官和生物体整体水平上对结构和功能各异的各种分子及其相互作用进行研究,并通过计算生物学来对其进行定量描述和预测生物功能、表型和行为。系统生物学将在基因组序列的基础上完成基因密码到生命功能的研究,这是一个逐步发展的过程,由生物体内各种分子的鉴别及其相互作用的研究到途径、网络、模块,最终完成整个生命活动的路线图。这个过程可能需要一个世纪或更长时间。
生物体的复杂性和大量过程的非线性动力学特征对计算科学也是一个新的挑战。因此,系统生物学的研究还需要不断发现新的分析方法、测量技术、实验方法和软件工具。但系统生物学对未来生物学中的重要性使其成为当今生命科学中最具活力的新兴前沿学科之一。由于系统生物学其整体观的研究模式,与我国的中医理论不谋而合,因此,相信系统生物学将在中医药研究领域会有广阔的应用。
一、 系统生物学简介
(一) 概念
系统生物学(systems biology)是研究生物系统组成成分的构成与相互关系的结构、动态与发生,以系统论和实验、计算方法整合研究为特征的生物学。20世纪中期,Bertalanffy LV定义“机体生物学”的“机体”为“整体”或“系统”概念,并阐述以开放系统论研究生物学的理论、数学模型与应用计算机方法等。系统生物学不同于以往侧重于关心个别的基因和蛋白质的分子生物学,更在于研究细胞信号传导和基因调控网路、生物系统组成之间相互关系的结构和系统功能的涌现。
(二) 发展
1929年,Titchener EB提出了的systematic psychology(系统心理学)。Maelzer DA在Environment, semantics and system theory in ecology[1]阐述应用系统论方法研究生态学。20世纪中叶 Bertalanffy LV创立了一般系统论和理论生物学,并阐述了整体系统论和系统、整体方法以及计算机方法数学建模的方法研究生物开放系统的“机体生物学”概念。
虽然系统生物学的概念早在20世纪40年代就开始被提出[2],但直到2000年日本举办第一届国际系统生物学会议,系统生物学才开始得到蓬勃发展。日本系统生物学家Kitano H[3]认为在系统水平上研究生物,应该从四个方面着手。
1. 系统的构成这些构成包括基因的相互作用和生化途径的互作网络,也包括这些相互作用借以调节细胞内部结构和多细胞结构物理属性的各种机制。
2. 系统原动力一个系统在不同条件下可以随时间运转方式通过代谢分析、敏感分析、相图等动力分析方法以及分歧分析加以理解,也可通过鉴别特定行为所包含的本质机制加以理解。分歧分析跟踪系统处于多维空间状态时,随时间而发生的变化,其中每一个维度代表有关生化要素的特定浓度。
3. 控制方法系统控制细胞状态的机制,可以把故障调整到最小限度并提供用于疾病医治的潜在治疗目的。
4. 设计方法修改并建立具有特定特性的生物系统的策略,可以在一定的设计原则和模拟基础上制订出来,从而避免盲目的重复试验。
同时,Kitano H概述了基因组学、计算机技术以及分析技术在系统生物学中的相互关系。他将计算机模拟称作“干”实验,对模拟获得模型进行实验验证所开展的实验称作“湿”实验。先有计算机模拟确定研究方向及实验目标,再由实验进行进一步的验证,整个过程中,计算机模拟起到主导作用。
2000年,日本Kitano H和Tomita M举办国际系统生物学会议,美国Hood L建立系统生物学研究所,美国Kool E重新提出合成生物学的概念。诺贝尔奖获得者Nurse P(2000年)写道:“要正确理解构成细胞系统如细胞周期的复杂调控网络,需要改变常规思维方式。编者可能不得不进入一个更抽象的陌生领域,这个领域更易于用数学进行分析。”2001年,Wolkenhauer O、Ideker T、Hood L和Kitano H等发表文章论述系统生物学的系统论、组学和计算方法等,指出:“系统生物学通过对生物学系统的系统性(生物学、遗传学或化学)扰动而进行研究,检测基因,蛋白质以及信息通路的应答,整合这些数据,并最终建立数学模型来描述系统的结构以及对独特干扰的应答。”2002年,Kitano H[4]、2003年Hood L[5]也论述了系统生物学是实验与计算方法整合的生物系统研究,2008年,Nature文章[6]则论述了系统生物学与合成生物学的结构理论。2005年,Kitano H支持了关于分子水平的系统生物学概念,2007年,Kitano H阐释系统生物学是在分子生物学层次上的重新提出。计算生物技术、组学生物技术与合成生物技术,是构成系统生物学发展的技术基础——系统生物技术,现代系统生物学是生物系统的理论与技术整合的研究体系。21世纪伊始,Nature、Science发表系统生物学、合成生物学等专刊,终于进入了系统生物科学全球化迅速发展的时代。
(三) 特点
与传统研究技术相比,高通量的大数据的获取和分析使得系统生物学的研究更为复杂和困难。然而在样本获取方面,系统生物学可以选择尿液、粪便、血液等非创伤性或微创伤性的样本进行研究。概言之,系统生物学应用到医学领域中有以下特点:
1. 非破坏性取样系统生物学所需的非破坏性样本,对于获得长期大规模研究样本至关重要。另外,非破坏性也可获得中医临床用动态样本。
2. 整体性、非靶向性中医诊断讲究“司外揣内”,即通过外部表象来窥测机体内部生理病理变化。而系统生物学正是从整体角度反映全身的健康、亚健康和病理状况。而非靶向性,可以摆脱现有医学研究方法的束缚,探索中医辨证尚未可知的分类规律。
3. 高通量、多层次测量中医的证候是在众多病例的病情状态以及演化过程中归纳总结出的共性特征,因此系统生物学技术可以通过对大样本人群的动态监测来实现对中医证候的表现及演化进行详细的阐述。系统生物学研究的对象是核酸、蛋白、代谢物这些生物分子,这样就可以从不同角度、多层次对中医药进行研究。
4. 数字化结果系统生物学技术测定结果都是数字化,这便于通过统计分析、数据库建立、建模等方法对中医药大量研究结果进行整合与比对,并且有助于没有中医药背景的科研工作者也参与其中。
(四) 研究内容及方法
系统生物学的研究对象是生物体内具有生物学意义和功能的系统。具体来讲,系统生物学主要致力于实体系统(如生物个体、器官、组织和细胞)的建模与仿真、生化代谢途径的动态分析、各种信号转导途径的相互作用、基因调控网络以及疾病机制研究等[3,4,7~9]。
系统生物学是用系统科学的观点来研究生物体,它要求人们将生物体系统看成是由相互作用、相互联系的元素组成的整体,只有同时研究这些元素的多样性、功能性及其之间的动态相互作用网络才有可能深刻理解系统实现自身功能的途径和机制。系统生物学的研究是逐渐深入的,从系统科学的角度来讲首要任务是对系统状态和结构进行描述,即致力于对系统的分析与模式识别,包括对系统的元素与系统所处环境的定义,以及对系统元素之间的相互作用关系、环境与系统之间的相互作用进行深入分析。其次要对系统的演化进行动态分析,包括对系统的稳态特征、分岔行为、相图等分析。掌握了系统的基本演化机制,进一步就可以对系统进行目的性的操纵,使系统按照研究者所期望的方向演化,也有助于研究者重新构建或修复系统,为组织工程学的组织设计提供指导。在上述研究过程中需要指出的是,系统科学对生物系统状态的描述是分层次的,对不同层次进行的描述可能是完全不同的;系统科学对系统演化机制的分析更强调整体与局部的关系,要分析子系统之间的作用如何形成系统整体的表现与功能,而且对系统整体的每一行为都要找出其与微观层次的联系。
目前国际上系统生物学的研究方法根据所使用研究工具的不同可分为两类: 一类是实验性方法,即“湿”实验;一类是数学建模方法,即“干”实验。
实验性方法主要是通过进行控制性的反复实验来理解系统[7]。首先明确要研究的系统以及所关注的系统现象或功能,鉴别系统中的所有主要元素,如DNA、mRNA、蛋白质,并收集所有可用的实验数据,建立一个描述性的初级模型(比如图形),用以解释系统是如何通过这些元素及其之间的相互作用实现自身功能的。其次在控制其他条件不变的情况下,干扰系统中的某个元素,由此得到这种干扰情况下系统各种层次水平发生变化的一些数据,同时收集系统状态随时变化的数据,整合这些数据并与初级模型进行比较,对模型与实际之间的不符之处通过提出各种假设来进行解释,同时修正模型。再设计不同的干扰,重复上面的步骤,直到实验数据与模型相一致为止。
数学建模方法[9,10]旨在根据系统内在机制对系统建立动力学模型,来定量描述系统各元素之间的相互作用,进而预测系统的动态演化结果。首先选定要研究的系统,确定描述系统状态的主要变量,以及系统内部和外部环境中所有影响这些变量的重要因素。然后深入分析这些因素与状态变量之间的因果关系,以及变量之间的相互作用方式,建立状态变量的动态演化模型。再利用数学工具对模型进行求解或者进行定性、定量分析,充分挖掘数学模型所反映系统的动态演化性质,给出可能的演化结果,从而对系统行为进行预测。在对生物体系统进行数学建模时,使用什么样的数学工具要根据研究的具体内容来定。一般来讲,可以选择普通微分方程[11]、随机微分方程[12]、元胞自动机[13]等[14]。
系统生物学的研究一般可以概括为四个环节(图11)。
图11系统生物学研究思路
第一步: 对选定的某一生物系统的所有组分进行了解和确定,描绘出该系统的结构,包括基因相互作用网络和代谢途径,以及细胞内和细胞间的作用机制,以此构造出一个初步的系统模型。
第二步: 系统地改变研究对象的内部组成成分(如基因突变)或外部生长条件,观测在这些情况下系统组分或结构所发生的相应变化,包括基因表达、蛋白质表达和相互作用、代谢途径等的变化,并把得到的有关信息进行整合。
第三步: 将通过实验得到的数据与根据模型预测的情况进行比较,并对初始模型进行修订。
第四步: 根据修正后模型的预测或假设,重新设计实验,重复第二步和第三步,不断地通过实验数据对模型进行修订。系统生物学的目标就是要得到一个理想的模型,使其理论预测能够反映出生物系统的真实性。
二、 系统生物学的相关技术
(一) 基因组学
1. 基本概念基因组(genome)是1924年提出用于描述生物的全部基因和染色体组成的概念。1986年由美国科学家Thomas Roderick提出的基因组学(genomics)是指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录本图谱)、核苷酸序列分析、基因定位和基因功能分析的一门科学,其技术路线如图12。20世纪90年代初,以完成人类基因组全序列测定和注释为核心任务的人类基因组计划在美国的领导下兴起。1999年,中国加入人类基因组计划,中国的基因组学发展非常迅速,建立了先进的基因组学技术平台,并出色完成多项重大基因组科学研究项目,对我国生命科学各个领域的发展产生了重要影响。
图12基因组学技术路线
根据发展的时间先后及研究目的不同,基因组学又分为以下四个分支: ① 结构基因组学,指在基因组研究的早期阶段,建立生物体高分辨遗传、物理和转录图谱。1999年,有科学家提出,结构基因组学的研究内容已经超越了人类基因组计划[15]。结构基因组学有了新的定义,指利用已知的基因结构序列,推测蛋白质结构、RNA结构和非编码序列的结构,并通
展开