第1章绪论
1.1引言
合成生物学是一个跨学科的新研究领域,旨在创建新的生物部件、设备和系统,或者重新设计己经在自然界中发现的系统。合成生物学涵盖了生物技术、基因工程、分子生物学、分子工程、系统生物学、膜科学、环境科学、生物物理学、化学与生物工程、电气与计算机工程、控制工程等各个学科的广泛方法论,涉及多学科交叉融合,结合DNA合成和测序等前沿技术,诞生了一系列不同于传统生物学的成果。区别于传统上以观测、描述、归纳为主的“自上而下”思路,合成生物学提供了以定量、受控、可预测为特点的“自下而上”研究策略(彭耀进,2020)。研究人员可以从天然生物模块提取必要的生物元件(Chen et al.,2018;Jensen and Keasling,2015)以实现特定的功能,或从头人工合成具有理想特性的基因组DNA(Gibson et al.,2010;Cello et al.,2002),乃至结合各种生物元件、基因回路、功能模块创造全新的生物系统或生命体(Ro et al.,2006)。对于环境领域的应用而言,通过合成生物学构建的、具有特定生理功能的生物系统或生物产品,具备现有各类生物监测器、生物模型不具备的特性和功能,拓展了目前各项研究的边界,加速了研究成果的高效化、简便化进程,有助于改进现有治理污染和净化环境的能力。
作为环境科学与合成生物学的交叉融合学科,环境合成生物学是利用合成生物学的原理和方法,发展针对环境污染物研究与控制的生物传感监测、毒性评价、智能降解和资源化利用等技术的一门新学科。环境合成生物学的实质是利用生物检测、基因编辑、元件挖掘、回路设计和体系组装等先进的合成生物学技术,重新设计或创造具有全新功能的生物分子、代谢途径及人造生物体,突破天然生物体功能和应激响应的极限,发展污染物高灵敏度和高选择性的生物筛查、毒性评价、智能降解方法,阐明污染物环境暴露、毒性效应和健康危害机制。在环境污染监测与治理领域,应用合成生物学原理发展环境合成生物学,有望在以下四个层面得到突破。①开发敏感指示生物,实现对环境复合污染的实时、高效原位监测。相比于传统模式生物,使用合成生物学构建的新生物体具备更高的敏感性、更强的耐受性,以及可编程性(Jaiswal and Shukla,2020;Tecon and Van der Meer,2008)。②利用可编程模式生物形成环境监控网络,不同形态或存在于不同介质的微生物、植物甚至动物传感器可共享一套监测“基因网络”,从而实现对污染物物
质流的实时监控、追踪和溯源(Xue et al.,2014)。③构建对特定污染物敏感的指示生物和整合多个毒性靶点的生物模型体,可以对毒性污染物进行快速、高效识别以及多靶点的毒性效应评价,有可能改进目前毒理学研究仍依赖于实验室和复杂暴露-评价步骤的现状(Truong et al.,2019;Wang et al.,2016)。④运用全新模式生物汇集、清除污染,经过合成生物学改造的成熟工程微生物、植物体有望大大降低污染物高效原位修复的成本。目前,生物工程技术在生物修复模式生物的开发上己经开始向着降解多种污染物、降解持久性污染物和整合多功能的目标发展(Giachino et al.,2021;Gong et al.,2018;Rucka et al.,2017)。
截至目前,合成生物学己经在疾病治疗、医药健康、能源、工业、环境、材料技术等诸多领域带来多项变革,具有广阔的应用前景。合成生物学突破了生命自然法则的某些方面,代表了人类对生命遗传密码从认识到利用的质变,从而克服自然进化的局限,创造自然界不存在的人工合成生物,设计构建功能强大、性能优越的基因回路、生物元件、人工细胞及人工复合生物系统。在发展高特异性、高灵敏度、高适用性的生物传感器,以及构建多介质、多功能、特异性、高耐受的污染修复功能生物方面,环境合成生物学将展现广泛的应用前景,带来环境监测、环境修复及更多相关领域的技术进步。
1.2环境合成生物学简介
1.2.1合成生物学基本框架
自20世纪50年代DNA作为遗传物质*次进入学界视野以来,人们对DNA与生命遗传的了解不断加深,生物学研究正以惊人的速度不断发生变化。近年来,人们对遗传密码从认识到利用的总体过程经历了两个阶段,即基因工程阶段和合成生物学阶段。合成生物学在概念上对基因工程进行了扩展,但与作为其根基的DNA合成、测序、基因组编辑、性状调控等手段是一脉相承且持续发展的,这些手段也构成了合成生物学的基本要素。但合成生物学在应用领域、设计策略、发展目标上较基因工程又有了新变化,这也是合成生物学作为生物科学*重要的特征,代表了其在众多领域具备的应用潜力。
合成生物学的出现与DNA或者基因组合成技术的革新息息相关,这一领域也始终是合成生物学的重点研究内容之一。从脊髓灰质炎病毒基因组(Cello et al.,2002)到9X174噬菌体基因组(Smith et al.,2003),再到世界上**个完全由人工化学方法合成、组装的细菌基因组(Gibson et al.,2008),作为生命遗传信息载体的基因组被经由非天然的方法完全合成出来,打破了自然遗传法则。2010年,Venter团队人工合成了全基因组长度达到1.08Mb的蕈状支原体基因组,并将其成功转入山羊支原体受体细胞中,从而创造了仅由人工合成染色体控制的支原体细胞,宣布了世界上**个“人工合成基因组细胞”的诞生(Gibson et al.,2010)。其后,在中国、美国、英国、澳大利亚、新加坡等多国科学家的共同参与下,一项国际科研合作计划“Synthetic Yeast2.0”启动,这一计划旨在使用化学法合成真核生物酵母的全部16条染色体,使全基因组合成从原核生物走向真核生物,这标志着人类从调控少量基因的阶段逐渐向设计、改造整个基因组转变(Xie et al.,2017)。
对酵母细胞的全基因组人工合成同时促进了相应技术的发展,包括DNA合成和测序技术。DNA合成是基因组合成的基础,而DNA合成技术的革新是进行基因组合成的必要条件。DNA合成的基本思路是采用化学方法将寡核苷酸连接起来,从而得到不断延长的DNA或RNA链。基于这一思路,早期发展出了固相亚磷酰胺三酯合成法,如今仍被广泛应用,其特点是效率稳定,但通量低、成本高。经过改进,利用基因芯片高通量合成DNA链的方法在21世纪前十年逐渐发展成熟,相较初代DNA合成技术,具备了高通量、低成本的优点。但受化学法合成限制,单步合成的DNA链长受限,错误率约为0.5%,这些缺陷成为基因组合成*主要的限制因素(江湘儿等,2021)。近年来,利用生物酶进行DNA合成的方法正在发展,采用末端脱氧核苷酸转移酶进行合成,可以使延伸一个碱基的时间缩短至10~20s,从而大大提高DNA链合成的效率(Palluk et al.,2018)。DNA测序作为基因组学的核心技术,也在基因组合成中占据重要地位。自**代DNA测序技术出现以来,DNA测序技术己经发展到第三代,经历了化学降解法、桑格-库森法、荧光标记测序、焦磷酸测序、单分子实时测序等多种方法的迭代(图1-1)。第三代测序技术结合纳米技术,在目前普遍使用的第二代测序技术的基础上进一步延长了读取长度并且降低了错误率(Chen et al.,2017a;Ma et al.,2019)。当前,DNA测序技术成本下降到了**代的百万分之一,时间从人类基因组计划时期的数年缩短到数周甚至数天,使得对天然基因组进行完全测序的成本降低到了可以接受的水平,进而支持了对天然底盘细胞的识别鉴定和遗传工具箱的开发。在基因组全合成方面,目前己发展出用于基因组设计、编辑的成熟技术。基于成簇规律间隔短回文重复(clustered regularly interspaced short palindromic repeat,CRISPR)工具,人工合成基因组中的错误可以在识别后被有效修复,从而为Mb级的基因组合成奠定基础。在合成酵母染色体时使用全基因组测序,可以识别出34个合成染色体与设计序列间的差异,其中CRISPR/Cas9系统诱导的双链断裂被用于修复31个短片段或单核苷酸变异(Xie et al.,2017)。而在染色体结构设计方面,通过去除合成的酵母染色体两端的端粒并将其连接起来以形成环化的染色体,整合环化染色体的菌株表现出良好适应性(Xie et al.,2017)。通过连续的端到端染色体融合和着丝粒缺失,将酿酒酵母的16条天然线性染色体融合为一条染色体,发现单染色体可以维持酵母的生存,但其竞争力和生存能力减弱(Shao et al.,2018)。这些*特的设计不仅体现出合成生物学突破传统生物学局限的一面,还展现出其在生物体性状设计方面的潜力,表明合成生物学研究蕴藏着非常多的可能性。
图1-1DNA测序技术发展历程(解增言等,2010;王兴春等,2012)
在合成生物学构架中,模块化、标准化的生物组件设计和构建是重要的研究内容(Chen et al.,2018)。常用的调控生物元件主要包括启动子、终止子、核糖开关、核酶开关、蛋白质降解标签,通过组合这些基础元件,可以在转录、翻译和翻译后水平上对基因表达进行微调。例如,将一种受全氟烷基化合物特异性激活的启动子PrmA和来自国际遗传工程机器大赛(International Genetically Engineered Machine competition,iGEM)工具库的编码单体红色突光蛋白的序列连接并转染入细胞,可观察到转化细胞在全氟辛酸暴露环境下出现显著的红色荧光蛋白表达水平上升(Young et al.,2021)。在启动子设计中加入工程学设计,可以开发具备逻辑门控制器的基因元件,从而同时利用多种环境信号和细胞信号对基因表达进行动态调控。此后提出的一个正交与门启动子系统的设计,是基因组设计中引入逻辑门设计的重要成果(Wang et al.,2011)。相对于启动子和终止子,
核糖和核酶开关主要是从控制翻译水平的层面控制基因表达水平。真核生物所具有的核糖开关主要介入转录后mRNA前体的处理步骤,由此合成的特定核糖开关可以靶向控制mRNA前体的剪接,从而控制蛋白质的合成,例如,一种新的四环素结合配体可以同四环素结合并形成复合物,从而干扰小核糖体靠近或直接阻断核糖体形成(Weigand and Suess,2007)。蛋白质降解标签是一种极具潜力的翻译后水平调控方法,在基因层面进行改造,从而在*终蛋白质中引入特定标记,当特定环境信号出现时,标记激活从而使蛋白质失活。例如,在蛋白质的N端标记一个休眠的N-辅基,使其对一种特殊的烟草蚀刻病毒蛋白酶敏感,当这一蛋白酶被表达时,就可以引发N-辅基与烟草蚀刻病毒蛋白酶结合,使蛋白质脱保护从而快速降解失活(Taxis et al.,2009)。
通常采用的生物元件只包含一个或几个生化反应,而当越来越多的功能需要被整合进单一生命系统内时,就需要更多地从系统层面进行设计和组装。为了实现理想的生理功能,基因回路的设计需要在三个层面加以考虑:正交性、可诱导性和模块化(Blount et al.,2012)。生物系统的正交性是指人工系统*立于自然细胞网络运行的能力。保持正交性的*常见方法即向真核细胞中引入来自于细菌的调控因子,如使用来自三种细菌的XylR阻遏子变体调控带有XylR操作位点的启动子激活来确保正交性,这些异源DNA在酵母细胞中取得了很好的效果(Teo and Chang,2015)。除了引入异源序列,Romesberg团队为正交系统提出了一个特殊的解决方案。他们设计合成了一个非天然的碱基配对,命名为X和Y,并将它们整合到基因组中(Malyshev et al.,2014)。之后,他们又成功地使含有非天然碱基dNaM-dTPT3配对的DNA在菌株中进行正常转录和翻译,将非天然氨基酸整合到了所合成的绿色荧光蛋白中,
展开