第一章基因组学
第一节基因组学及中药基因组学概述
基因组学(genomics)是一门对生物体所有基因进行集体表征、定量研究或对不同基因组进行比较分析研究的交叉生物学学科,主要研究内容包括基因组的结构、功能、进化、定位和编辑等,以及它们对生物体的影响。基因组学主要研究内容包括基因组测序和分析即通过高通量测序技术和生物信息学技术来组装和分析整个基因组的功能和结构。
国家药品监督管理局(NMPA)将药品分为现代药和传统药,前者通常称为西药,大多是用现代医药科技手段(提取或合成)精制而成的化学物质;后者通常称为中药,是人类与疾病抗争的漫长历史过程中于自然环境中发现的物质。中药基因组学(traditional Chinese medicine genomics)即从基因组水平上研究中药及其对人体作用的一门学科,利用组学技术研究中药的遗传信息和调控网络,从而阐明中药防治疾病的分子机制。中药基因组学从基因水平对基因序列的多态性与药物效应的多样性之间的关系进行研究,对基因及其突变体对不同个体药物作用效应差异进行研究,进而以此为平台指导药物开发和合理用药,以期提高药物的安全性和有效性,减少药物不良反应,同时降低药物治疗费用和风险,为实现个体精准医疗提供重要支撑及技术保障。
中药制剂进入人体发挥效应,引起多个层面包括分子、细胞、器官及整体的结构和功能改变,而基因是调控这一切改变的本质。基因和基因组是现代生命科学研究的中枢,是联系传统药物和现代生命科学研究之间桥梁。由于中药具有药理作用温和及毒副作用少等独最优点,且对某些功能性疾病具有独最疗效,因此在人类健康发展史中占有重要地位。从基因组层面对中药的道地性、药效物质基础、药效作用及有效成分的分离提取等进行研究具有重要价值,通过将中药与现代科学技术完美结合,有助于促进传统中药向现代中药的转变。
目前对中药主要开展以下研究:①提取工艺研究;②制剂工艺研究;③制剂稳定性研究;④药理毒理学研究;⑤制剂质量标准研究;⑥作用靶点及分子机制研究。其中,作用靶点的研究是中药现代化的重要研究内容。由于中药存在多靶点多作用的特点,一方面其作用的选择性较低,另一方面其作用的机制及效应较多。因此,借助现代测序技术从基因组层面对中药及其分子靶点进行研究将使中药的现代化研究发生质的飞跃。筛选和鉴定药物的作用靶点是现代新药研发的重要内容之一,由于基因研究平台逐渐成熟,近年来从基因层面对药物靶点进行研究已取得显著进展。药物靶点的确定是基因药物开发的前提和基础,全基因组测序技术将为医药工业提供新的突破方向。
第二节中药基因组学及其应用
一、中药基因组学的产生和发展
人类基因组计划(human genomeproject,HGP)是由美国科学家在1985年首次提出的,中药分子靶点鉴定技术并于1990年正式启动,我国科学家参与其中。该计划旨在揭示人体内约2.5万个基因的30亿个碱基对的秘密,绘制人类基因组图谱,以达到破译人类遗传信息的最终目的。“人类基因组计划”在研究过程中所建立起来的策略、思想和技术,构成了生命科学领域新的学科——基因组学,已被广泛应用于微生物、植物及动物研究领域。伴随该计划,中药基因组学应运而生,对中药的研究开始深入到基因组水平。
我国科学家于2012年通过光学图谱和测序技术,首次绘制了中药灵芝的基因组精细图,灵芝基因组图谱的揭示有助于研究灵芝有效成分的合成,还可推动灵芝的辅助育种,并为其科学栽培和采收提供理论指导。对灵芝基因组学的研究可为研究中药的次生代谢途径和调控提供一个有价值的模式系统[1]。二代测序技术和第三代单分子测序技术的兴起使得测序成本大幅度降低,测序时间明显缩短,为中药基因组学的研究提供了强大的技术支持,结合生物信息学的发展及应用,整个中药基因组学的研究从技术层面到结果分析层面都日趋成熟。
二、中药结构基因组学及其应用
结构基因组学是系统研究基因组的基因数量、每个基因在染色体上的线性分布位置距离,以及每个基因编码区和基因间隔区的核酸序列结构的一门学科,其研究成果集中反映在遗传图谱、物理图谱、序列图谱和基因图谱的建立上。中药结构基因组学研究内容包括以下几个部分:①蛋白质编码区,编码蛋白质的基因转录成信使RNA(mRNA),mRNA经过加工和修饰,在核糖体内成熟的mRNA被翻译成多肽链;②非蛋白质编码区,该区域进行RNA转录并可形成三级结构(如发卡结构)以行使功能,或通过碱基互补配对影响其他基因的表达,包括转运RNA(tRNA)、核糖体RNA(rRNA)、微RNA(miRNA)、长链非编码RNA(lncRNA)、环状RNA(circRNA)以及干扰RNA(RNAi)等;③调控基因及其靶标区域,如负责转录调控的配体结合位点;④重复序列,包括分散基因家族、串联基因家族、短散在重复元件、长散在重复元件、小卫星序列、微卫星序列及端粒序列等。基于中药结构基因组学研究,可比较同科同属中药的基因组,有助于了解其相似性以及差异性。
除了以上的核基因组,中药结构基因组还包括叶绿体基因组和线粒体基因组。叶绿体基因组一般是环状DNA分子,极少为线状,在细胞中是多拷贝的,大小一般在120~160kb,其DNA占叶片中全部DNA的10%~20%。叶绿体基因组的多拷贝性使其成为一个优良的遗传载体,比核转化具有明显优势的叶绿体转化技术在物种改良和生物制剂的生产等方面显示出巨大潜力。线粒体基因组数量远小于细菌基因组,线粒体DNA(mtDNA)在线粒体中有2~10个备份,大部分呈双链环状,也有特例呈线状,mtDNA的长度一般为几万至几十万碱基对。高等植物线的粒体除参与氧化磷酸化产生ATP提供能量外,还参与氨基酸、脂类、维生素以及辅酶因子的生物合成与代谢。不同植物的线粒体基因组结构差异很大,但也有一些相对保守的基因簇。
中药结构基因组学通过对具有典型次生代谢途径的中药基原物种进行全基因组测序以及结构基因组学分析,进而推动这些物种成为药用模式物种,在中药与现代生命科学之间架起一座沟通的桥梁,将现代生命科学的先进技术以及理念引入到中药基原物种的研究中,以推动中药研究现代化。DNA分子作为遗传信息的载体,具有相对稳定性,因此选用基因组学技术鉴定中药遗传信息,对中药品种的鉴定、质量管理及生产均具有重要意义。
灵芝在我国已有数千年的药用历史,是医家公认的滋补强壮和扶正固本的神奇珍品,其在抗肿瘤、抗病毒、调节血糖、增强免疫力等方面均有显著作用,本节内容将以灵芝为例探讨中药基因组学的实际应用。LinTY等报道重组灵芝免疫调节蛋白(rLZ-8)对小鼠体内肺癌细胞有增殖抑制作用,且rLZ-8还可抑制Lewis肺癌模型小鼠的肿瘤转移,并提高生存率[2]。rLZ-8通过干扰肺癌细胞局灶性黏附激酶功能,有效地诱导了上皮间质转化的改变。他们首次发现了rLZ-8的抗转移活性,提示其具有作为肺癌化疗药物的潜力。LinTY课题组在2017年又报道了rLZ-8可通过下调野生型和突变型表皮生长因子受体(EGFR)的表达,抑制EGFR下游效应分子AKT和ERK1/2,从而诱导肺癌细胞周期阻滞以及细胞凋亡[3]。他们证明rLZ-8通过与EGFR结合,诱导EGFR自身磷酸化,并通过诱导EGFR/Cbl复合物的形成触发泛素化,导致EGFR降解,提示rLZ-8通过靶向EGFR抑制肺癌进展。在灵芝的许多生物活性成分中,多糖、蛋白多糖、蛋白质和三萜类化合物具有降血糖作用:灵芝多糖通过提高小鼠血浆胰岛素水平来降低血糖水平;蛋白酪氨酸磷酸酶1b是一种很有潜力的糖尿病治疗靶点,灵芝蛋白多糖可在体外抑制该酶;此外,灵芝三萜类化合物可抑制醛糖还原酶和α-葡萄糖苷酶,起到抑制餐后高血糖的作用;从灵芝中提取的rLZ-8能显著降低糖尿病小鼠淋巴细胞浸润,提高胰岛β细胞中胰岛素抗体的含量[4]。
SyedK课题组于2013年对三种多孔菌目的白腐菌的细胞色素P450单加氧酶进行了全基因组注释,发现它们的基因组中含有大量的P450基因(P450ome)[5]。这些P450ome被分为以下家族和亚家族:黑管菌(39家族,86亚家族)、灵芝(41家族,105亚家族)和短孢霉(42家族,111亚家族)。值得注意的是,黑管菌基因组缺少CYP505家族(P450foxy),这是一组P450-cpr融合蛋白。这三种真菌在其基因组中显示了P450家族的差异富集。三个基因组中最大的CYP家族分别是黑管菌、灵芝和短孢酶的CYP5144(67P450s)、CYP5359(46P450s)和CYP5344(43P450s)。分析表明,串联基因复制导致了某些P450家族的扩增,在短孢霉、真菌和灵芝中分别复制了33%(72P450s)、28%(55P450s)和23%(49P450s)的P450ome基因。家系比较分析显示,在三种真菌中共有22个CYP家系。通过与灵芝P450ome的比较分析,发现灵芝中存在143个正位基因和56个副位基因,在次生代谢产物的特征生物合成基因附近发现了多个P450s,即聚酮合酶(PKS)、非核糖体肽合成酶。萜烯环化酶和萜烯合成酶在三个基因组中的表达,提示这些P450s可能在这些真菌的次生代谢中发挥作用。KaoCH等研究了浸泡在东亚两种常见酒类(麦芽威士忌和黄酒)中的灵芝的潜在抗癌活性,发现了灵芝威士忌和黄酒提取物对前列腺癌细胞株PC3和DU145的生长抑制作用[6]。他们通过Affymetrix基因表达分析方法,确定了与灵芝提取物抗癌活性相关的生物活性途径,然后用实时荧光定量PCR和蛋白质印迹(Western blotting)方法确认了关键基因及其相关蛋白的表达。ZhouS等利用基因组学、转录组学和分泌组学分析,对灵芝G0119菌株的木质纤维素分解酶进行了研究,以确定对其生长有贡献的降解酶生长有贡献[7]。他们研究了碳水化合物活性酶家族的基因,特别是与木质纤维素降解有关的基因,分析了木质纤维素分解酶在菌丝生长周期中的基因表达、蛋白质丰度和酶活性。在子实体发育过程中,纤维素酶的总表达量高于半纤维素酶和木质素修饰酶。纤维素酶和半纤维素酶的丰度和活性在子实体成熟后增加,此时担孢子大量产生,直到生长周期结束。该研究为深入了解灵芝在生长过程中木质纤维素降解能力的变化提供了依据,并有助于探索促进灵芝生长的新途径。
三、中药功能基因组学及其应用
转录组是指特定细胞在某一功能状态下全部表达的基因总和,包括每一个基因及其表达水平。同一个细胞在不同的生长环境和生长阶段,基因表达谱有所差异,具有特定的空间性和时间性等特征。由于转录组信息受外源因子和内源因子的共同调控,因此它是物种基因组和外部物理特征的动态联系媒介,是反映生物个体在特定器官、组织和某一特定发育、生理阶段,细中药分子靶点鉴定技术胞中所有基因表达水平的数据。中药转录组学是中药功能基因组学的重要研究内容,是在整体水平上对中药某一生长阶段特定组织或细胞中全部转录物的种类、结构、功能及基因转录调控规律进行研究的科学。中药转录组学研究在鉴定中药体中具有药效活性的次生代谢产物生物合成关键酶基因、阐明次生代谢途径及调控机制方面具有显著优势和应用价值,可为解析中药转录水平的遗传信息提供有效数据,为开展中药生物学研究提供坚实的基础。
中药转录组在中药研究中具有重要应用价值,主要体现在以下方面:①中药转录组研究为解析中药药效活性成分代谢途径,从而实现关键酶基因克隆及其体外表达,利用现代生物技术(如次生代谢工程及合成生物学等)大规模生产中药药效活性成分奠定基础;②中药转录组研究为鉴定中药植物生长发育及抗病、抗逆等优良性状相关的基因功能提供基础数据;③中药转录组研究为研究基因组遗传信息多样性及开发分子标记提供研究基础。
2012年YuGJ等对灵芝的转录组进行了综合分析,提示了完整的灵芝基因转录组信息,为灵芝的功能基因组学研究奠定了基础[8]。该课题组从灵芝菌丝体和子实体中分别获得了6439690和6416670条高质量的读写片段,分别组装成18892和27408条单基因。在NCBI核苷酸数据库和由