第1章网络药理学概述及研究进展
第1节网络药理学
网络药理学是一门融合了计算机科学、生物信息学、药理学等学科的综合学科,其利用高通量筛选和分子网络数据等手段,通过分解药物的具体化学成分并对每一个化学成分的作用靶点进行归类分析,进而构建药物作用的调控网络,是研究药物作用机制的新方法(陈健和陈启,2021)。网络药理学方法是基于系统生物学理论,对生物系统网络分析,选取特定信号节点进行多靶点药物分子设计的新学科,根据药物结构和功效构建“药物-靶点”网络,进而预测药物靶点及作用机制(刘艾林和杜冠华,2010)。中药成分复杂,结合网络药理学研究手段可提高研究效率,节省前期研究费用,从而为深入进行中药的机制研究提供突破方向。
网络药理学对于中药的研究主要包括两个方面:一方面是通过数据库全面地搜集中药的化学成分,另一方面通过计算生物学手段对筛选到的中药成分潜在靶点进行分析。构建“中药-成分-靶点-信号通路”网络,能够了解中药复杂成分对应的具体的作用靶点及通路,便于全面分析中药的药理作用,掌握其分子机制。用于搜集中药化合物成分的主要工具网站包括:中药系统药理学平台(Traditional Chinese Medicine Systems Pharmacology Database andAnalysis Platform,TCMSP)、中医药整合药理学研究平台(Integrative Pharmacology-based Research Platform of Traditional Chinese Medicine,TCMIP)v2.0、CTD(Comparative Toxicogenomics Database)数据库、SwissADME数据库、PubChem数据库、PDB蛋白数据库、MOE分子对接工具。
第2节网络药理学研究常用数据库
TCMSP是一个用于研究中药的数据库和分析平台(Ru et al.,2014)。它旨在整合中药的化学成分、靶点和药理活性信息,为中药研究提供数据支持。该数据库资源整合了TTD、PharmGKB及PubChem数据库的相关信息,包括化学成分、靶点和药物靶点网络。通过TCMSP可以获取中药化学成分信息,了解其潜在的靶点(蛋白质)及其与疾病的关联。这有助于揭示中药在分子水平上的作用机制,以及中药与疾病之间的相互作用。TCMSP的目标是促进中药研究的发展,并为药物发现和疾病治疗提供新的线索和策略。TCMSP收集了《中华人民共和国药典》2010年版中的499味植物药及每味中药的化学成分(12144个)。
TCMIPv2.0在TCMIPv1.0基础上进行了升级优化(Xu et al.,2019),主要包括来自《中医药百科全书》(ETCM)的“中药材数据库”“中药方剂数据库”“中药成分数据库”“中药靶标数据库”和“疾病相关分子库”5大数据库资源。TCMIP数据库采用人工智能、数据挖掘、网络计算及可视化等方法与技术,形成7大整合药理学分析模块,包括“疾病相关分子集及其功能挖掘”“证候相关分子挖掘及功能分析”“中药(含方剂)靶标预测及功能分析”“中药药性相关分子挖掘及功能分析”“组方用药规律分析”“中医药关联网络挖掘”和“反向查找中药(含方剂)”。作为一个智能化数据挖掘平台,TCMIPv2.0为揭示中医药理论的科学内涵和中医原创思维的科学价值、总结与传承名医经验、中药质量控制、中药作用原理阐释、中药新药研发,尤其是现代药物组合发现和优化等,提供了强有力的数据基础和分析平台。
CTD数据库是一个综合性的毒理学和基因组学数据库,旨在研究化学物质与基因之间的相互作用,以及对人类疾病的影响(Daws et al.,2023)。该数据库收集、整合和分析大量的科学文献和公共数据库信息资源,涵盖化学物质、基因、蛋白质、疾病和毒理学等领域的数据信息,提供关于化学物质与基因之间相互作用的细节,包括毒性效应、调控机制和疾病相关性。CTD的主要目标是加强化学物质的毒理学研究,帮助研究人员理解化学物质对人类健康的影响。它可以帮助研究人员在药物研发过程中对毒理学评估、环境毒理学研究和毒理学机制进行探索。用户可以进行多种类型的查询和分析,包括化学物质对基因的调控关系、基因与疾病之间的关联,以及化学物质在毒理学方面的特性等。该数据库可用于了解化学物质和基因之间的复杂相互作用,并探索其对健康和疾病的潜在影响。
SwissADME数据库是一个在线药物代谢和药理学预测工具,旨在帮助研究人员评估化合物的吸收、分布、代谢和排泄(ADME)性质(Daina et al.,2019)。该数据库提供了一系列功能来预测化合物的ADME属性,包括:SwissADME通过计算化合物的血-脑屏障透过性、肠道吸收率和肝脏清除率等参数,预测化合物在肠道中的吸收潜力(吸收)、预测化合物在体内的分布特性,包括血浆蛋白结合率和脂溶性等指标(分布)、通过识别潜在的代谢酶作用位点和代谢途径,预测化合物的代谢反应和代谢稳定性(代谢)、预测化合物肾脏和肝脏排泄特性,包括预测化合物的肾小球滤过率和肝脏排泄率(排泄),以及计算化合物的物化性质(分子量、溶解度、脂溶性等)、药理学预测(如药效学活性、药物类别等)其他功能。
PubChem数据库是一个由美国国家生物技术信息中心(National Center forBiotechnology Information,NCBI)维护和提供免费化学物质信息资源的数据库(Kim et al.,2016)。该数据库是目前*大的公共化学数据库之一,收录了数十亿个化合物的信息,包括化学结构、物理化学性质、毒性数据、生物活性数据,以及相关文献等。它旨在为研究人员和学生提供一个全面的化学物质信息平台,促进化学研究、药物开发和毒理学研究的进展。
PDB蛋白数据库(Protein Data Bank)是一个用于存储和分享蛋白质结构的国际性数据库。PDB蛋白数据库具有以下数据及信息:蛋白质结构数据(数据库收集、存储和展示了全球范围内解析的蛋白质结构数据,包括通过X射线晶体学、核磁共振和电子显微镜等技术得到的高分辨率蛋白质结构数据)、数据来源(接收来自科学家和研究机构提交的原始蛋白质结构数据,数据经过审核、注释和标准化处理后,被公开发布,供全球科学界使用)。PDB提供结构搜索和浏览(通过PDB蛋白数据库网站进行蛋白质结构的搜索和浏览,可使用蛋白质名称、PDBID、组织名称、生物学功能等关键词来查找和访问具体的蛋白质结构数据)、数据下载和工具(下载蛋白质结构数据接口并提供一系列的工具和软件,帮助用户对蛋白质结构进行分析、可视化和模拟等操作)。该数据库为生命科学研究、药物发现和结构生物学领域的研究人员提供了全球范围内的蛋白质结构数据,对于理解蛋白质的功能、结构和相互作用非常重要,为药物设计、生物工程和基础生物学研究提供了有价值的资源。
MOE分子对接工具(Molecular Operating Environment)是一款分子建模和计算化学软件套件,由Chemical Computing Group(CCG)开发。它提供了一系列功能强大的工具,用于药物发现、药物设计、分子模拟和计算化学分析。MOE支持分子动力学模拟、蒙特卡罗模拟、分子对接和药物与受体的相互作用预测等计算化学方法,其分析和可视化工具可用于解释模拟结果和相互作用模式。
第3节生物信息学分析常用数据库与软件
生物信息学结合了计算机科学、数学及生物学等多种学科手段,能够高效便捷地处理及分析生物及医学相关数据,探讨生物医学相关问题。生物信息学自创建起至20世纪90年代属于发展阶段的前基因时代,从20世纪90年代至2001年,属于生物信息学发展阶段的基因组时代,从2003年至今属于生物信息学发展阶段的后基因组时代。基因组时代和后基因组时代的分界线以人类基因组图谱绘制的完成为标志,其标志着人类进入了以生物信息分析为关键的时代,研究目标从基因组水平逐渐跨越到生物分子水平的功能基因组学。
生物信息学凭借其高效、科学的数据挖掘手段,己经成为生物学领域及计算机科学领域的研究热门,也激发了相关研究手段的迭代进步。基因芯片技术(gene-chip)经过近40年的发展,凭借其效率高、灵敏度高及能够重复等优势,在基因表达谱、基因分型、基因修饰及非编码RNA分析中得到广泛应用。生物信息学分析手段及相关数据库主要为:基因表达数据库(Gene Expression Omnibus,GEO)、基因本体数据库(Gene Ontology,GO)及京都基因与基因组百科全书数据库(Kyoto Encyclopedia of Genes and Genomes,KEGG)。
GEO数据库于2000年由美国国家生物技术信息中心(NCBI)创建,该数据库主要负责收集研究者获得的高通量基因数据(Toro-Dominguez et al.,2019)。它包括二代测序数据、基因芯片数据和其他高通量数据。该数据库通过下载基因芯片数据集,根据GSE编号进行检索,选择患者芯片及健康者对照芯片进行后续分析。GEO数据库收集了4种类型的数据:GEO Platform,GEO Sample、GEO Series和GEO DataSets,约100万个芯片数据样本,4.5万个系列及1.2万个平台。使用该数据库时,只需输入关键词或者上述4种类型数据的编号,即可得到目的数据。GEO2R是GEO数据库的延伸工具,能够直接用于识别不同组别芯片数据的差异表达基因(gene differential expression,DEG)。
GO数据库创立于1998年,由基因本体联盟(Gene Ontology Consortium)发起。其目的是创建一个适合多个物种的、可以用于阐释基因及蛋白功能,同时可以随研究深入不断更新的系统(Alterovitz et al.,2007)。利用GO数据库对筛选的基因或蛋白质的作用功能进行分析描述,包括基因定位、分子功能及生物过程。随着数据库信息的不断更新及扩充,目前GO数据库己经收录了全世界大部分动植物及微生物的基因信息。
KEGG数据库的主要功能是阐释人体相关信息通路的数据库。目前该数据库由17个子数据库组成,分析内容涵盖了健康、化学、系统及基因组等信息。此外,它还有一个功能就是可以将基因、细胞与物种进行关联分析。KEGG还收录了新陈代谢、酶分子和化合物结构等数据信息。通过该数据库对目标基因进行分析,可以获得该基因参与的基因调控、疾病、代谢及药物相关的信号通路或者生物学过程,能为疾病的分子机制、分子靶向治疗等研究提供指导。
STRING数据库(在线分析工具)是主要用于检索己知蛋白质及预测蛋白质间互作的数据库,它适用于2031个物种,包括960万种蛋白质与1380万种蛋白质间的互作功能(Kanehisa et al.,2002)。该数据库包括:文献数据库Pubmed、疾病数据库OMIM、蛋白质数据库SwissModel、SwissProt、UniprotPDB、KEGG、Reactome等。蛋白质间的互作分析可以进行直接的物理互作分析及间接的功能相关研究。在数据库的主界面,能依据蛋白质的代码、氨基酸的序列等标签搜索与指定的蛋白质互作的相关蛋白质。数据库分析蛋白质之间的相互作用,并对其作用进行评分,评分依据主要包括染色体关系、系统进化谱、基因融合,以及基因共表达的情况。具体操作:打开STRING数据库,点击“SEARCH”搜索进入分析页面,单一蛋白质分析选择“Protein by name”或“Proteins by sequences”,多个蛋白质分析点击“Multiple proteins”录入基因的ID,选择“Organisms:Homosapiens”或其他物种,然后检索。分析结果会得到蛋白质相互作用的网络图,并且可以下载txt、xml、tsv等格式文件进
展开