2 蛋白质组数据的标准化、存储和交换:
摘要:
人类基因组序列的测定为人们提供了一个方向标,从这个方向标中我们得以找到那些在疾病的发生与发展过程中起着重要作用的蛋白质,如潜在药物靶点。最近,科学界将视角转向了蛋白质组学,所谓蛋白质组就是指特定细胞在任意时刻的蛋白质表达情况。蛋白质组数据的产生变得越来越高通量化,而用于产生并分析这些数据的实验设计和技术也变得更加复杂。这一领域中的科研人员必须借助于工具的帮助才能使他们顺利辨认蛋白质序列的功能。与此同时,研究者已经开始认识到需要以一种有效的方式来准确地描述、存储和交换实验数据,并将其与公共数据资源相连接。人类蛋白质组研究组织的蛋白质组学标准化预案专门为此设立了开发这一标准的基金会,帮助研究者实现标准化的实验描述及数据交换。这些标准一旦建立,就会开设公共数据库,研究者可以在论文正式发表前就将实验数据存放于此。研究者可以从这些数据中获得参考数据,例如,下载健康组织的数据,通过将其与不同疾病组织数据的比较,确定疾病发生与发展的临床标记。
2.1 引言:
当科学家们首次将人类蛋白质组‘图谱提到正式议事日程上时(Clark,1981),他们只针对建立那些在细胞和组织中相对大量表达的蛋白质库的技术能力进行了讨论。这些蛋白质库中的很多蛋白质都是以前未知的新蛋白质,研究者对这些新蛋白质的功能、表达及其在细胞内的代谢尚一无所知。在随后的20多年时间里,研究者们成功地获得了许多模式生物的基因组全长序列,这些数据及其相应注释已经成为公共资源。很多蛋白质序列分析工具为研究者提供了揭示新序列功能的有效途径,InterPro(.Mtllder et aL,2005)就是一个很好的例子。蛋白质分离技术的进步使研究者可以检测出只在一定时期短暂且低量表达的蛋白质,除此以外,由胞内或胞外环境作用产生的蛋白质间相互作用及蛋白质在代谢过程中相关的变化信息也可以因此而得以检测。高通量技术使研究者能够对组织及组织状态进行探究,绘制出更为精细的动态蛋白质合成及降解图,以及在此过程中的亚细胞定位变化和翻译后修饰(posttranslational modification,PTM)。
展开