为了让标识成为特异性的可靠描述,进入比对的数据必须不存在冗余,这是一个基本条件。如果多个序列都包含了某个特定位点,就会对概率分布产生影响。
简单的标识可视化技术以及与其相对应的权重矩阵方法,都是对矩阵中每个位置的独立分析。我们将会在第6章中阐述神经网络如何进一步拓展这种分析方法。通过计算“正”位点比对结果中单体的出现频率与参考分布中频率的比值,权重矩阵对每个位置赋予相应的权重值。给定一个序列,如果将每个位置上单体所对应的权重的对数值求和,可以得到一个分值。我们还可以调整选取一个阈值以实现对于真位点
展开
2002年夏天,中信出版社交给我一本英文原著,是由皮埃尔·巴尔迪(Pierre Baldi)和索恩·布鲁纳克(Sφren Bruak)两位教授编写的《生物信息学——机器学习方法》(第2版),MIT出版社于2001年出版。出版社的编辑同志告诉我,鉴于本书的学术价值及其在生物信息学领域的重要性,出版社已购买了本书的中文版权,并准备作为社里的重点图书尽快在国内翻译出版。由于本书作者在生命科学、数学以及计算机科学等多个领域都有相当的造诣,加之本书同时涉及了生物信息学的理论基础和最前沿的实际应用,出