在当前这个大数据时代,来自生物学的数据占有相当突出的份额。这里包括DNA和蛋白质序列数据、基因表达和调控网络数据,等等。浩如烟海的生物医学文献也是一种数据。同来自其他领域的大数据不同,生物数据反映着几十亿年自然界中物竞天择、适者生存的演化过程,因而在随机和复杂的表象之下,蕴含着深刻的内涵和结构。从大量数据中揭示生物学规律,是生物信息学、计算生物学、乃至整个生物学的任务。然而,这本书不是生物信息学或计算生物学的入门,而是演示如何用粗粒化和视像化的办法考察实际生物数据、提出问题和寻求答案,这样做的过程中会自然地导致一些数学、特别是离散数学问题。这里涉及的离散数学包括图论、组合学和形式语言学的某些篇章。书中实例,多数来自作者本人与合作者近18年的研究工作。本书可以为大学高年级学生、研究生和青年教师拓宽思路起到一些启发作用。
展开