第一章 R语言基础及Bioconductor平台
1.1 引言
1.2 R语言基础
1.2.1 R语言基础语法
1.2.2 R语言数据类型
1.2.3 R语言绘图方法
1.3 R包及Bioconductor平台
1.3.1 包的安装
1.3.2 包的载入
1.3.3 包的使用
1.3.4 Bioconductor:生信人的万能包
第二章 基于R的统计学基础
2.1 引言
2.2 R语言数据管理
2.2.1 数据排序
2.2.2 数据集合并
2.2.3 缺失值处理
2.3 分布与假设检验
2.3.1 概率分布
2.3.2 t检验
2.3.3 非参数检验
2.3.4 其他检验
2.4 方差分析
2.4.1 单因素方差分析
2.4.2 两因素和多因素方差分析
2.5 相关与回归分析
2.5.1 Pearson与Spearman之间的较量
2.5.2 一元线性回归
2.5.3 多元线性回归
2.5.4 逻辑回归
第三章 序列比对及序列搜索
3.1 引言
3.2 序列比对与搜索的算法
3.2.1 序列两两比对算法
3.2.2 序列搜索算法BLAST
3.3 应用实例
3.3.1 标准动态规划算法
3.3.2 Needleman-Wunsch算法
3.3.3 Smith-Waterman算法
3.3.4 BLAST(DNA, protein, DNA-protein)
第四章 系统发生分析
4.1 引言
4.2 系统发生分析的概念和系统发生树
4.2.1 系统发生分析的基本概念
4.2.2 系统发生树及其性质
4.3 多序列比对和系统发生树的构建
4.3.1 多序列比对
4.3.2 多序列比对的常用工具
4.3.3 系统发生树的构建方法
4.3.4 系统发生树的构建及分析工具
4.3.5 系统发生树的统计分析
4.4 应用实例
4.4.1 基于EBI ClusterQ工具的多序列比对实例
4.4.2 基于R语言的多序列比对和系统发生树构建实例
4.4.3 基于MEGA的系统发生树构建实例
第五章 蛋白质结构分析
5.1 引言
5.2 蛋白质各级结构特点及分析工具
5.2.1 蛋白质一级结构
5.2.2 蛋白质二级结构
5.2.3 蛋白质三级结构
5.3 基于深度学习方法预测蛋白质结构
5.3.1 背景
5.3.2 Alphafold:基于神经网络的蛋白质结构预测
5.3.3 Alphafold2:集中注意力的Alphafold
5.4 集成门户Expasy
第六章 高通量测序数据、基因组装配、读段回帖
6.1 引言
6.2 测序技术的发展简史
6.3 Illumina测序技术:高通量测序界的宠儿
6.3.1 SBS测序流程
6.3.2 测序:从读懂fastq/a文件开始
6.4 数据分析前的准备
6.4.1 FastQC:测序读段的专属“医生”
6.4.2 读段的处理工具
6.5 基因组序列组装
6.5.1 短序列组装中的两种构图
6.5.2 组装流程
6.5.3 组装评估
6.5.4 组装工具
6.6 测序读段回帖
6.6.1 参考基因组选择
6.6.2 测序读段回帖算法——BWT算法
6.6.3 站在BWT肩上的BWA
6.6.4 局部重比对
6.6.5 标记重复
6.6.6 碱基质量重新评估
6.6.7 sam、bam文件及其管家samtools
6.6.8 vcf、bcf 文件及其管家bcftools
第七章 基因组注释及变异分析
7.1 引言
7.2 基因组注释
7.2.1 基因组注释的方法
7.2.2 基因组结构预测的工具
7.2.3 基因组注释实例
7.3 识别变异
7.3.1 结构变异的识别策略
7.3.2 FreeBayes方法与实例
7.3.3 VarScan2方法与实例
7.3.4 GATK工具:变异识别的优等生
7.3.5 IGV:可视化好帮手
7.4 MoDIL检测中等长度的Indel变异
第八章 转录组测序数据分析
8.1 引言
8.2 基因表达
8.3 转录组测序的目的和数据特点
8.3.1 转录组测序的目的
8.3.2 转录组测序数据的特点
8.4 转录组测序的工作流程
8.4.1 实验设计
8.4.2 RNA完整性检查
8.4.3 RNA的提取和cDNA文库的构建
8.4.4 cDNA测序
8.4.5 测序数据质量控制
8.4.6 序列回帖/组装
8.4.7 基因表达水平的量化
8.4.8 差异表达分析
8.4.9 差异表达基因富集分析
8.5 转录组测序的应用
8.5.1 基因表达与差异分析
8.5.2 选择性表达
8.5.3 发现新的转录本
8.5.4 非编码RNA鉴定与分析
8.6 转录测序数据分析示例
8.6.1 分析流程概述
8.6.2 数据分析实战
第九章 转录因子结合数据及其分析
9.1 引言
9.2 ChIP-Seq及其数据分析流程概述
9.3 ChIP-Seq技术的原理、方法
9.3.1 ChIP-Seq实验步骤及原理
9.3.2 ChIP-Seq测序实验的设计
9.4 ChIP-Seq数据分析流程
9.4.1 原始数据
9.4.2 数据质量评价
9.4.3 质量控制
9.4.4 搜峰
9.4.5 重复一致性评估
9.4.6 峰的合并及统计
9.4.7 峰的可视化
9.4.8 峰的注释
9.4.9 靶基因功能富集分析
9.5 转录因子结合位点分析
9.5.1 转录因子结合位点的表现形式
9.5.2 识别单个序列中的结合位点
9.5.3 转录因子数据库及Motif分析工具
第十章 染色质结构及其分析方法
10.1 引言
10.2 染色质及其开放性
10.2.1 染色质及其状态
10.2.2 染色质开放性与可及基因组
10.2.3 染色质开放性的影响因素
10.2.4 可及基因组及调控功能
10.3 染色质开放组学研究技术
10.3.1 DNase-Seq技术
10.3.2 FAIRE-Seq技术
10.3.3 ATAC-Seq技术
10.3.4 DNase-Seg、ATAC-Seg和FAIRE-Seq方法比较及数据特点
10.4 染色质开放组学数据分析流程
10.4.1 质量评估
10.4.2 比对
10.4.3 染色质开放信号识别及分析
10.4.4 模体分析及核小体定位
10.5 染色质开放组学数据分析实践
10.5.1 基于ATAC-Seq和RNA-Seq的转录调控分析
10.5.2 染色质开放性与疾病关系分析
第十一章 单细胞测序数据分析
11.1 引言
11.2 单细胞转录组数据分析
11.2.1 数据预处理
11.2.2 基础分析
11.2.3 下游分析
11.3 单细胞染色质开放性分析
11.3.1 基础分析
11.3.2 下游分析
11.4 整合分析
11.5 实例
11.5.1 数据导入
11.5.2 数据过滤
11.5.3 数据归一化(Normalization)
11.5.4 特征选择
11.5.5 数据缩放
11.5.6 数据降维
11.5.7 聚类
11.5.8 数据可视化
11.5.9 差异表达基因
第十二章 生物分子网络的构建与分析
12.1 引言
12.2 生物分子网络的构建
12.2.1 当生物系统遇上网络
12.2.2 生物网络的类型与建模
12.2.3 重要的生物网络数据库简介
12.2.4 网络可视化和分析工具
12.3 基于Cytoscape的网络分析应用实例
12.3.1 软件下载及环境配置
12.3.2 运行Cytoscape
12.3.3 创建网络及文件导入
12.3.4 网络属性设置
12.3.5 网络布局设置
12.3.6 过滤和子网选取
12.3.7 网络拓扑结构分析
12.3.8 基于互作数据库构建网络和网络融合
12.3.9 Cytoscape插件的使用
12.3.10 结果导出
展开