1.导论
1.1 小规模专家知识阶段
1.2 大规模语料库统计模型阶段
1.3 大规模语料库深度学习阶段
1.4 大规模预训练语言模型阶段
2.自然语言处理基础
2.1 文本表示
2.2 自然语言处理任务
2.3 评价指标
3.预训练模型
3.1 静态词向量预训练模型
3.2 动态词向量预训练模型
3.3 预训练语言模型
4.自然语言处理中的神经网络
4.1 多层感知机
4.2 卷积神经网络
4.3 循环神经网络
4.4 注意力机制
4.5 Transformer模型
4.6 提示学习Prompt Learning
5.差分隐私相关基础
5.1 中心化差分隐私
5.2 本地差分隐私
5.3 度量差分隐私
5.4 UMLDP (Utility-optimized MLDP)
5.5 噪声机制
6.攻击类型
6.1 成员推理攻击
6.2 重建攻击
6.3 属性推理攻击
6.4 模型抽取攻击
6.5 梯度信息攻击
6.6 基于提示信息攻击
7.基于单词层级的差分隐私方法
7.1 中心化差分隐私场景下
7.2 本地化差分隐私场景下
7.3 度量差分隐私场景下
8.基于Token层级的差分隐私方法
8.1 SANTEXT和SANTEXT+
8.2 基于Bett系列的差分隐私方法
9.基于句子层级的差分隐私方法
9.1 Skip-Thoughts向量
9.2 Sent2Vec
9.3 Doc2Vec
9.4 SBERT
9.5 模糊词袋方法Fuzzy Bag-of-Words
9.6 其他方法
9.7 句子层级差分隐私方法框架
10.基于主题层级的差分隐私方法
1O.1 LDA方法
10.2 基于LDA方法的差分隐私技术
10.3 基于编码扰动方法
1O.4 基于文档层级的方法
10.5 SynTF方法
10.6 基于计数布隆过滤器差分隐私方法
11.基于梯度的差分隐私方法
11.1 DP-SGD
11.2 DP-Adam
11.3 DP-BERT
11.4 RGP
12.自然语言模型的可解释性
12.1 模型的解释技术
12.2 预测结果和解释技术
12.3 模仿者模型解释技术
12.4 性能评估
12.5 未来的挑战
参考文献
展开