搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
神经网络机器翻译技术及产业应用/计算机企业核心技术丛书
0.00     定价 ¥ 89.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787111725206
  • 作      者:
    编者:王海峰//何中军//吴华|责编:梁伟//游静
  • 出 版 社 :
    机械工业出版社
  • 出版日期:
    2023-04-01
收藏
内容介绍
《神经网络机器翻译技术及产业应用》由百度首席技术官王海峰、百度人工智能技术委员会主席何中军、百度技术委员会主席吴华联合撰写,以产业需求为牵引,介绍了新时期机器翻译的产业需求特点、神经网络机器翻译的原理与方法、近期新技术进展及产业应用。全书兼具理论与实践,既有对原理与方法的介绍,又有丰富的产业应用案例。《神经网络机器翻译技术及产业应用》共九章:第1章 绪论,首先阐述了机器翻译发展的时代背景和技术发展脉络,从多个角度回顾了机器翻译的发展历程,介绍了当前机器翻译的发展现状以及产业应用需求特点和挑战。第2章 翻译语料获取与译文质量评价,介绍了翻译语料获取的相关技术以及机器翻译常用的评价方法,包括人工评价、自动评价、面向产业应用的评价。第3章 神经网络机器翻译,首先介绍了神经网络机器翻译的基本原理和模型结构,接下来介绍了多种翻译模型,最后介绍了利用开源工具搭建一个神经网络机器翻译系统的方法。第4章 高性能机器翻译,结合百度、谷歌等公司的机器翻译系统实践,首先介绍了神经网络机器翻译的产业化进程,然后介绍了常用的提升系统性能的方法,最后介绍了开源工具平台中的高性能实现方案。第5章 多语言机器翻译,首先介绍了数据增强技术以扩充训练数据规模,然后介绍了基于无监督的训练方法以及多种翻译模型,最后介绍了近年来快速发展的多语言预训练技术及其在多语言机器翻译上的应用。本章结尾还结合百度、谷歌、脸书等公司的实践,介绍了大规模多语言机器翻译系统。第6章 领域自适应,介绍了领域自适应技术,通过数据增强、优化训练等多种手段,使翻译模型在具体领域上获得较高的翻译质量。第7章 机器同声传译,首先介绍了机器同传的主要挑战和发展现状,然后介绍了目前常用的机器同传数据集和评价方式,最后介绍了如何使用开源工具搭建一个机器同传系统。第8章 机器翻译产业化应用,着重介绍了现实生活中机器翻译丰富的产品形式和广泛应用。第9章 总结与展望,对全书进行了总结,并对机器翻译的未来发展进行展望。
展开
目录
第1章 绪论 1 1.1 机器翻译发展简介 3 1.2 机器翻译代表性方法 6 1.2.1 基于规则的机器翻译 6 1.2.2 统计机器翻译 8 1.2.3 神经网络机器翻译 11 1.3 发展现状 13 1.4 产业应用需求特点及挑战 15 1.4.1 高翻译质量 15 1.4.2 高系统性能 17 1.4.3 多语言翻译 18 1.4.4 领域自适应 19 1.4.5 跨模态翻译 20 1.5 本书结构 21参考文献 24第2章 翻译语料获取与译文质量评价 27 2.1 概述 28 2.2 机器翻译语料库类型 31 2.2.1 双语语料库 31 2.2.2 单语语料库 33 2.3 公开语料库及系统评测 34 2.3.1 语言数据联盟与NIST评测 34 2.3.2 欧洲议会语料库与WMT评测 35 2.3.3 语音翻译语料库与IWSLT评测 35 2.3.4 中文语言资源联盟与CCMT评测 36 2.4 从互联网获取机器翻译语料 36 2.4.1 互联网双语语料存在形式 37 2.4.2 互联网语料常见问题 39 2.4.3 双语语料挖掘与加工 40 2.5 机器翻译质量评价 44 2.5.1 人工评价 44 2.5.2 自动评价 46 2.5.3 面向产业应用的评价 53 参考文献 55第3章 神经网络机器翻译 57 3.1 概述 59 3.2 基于循环神经网络的模型 62 3.2.1 基本模型 63 3.2.2 双向编码 65 3.2.3 注意力机制 66 3.2.4 长短时记忆与门控循环单元 68 3.3 基于卷积神经网络的翻译模型 71 3.4 全注意力模型 75 3.4.1 基本思想 76 3.4.2 模型结构 78 3.4.3 性能分析 79 3.5 非自回归翻译模型 80 3.6 搭建一个神经网络机器翻译系统 85 3.6.1 环境准备 85 3.6.2 模型训练 86 3.6.3 解码 88 3.6.4 效果评估 88参考文献 89第4章 高性能机器翻译 93 4.1 概述 94 4.2 早期产业化神经网络机器翻译系统 96 4.2.1 百度神经网络机器翻译系统 97 4.2.2 谷歌神经网络机器翻译系统 101 4.3 Transformer模型优化 104 4.3.1 高效Transformer 105 4.3.2 针对机器翻译的优化 109 4.4 模型压缩 112 4.4.1 剪枝 112 4.4.2 量化 115 4.4.3 知识蒸馏 119 4.5 系统部署 121 4.5.1 分布式系统部署 121 4.5.2 智能硬件设备 122 4.6 开源工具 123参考文献 124第5章 多语言机器翻译 131 5.1 概述 133 5.2 数据增强 134 5.2.1 基于枢轴语言的合成语料库方法 134 5.2.2 回译技术 136 5.3 无监督机器翻译 138 5.3.1 基本原理 139 5.3.2 跨语言向量映射 140 5.3.3 基于去噪自编码器和回译技术的翻译模型 142 5.3.4 基于对偶学习的机器翻译模型 144 5.4 多语言翻译统一建模 145 5.4.1 基于多任务学习的翻译模型 146 5.4.2 基于语言标签的多语言翻译模型 148 5.5 多语言预训练 151 5.5.1 预训练技术简介 152 5.5.2 多语言预训练模型 158 5.5.3 方法比较 163 5.6 多语言机器翻译系统 165 5.6.1 百度多语言机器翻译 165 5.6.2 谷歌多语言机器翻译 166 5.6.3 脸书多语言机器翻译 168参考文献 169第6章 领域自适应 177 6.1 概述 179 6.2 领域数据增强 180 6.2.1 领域数据聚类 180 6.2.2 领域数据筛选 182 6.2.3 领域数据扩充 184 6.3 模型训练及优化 184 6.3.1 预训练加微调技术 185 6.3.2 领域数据加权训练 186 6.3.3 模型参数部分调优 187 6.3.4 基于知识蒸馏的领域自适应 188 6.3.5 基于课程表学习的领域自适应 189 6.4 专有名词和术语的翻译 190 6.4.1 前处理技术 191 6.4.2 后处理技术 193 6.4.3 融合专名/术语翻译的解码算法 193 6.5 翻译记忆库 195 6.5.1 基于记忆库的数据增强 196 6.5.2 融合记忆库的翻译模型 197 6.5.3 k-近邻翻译模型 198 6.6 面向产业应用的领域自适应解决方案 199参考文献 200第7章 机器同声传译 207 7.1 概述 209 7.2 主要挑战 211 7.2.1 技术挑战 211 7.2.2 数据挑战 213 7.2.3 评价挑战 214 7.3 级联同传模型 216 7.3.1 wait-k模型 216 7.3.2 语义单元驱动的同传模型 220 7.3.3 基于强化学习的同传模型 224 7.3.4 基于单调无限回溯注意力机制的同传模型 226 7.4 端到端语音翻译及同传模型 228 7.4.1 从级联模型至端到端模型的过渡 229 7.4.2 基于多任务学习的端到端模型 231 7.4.3 语音识别与翻译交互解码模型 234 7.4.4 端到端同传模型 236 7.5 同传模型鲁棒性 241 7.5.1 融合音节信息的翻译模型 241 7.5.2 语音识别纠错 242 7.5.3 鲁棒性翻译模型 244 7.6 同传数据 245 7.6.1 欧洲语言同传语料库 246 7.6.2 日英同传语料库 247 7.6.3 中英同传语料库 247 7.7 同传评价 249 7.7.1 基于阅读理解的翻译质量评价 249 7.7.2 基于平均延迟的同传时延评价 250 7.7.3 综合翻译质量和同传时延的评价 252 7.8 机器同传系统及产品 252 7.8.1 机器同传系统 253 7.8.2 机器同传产品形式 254 7.8.3 机器辅助同传 254 7.9 搭建一个机器同传系统 256 7.9.1 数据准备 256 7.9.2 训练 257 7.9.3 解码 257参考文献 258第8章 机器翻译产业化应用 265 8.1 面向产业应用的机器翻译系统 267 8.2 机器翻译产品形态 268 8.2.1 跨模态翻译 269 8.2.2 翻译硬件 270 8.2.3 机器翻译技术开放平台 271 8.3 机器翻译产业应用 272 8.3.1 在语言服务行业的应用 273 8.3.2 产业应用现状及趋势 275第9章 总结与展望 277
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证