搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
大数据环境下的科技信息潜在语义挖掘技术优化与比较研究
0.00     定价 ¥ 48.00
图书来源: 浙江图书馆(由浙江新华配书)
此书还可采购25本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787518984749
  • 作      者:
    作者:崔运鹏|责编:王培
  • 出 版 社 :
    科学技术文献出版社
  • 出版日期:
    2021-10-01
收藏
内容介绍
本书以潜在语义挖掘理论研究与分布式并行计算方法研究、分布式潜在语义挖掘并行计算技术研发及大数据环境下潜在语义挖掘比较研究3项内容为切入点,重点解决文献服务实际应用场景下的大规模科技文档语料潜在语义信息挖掘的问题,化解大规模科技信息文档语料潜在语义挖掘分布式并行计算过程及定量判断大数据环境下科技文献数量变化对深度潜在语义挖掘影响的核心技术难点。对文本挖掘交叉领域关系、文献领域语义挖掘的多样化挑战、研究应用前景等进行了探讨,希望为科技信息潜在语义挖掘技术研究工作的开展提供参考,为理论研究及实践应用等方面水平的提升提供更多支持。
展开
目录

目录


第一章 研究背景与意义 1

1.1?问题的提出 1

1.2?研究现状 2

1.2.1?文本挖掘研究现状 3

1.2.2?国外相关技术研究现状 13

1.2.3?国内相关技术研究现状 17

1.3?研究意义 18

第二章 关键技术发展历程 21

2.1?关键词检索技术的发展 22

2.2?概率主题模型 28

2.3?深度学习技术的发展(word2vec) 35

2.4?并行计算及降维算法的发展 42

2.4.1?并行计算 42

2.4.2?降维算法 43

第三章 研究方案及数据处理方案 51

3.1?研究方案详述 51

3.2?数据处理方案详述 55

3.3?中英文文本预处理及其差异 56

第四章 技术研发与应用实践 61

4.1?语义挖掘理论研究与分布式并行计算方法研究 61

4.1.1?LSI技术研究 62

4.1.2?LDA技术研究 66

4.1.3?word2vec技术研究 72

4.2?语义挖掘分布式并行计算的实现及验证系统的开发 96

4.2.1?语义挖掘分布式并行计算的实现 96

4.2.2?验证系统前端实现 106

4.2.3?验证系统后端实现 113

4.3?结果展示及对比研究 121

4.3.1?词频和关键词检索定性结果对比 121

4.3.2?定量结果对比(对比词频和关键词检索) 130

第五章 主要研究结论 133

第六章 相关研究讨论 135

6.1?交叉领域关系讨论 135

6.2?研究应用前景探讨 142

6.3?word2vec的优化方向 146

6.4?文献领域语义挖掘多样化挑战 149

参考文献 153


展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证