搜索
高级检索
高级搜索
书       名 :
著       者 :
出  版  社 :
I  S  B  N:
文献来源:
出版时间 :
大数据环境下计算机数据处理技术探索
0.00     定价 ¥ 68.00
图书来源: 浙江图书馆(由JD配书)
此书还可采购15本,持证读者免费借回家
  • 配送范围:
    浙江省内
  • ISBN:
    9787500179900
  • 作      者:
    师坤,廖福香,李杰
  • 出 版 社 :
    中译出版社
  • 出版日期:
    2025-03-01
收藏
内容介绍
  《大数据环境下计算机数据处理技术探索》是数据处理方向的书籍,主要研究大数据环境下计算机数据处理技术。《大数据环境下计算机数据处理技术探索》从大数据基础介绍入手,针对数据科学、大数据的生态环境与基础理论、大数据处理周期与科学研究范式做了简要说明;接着对数据获取技术以及清洗、去噪、约简、集成等基础处理技术进行了阐释;着重探讨了数据挖掘中的模式甄别与网络分析及大数据平台的构建与使用;还对数据处理安全与大数据技术发展趋势进行了分析,最后对计算机数据处理中机器学习的应用提出了一些建议。《大数据环境下计算机数据处理技术探索》力求对计算机数据处理技术的应用创新有一定的借鉴意义。
展开
精彩书摘
  第一章 大数据概述
  第一节 数据科学
  数据科学是关于数据的科学,基于数据的广泛性和多样性研究数据的共性。数据科学是研究探索CYBER空间中数据界的理论、方法和技术。
  一、数据科学的相关术语
  (一)CYBER空间
  CYBER空间意译为异次元空间、多维信息空间、计算机空间、网络空间等。其本意是指以计算机技术、现代通信网络技术、虚拟现实技术等信息技术的综合运用为基础,以知识和信息为内容的新型空间,是人类运用知识创造的人工世界,是一种用于知识交流的虚拟空间。信息化是一个数据生产的过程,是将现实世界中的事物和现象以数据的形式存储到CYBER空间中。数据记录了人类的行为,包括工作、生活和社会的发展,是自然和生命的一种表示形式。
  (二)数据爆炸
  数据快速大量地产生并存储在CYBER空间中的现象称为数据爆炸,数据爆炸在CYBER空间中形成数据自然界。数据是CYBER空间中的唯一存在,我们需要研究和探索CYBER空间中数据的规律和现象。探索CYBER空间中数据的规律和现象是探索宇宙规律、探索生命规律、寻找人类行为规律、寻找社会发展规律的一种重要手段。
  (三)数据科学的定义
  数据科学是关于数据的科学或者研究数据的科学,是探索CYBER空间中数据界奥秘的理论、方法和技术,研究的对象是数据界中的数据。与自然科学和社会科学不同,数据科学的研究对象是CYBER空间数据。数据科学主要包括两方面:一是研究数据本身,以科学的方法研究数据的各种类型、状态、属性及变化形式和变化规律;二是用数据的方法研究科学,为自然科学和社会科学研究提供一种新的方法,称为科学研究的数据方法,其目的在于揭示自然界和人类行为的现象和规律。
  (四)数据科学的方法和技术
  数据科学采用收集数据的形式,进行开放式分析,不做预先假定。在许多数据科学项目中,首先要浏览原始数据,形成一个假定,然后基于假定进行调查确认。数据科学的关键概念是:数据科学是一种经验科学,直接基于数据进行科学处理。数据科学已经有一些方法和技术,例如数据获取、数据存储与管理、数据安全、数据分析、可视化等。
  数据科学不仅完成分析,而且涉及整个端到端的生命周期,数据系统本质上是用于研发真实世界理解模型的科学设备。这就表明必须深刻理解数据的来源、数据转换的适用性和准确性、转换算法和过程之间的相互作用,以及数据存储机制。这个端到端概览的角色能够确保所有事务都能够正确执行,从而探索数据、创建并验证各项科学假设。
  二、数据科学的主要内容
  数据科学的主要内容包括基础理论和数据预处理、数据计算数据管理等。其中,基础理论包括概念、理论、方法、技术和工具等。数据科学的理论基础是统计学、机器学习、数据可视化及某一领域实务知识与经验等(如图1-1所示)。数据科学学科建立,需要完成知识结构、课程设置和专业设置等学科体系建设,探讨数据科学与自然科学和社会科学之间的关系,以及数据科学与计算机科学和信息科学之间的关系等。
  ……
展开
目录
第一章 大数据概述 1
第一节 数据科学 1
第二节 大数据的生态环境与基础理论 7
第三节 大数据处理周期与科学研究范式 15

第二章 大数据中的数据获取技术 29
第一节 数据获取组件分析 29
第二节 数据获取探针的原理解析 32
第三节 网页及日志的采集 38
第四节 数据分发中间件的作用 45

第三章 计算机数据的基础处理技术 51
第一节 大数据清洗技术 51
第二节 大数据去噪与标准化 63
第三节 大数据约简与集成技术 76

第四章 数据挖掘中的模式甄别与网络分析 88
第一节 模式甄别的监督侦测方法 88
第二节 网络节点重要性的测度 95
第三节 网络子群构成特征 103
第四节 主要网络类型及特点 111

第五章 基于Hadoop的大数据平台构建 118
第一节 Hadoop整合平台的使用与管理 118
第二节 基于Linux的MySQL数据库平台的搭建 126
第三节 Hive数据仓库的搭建和使用 135

第六章 数据处理安全与技术发展趋势 147
第一节 信息安全技术与隐私保护 147
第二节 大数据技术实时化与内存计算发展 160
第三节 大数据技术泛在化发展趋势 165
第四节 大数据技术智能化发展趋势 172

第七章 计算机数据处理机器学习的应用领域 176
第一节 互联网与商业领域 176
第二节 农业与医疗信息化建设领域 183
第三节 城建工程与电信零售领域 191
第四节 其他研究领域 196

参考文献 203
展开
加入书架成功!
收藏图书成功!
我知道了(3)
发表书评
读者登录

请选择您读者所在的图书馆

选择图书馆
浙江图书馆
点击获取验证码
登录
没有读者证?在线办证