在大数据管理领域,开展了包括Astro DB、Myria、Nuage、CQMS、Data Eco$y$tem和SQLShare6个有代表性的研究项目,其中Astro DB是计算机科学与工程系2008年以来一直与华盛顿大学天文学系共同合作的项目,旨在构建能够存储、管理、分析和处理天文学领域大数据的系统。Myria项目主要关注构建一个快速、灵活的大数据管理系统,将系统以云服务的形式对外暴露。Nuage项目关注大数据与云计算相关的技术问题,特别关注科学应用问题。CQMS关注辅助大数据系统使用的相关工具。Eco$y$tem项目关注大数据市场以及数据管理和定价等方面的问题。SQL Share是一个基于云计算技术的数据库即服务平台,关注关系数据库自动化使用方面的相关问题,包括安装、配置、数据库模式设计、性能调优和应用构建等问题。 在大数据可视化方面,主要通过设计交互式可视化分析工具,增强数据的分析和交流能力,该项目涉及可视化、交互技术和评估技术的研究与系统实现等方面的问题。
在大数据架构和编程方面,主要研究在计算机系统结构、编程和系统层面上对大数据的支持,主要包括基于PCM (Phase-Change Memory)的存储系统研究、大规模非规则并行计算(如图分析等)、硬件多线程系统,等等。
在大数据系统方面,主要研究超大规模内存机器、大规模并行系统中的可预测尾延迟(predictable tail-latency)技术等。
在Web大数据方面,主要研究Web范围内的信息抽取系统,该系统能够读取Web上的任意文本数据,抽取有意义的信息,并将其存储到一个统一的知识库中,便于后续的查询工作。 在人才培养和教育方面,计算机科学与工程系于2013年9月开始招收数据科学的博士学位(特别关注大数据问题)。华盛顿大学将利用整个大学的资源,打造一个跨学科的大数据方面的博士学位。除此以外,华盛顿大学还开设一个关于数据科学方面的认证项目,提供相关的教育与培训服务。
2.国内学术界大数据研究现状
(1)中国科学院
英特尔公司与中国科学院自动化研究所联合成立“中国英特尔物联技术研究院”,计划未来5年投资2亿元人民币,着力攻克大数据处理技术、传输技术和智能感知等物联网核心技术。该研究院还将与国际国内一流科研院所、院校和企业合作,建立一个开放式的研究中心。 中国科学院软件研究所2012年5月31日承办了“走进大数据时代研讨会”。国内众多知名大学教授,及行业代表围绕大数据的相关议题展开共同探讨。分析了当前大数据的行业现状,大数据的最新动态及发展趋势。“大数据”概念正在引领中国互联网行业新一轮的技术浪潮。
(2)清华大学
清华大学计算机科学与技术系、地球系统科学研究中心等机构一直从事大数据方向的研究,取得了一些成果,包括清华云存储系统、大数据存储系统、大数据处理平台、社交网络云计算和海量数据处理系统,等等。
……
展开