1. 研究目的与意义
随着互联网技术不断的发展进步,信息呈现爆炸性增长,已然演变成最重要的生产以及生活资料。如何在信息的海洋中提取、检索出用户需要的数据变成了各个行业分析、处理以及应用的关键。云计算(cloudcomputing)是基于虚拟化思想和互联网架构的一种服务增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。而树状数据作为基础数据结构的重要一员,在当前信息系统如生物、交通、人文等领域得到广泛应用。
传统的检索系统检索复杂度和代价较高,已经不适用于如今的大数据时代。利用云计算分布式存储技术对海量的树状数据进行存储和高效的管理是一种非常有效的解决方案,在数据收集的基本数据量级从千GB逐渐累积成兆GB的过程中,云存储为这些海量数据处理提供了比其它方式更可靠和有效的途径。Hadoop是目前广泛应用的开源云计算基础框架,Hadoop通过HDFS与MapReduce提高系统扩张性和易编程性,利用Web数据挖掘技术获取有用信息,提高数据存储和检索效率。
综上所述,为了检索大量的树状数据,必须使用Hadoop云计算平台,并且利用MapReduce计算框架将数据资源部署在不同的机器上实现分布式管理,并行式检索显著减少了树状数据检索的时间耗费,不仅具有理论价值,也具有很强的应用价值和很重要的现实意义。
2. 研究内容和预期目标
主要研究内容:
1)分析树状数据存储结构。树是一种多层次的数据结构,并且树中每个结点可以存在个分支。
2)搭建云计算平台,Hadoop为我们提供了一个可靠地共享存储和分析系统。HDFS实现数据的存储,Mapreduce实现数据的分析和处理。
3. 研究的方法与步骤
(1)研究方法:
应用软件工程思想与方法,开发该系统。
①需求分析
4. 参考文献
[1]李乔,郑啸.云计算研究现状综述[J].计算机科学,2011,38(4):32-37. [2]陈康,郑纬民.云计算:系统实例与研究现状幸[J].软件学报,2009,20(5).. [3]罗军舟,金嘉晖,宋爱波,等.云计算:体系架构与关键技术[J].通信学报,2011,32(7):3-21. [4]李传湘.树数据结构[J].数学物理学报,1983,3:004. [5]朱雅莉,李肯立.DNA计算机中基于顺序存储方式的二叉树数据结构[J].计算机应用,2008,28(6):1591-1594. [6]刘斌.关于HUFFMAN树数据结构的新设计[J].计算机应用与软件,1999,16(5):29-33. [7]严蔚敏,吴伟民,分类,等.数据结构(C语言版)[J].计算机教育,2012,12:017. [8]杨健兵.数据挖掘中关联规则的改进算法及其实现[J].微计算机信息,2006(07X):195-197.
|
5. 计划与进度安排
(1)1月15日至2月15日分析课题,查找资料。
(2)2月16日至2月28日完成需求分析。
(3)3月1日至3月16日完成开题报告。
以上是毕业论文开题报告,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。