临汾山东漯河饰品美体美文
投稿投诉
美文创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品
漯河衢州
兴义眉山
桂林阳泉
玉溪简阳
山东遂宁
永城新余
梧州洛阳
泸州温州
临汾清远
营口常熟
浙江大连
桐乡宜昌

云环境下基于分布式计算平台的交通大数据高效查询研

6月6日 终离去投稿
  摘要:随着时代的发展与信息技术的广泛应用。现如今,数据的爆炸式增长已经成为热点问题。尤其是在交通领域内,研究的深入必然产生海量的数据信息,同时也带来了数据存储了数据查询方面的难题。云平台的产生和应用为海量数据的存储和查询提供了一种新的有效方法。本文以交通大数据为研究对象,主要探讨了基于分布式数据库HBase的大数据查询策略。本文的研究为交通大数据的高效查询研究提供了一種新的思路。
  关键词:云环境;分布式计算;大数据查询;HBase
  一、综述
  随着大数据时代的到来,给对应的应用领域带来了一系列的挑战。如数据的存储方式和数据的实时访问等。大数据的存储和高效查询成为了研究热点。传统的关系型数据库难以满足海量数据的存储和实时查询的要求。Hadoop云平台具有并行性,高可靠性和可扩展性的优势因而得到研究人员的广泛关注。HBase作为一种分布式数据库使海量数据的存储和高效访问提供了可能。
  二、关键技术介绍
  (一)Hadoop
  在Hadoop平台上,HDFS作为数据存储的文件系统,MapReduce负责数据的并行计算。与传统的关系型数据库相比,Hadoop具有扩展性更强,数据处理方式更加泛化,处理类型更加广泛的特点。对于海量数据来说,分布式计算平台Hadoop是代替传统的数据仓库的必然选择。
  (二)HBase
  HBase基于分布式平台的分布式数据库,与传统数据库相比,HBase是基于列存储,适合于结构化、非结构化数据存储的数据库,这一点与大数据具有的特点不谋而合,所以说,HBase适合存储数据的存储于处理。HBase将数据按照表、行和列进行存储。
  三、数据迁移与查询策略的研究
  (一)数据迁移
  通常,交通行业的相关数据收到业务的影响,目前都存储与传统的关系型数据库,如ORACLE等中。为了对海量的交通数据进行分析研究,就涉及到要将数据从传统数据库中导入到分布式数据库中,也就是所谓的数据迁移。目前可通过相应的工具,如Sqoop或importTsv等完成数据的迁移过程。数据迁移中,首先要在HBase中设计好对应的表结构,因为HBase中,RowKey是表中每条记录的主键,能够实现对某条数据的快速定位,Rowkey的设计非常重要。ColunmFamilv代表列族,包含一个或者多个相关列。所以在进行数据迁移前,要完成RowKey和ColumnFamily的设计。
  (二)索引的建立
  HBase无可置疑拥有其优势,但其本身只对rowkey支持毫秒级的快速检索,对于多字段的组合查询却无能为力。针对HBase的多条件查询也有多种方案,基于Sok的HBase多条件查询原理是将HBase表中涉及条件过滤的字段和rowkey在Sok中建立索引,通过Sok的多条件查询快速获得符合过滤条件的rowkey值,拿到这些rowkey之后在HBase中通过指定rowkey进行查询。
  (三)实验与分析
  本集群选择8台物理机搭建,硬件配置为4G内存,80G硬盘容量,集群内部通过SSH连通。软件配置为LinuxCentOS操作系统,Hadoop2。6。0,Hbase2。7。3,hivel。2。1,对应的还有sqoop负责数据迁移,Sok负责索引的建立。实验数据来自高速公路收费系统中近三个月的绿色通道数据。数据总量约100万条,500G。
  实验步骤:
  1设计HBASE表结构,确定RowKey和ColunmFamily中包含的元组。
  2利用Sqoop将数据从ORACLE中迁移到HBASE中。
  3利用Sok为所要查询的数据属性建立相应索引。
  4按照数据量由小到大的顺序,分四次进行查询效率对比实验。
  图1展示了未建立索引和建立索引的数据查询时间对比。
  通过上图的展示表明,若未对存储的HBase中的数据设计索引,则进行数据查询时,查询的时间与数据量大小无关,耗时在5000秒左右。当利用Sok对存储在HBase中的数据设计索引后,能够大幅度的降低数据的查询时间。当数据量在100万条时,花费的查询时间耗时为8分钟左右。通过对比可以看出,建立索引能够减少数据查询时间,提高查询效率,满足对交通大数据实时查询的要求。
  四、总结
  本文是云平台Hadoop框架上,基于分布式数据库Hbase的海量数据的存储和查询。主要从数据迁移,索引的建立和通过相关的实验对比来展示云环境下,分布式数据库对海量数据存储和查询的优势。本文根据实际研究内容,对高速公路特色车辆进行查询,通过对实验展示了建立索引对非主键数据的查询效率的提升。放眼大数据行业,在未来的研究中,针对Hadoop和HBase的优化研究将会继续进行,这样才能进一步提高数据的查询效率,使云技术更好的服务于大数据行业。
投诉 评论 转载

财经法规与会计职业道德课程的教学评价及教学方法改财经法规与会计职业道德是中、高职及大学会计专业中的主要课程,也是会计从业资格考试的科目之一。从以往的会计从业资格考试情况看,本课程的考试通过率较低。究其原因,一方面是学生个人因……云环境下基于分布式计算平台的交通大数据高效查询研摘要:随着时代的发展与信息技术的广泛应用。现如今,数据的爆炸式增长已经成为热点问题。尤其是在交通领域内,研究的深入必然产生海量的数据信息,同时也带来了数据存储了数据查询方面的难……职工思想政治工作与企业关系的融合方式【摘要】在企业的发展运行中,企业文化拥有着举足轻重的作用,而员工的思想政治工作便是企业文化中应该重点表现的,职工的思想政治工作的发展实施是职工与企业关系是否健康有序融合的关键,……社区养老服务管理案例分析【摘要】当前中国老龄化形势严峻,传统家庭的养老服务功能日益弱化,专业养老机构缺乏,许多学者把寻求解决老龄化危机的目光集中在社区。社区养老不是家庭养老,也不是社会养老,而是社区中……平凡的世界读后感初读《平凡的世界》是在学生时代,那时没有太深的感受,只有对贫困时期黄土高原农民的同情,和对孙少平与田晓霞超越现实的爱情的羡慕。如今借着同名电视剧的热度重读此书,心里产生了许多不……流浪地球经典台词大全1。没有人的文明,毫无意义。2。这发动机的声音听起来像心跳。3。本计划将持续一百代人,尽管,我们不知道4。2光年外的新太阳会带来什么样的家园,但从今天开始,人类的勇……从钓底到钓全水层谈野钓浮漂选择对于大多数钓友来说,浮漂的选择是一件很困难的事情。太多钓友只关心吃铅量多少、能不能看清目数、价格是多少这三方面,往往忽略了浮漂本身的作用,你需要这支浮漂达到什么样的效果?这就是……匠人精神从提升心性开始每天一本书专题系列连载的第10篇文章大家好,这里是每天一本书专题系列,每天坚持进步一点点!今天要给大家分享的书是《匠人精神:一流人才育成的30条法则》本书作者……拒绝是最好的尊重励志小故事:拒绝是最好的尊重在战国时期的时候,苏秦和张仪都是鬼谷子的学生。苏秦和张仪选的专业都不是热门的儒家、法家等专业,而是一门比较偏僻的专业纵横学,因为他们明白在战乱……毕业不说分手如何捍卫你的爱情一年一度的毕业季又到了,分手变成了永恒的主题。毕业季的同学们不仅要缅怀自己逝去的青春,更多的缅怀自己逝去的爱情。校园爱情是最纯真美好的,可是为什么一到毕业,恋人们就都以分手告终……为什么我们从来没有在投资上赚过大钱我们想讨论的是一个许多人都有的困惑:为什么我学了许多东西,却依然做不好投资?要回答这个问题,可以先试着讨论一下这个问题的反面:是不是学了许多东西,就能做好投资?在我……蜕皮又来了,他睁开眼的时候周围一片漆黑。但由于不再是第一次经历,他熟练地拔出双手,向前用力从里面撑开自己的牙齿和嘴唇。是的,没有搞错方向,的确是从里面,因为他现在正在自己的口腔里。……
古董局中局大结局解析大结局扑朔迷离又平静在无窗办公室工作一天等于一晚少睡分钟快的打车赵冬我们凭什么赚钱怎么自己做健康的核桃花生饮品辣椒瘦肉炒西兰花的家常做法生活中如何有效的防癌抗癌林区综治维稳工作总结民主管理工作调研报告域外论我国小商贩的法律地位谈公证服务模式创新人员招聘绩效考核咋推进

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找