临汾山东漯河饰品美体美文
投稿投诉
美文创意
爱情通信
用品婚姻
爱好看病
美体软件
影音星座
瑜伽周边
星座办公
饰品塑形
搞笑减肥
幼儿两性
智家潮品
漯河衢州
兴义眉山
桂林阳泉
玉溪简阳
山东遂宁
永城新余
梧州洛阳
泸州温州
临汾清远
营口常熟
浙江大连
桐乡宜昌

图解一致性哈希算法,看这一篇就够了

7月19日 发如雪投稿
  近段时间一直在总结分布式系统架构常见的算法。前面我们介绍过布隆过滤器算法。接下来介绍一个非常重要、也非常实用的算法:一致性哈希算法。通过介绍一致性哈希算法的原理并给出了一种实现和实际运用的案例,带大家真正理解一致性哈希算法。一、背景
  在具体介绍一致性哈希算法之前,先问一个问题:为什么需要一致性哈希算法?下面我们通过一个案例来回答这个问题。
  假设有这么一种场景:我们有三台缓存服务器分别为:node0、node1、node2,有3000万个缓存数据需要存储在这三台服务器组成的集群中,希望可以将这些数据均匀的缓存到三台机器上,你会想到什么方案呢?
  我们可能首先想到的方案是:取模算法hash(key)N,即:对缓存数据的key进行hash运算后取模,N是机器的数量;运算后的结果映射对应集群中的节点。具体如下图所示:
  如上图所示,首先对key进行hash计算后的结果对3取模,得到的结果一定是0、1或者2;然后映射对应的服务器node0、node1、node2,最后直接找对应的服务器存取数据即可。
  通过取模算法将每个数据请求都均匀地分散到了三个不同的服务器节点上,看起来很完美!但是,在分布式集群系统的负载均衡实现上,这种模型在集群扩容和收缩时却有一定的局限性:因为在生产环境中根据业务量的大小,调整服务器数量是常有的事,而服务器数量N发生变化后hash(key)N计算的结果也会随之变化!导致整个集群的缓存数据必须重新计算调整,进而导致大量缓存在同一时间失效,造成缓存的雪崩,最终导致整个缓存系统的不可用,这是不能接受的。为了解决优化上述情况,一致性哈希算法应运而生。二、一致性哈希简介
  有些朋友一听到算法就头大,其实大可不必,一致性哈希算法听起来高大上,其实非常简单。接下来开始介绍什么是一致性哈希算法,它解决了什么问题。2。1什么是一致性哈希?
  一致性哈希(ConsistentHash)算法是1997年提出,是一种特殊的哈希算法,目的是解决分布式系统的数据分区问题:当分布式集群移除或者添加一个服务器时,必须尽可能小地改变已存在的服务请求与处理请求服务器之间的映射关系。2。2一致性哈希主要解决问题
  我们知道,传统的按服务器节点数量取模在集群扩容和收缩时存在一定的局限性。而一致性哈希算法正好解决了简单哈希算法在分布式集群中存在的动态伸缩的问题。降低节点上下线的过程中带来的数据迁移成本,同时节点数量的变化与分片原则对于应用系统来说是无感的,使上层应用更专注于领域内逻辑的编写,使得整个系统架构能够动态伸缩,更加灵活方便。2。3一致性哈希的使用场景
  一致性哈希算法是分布式系统中的重要算法,使用场景也非常广泛。主要是是负载均衡、缓存数据分区等场景。
  一致性哈希应该是实现负载均衡的首选算法,它的实现比较灵活,既可以在客户端实现,也可以在中间件上实现,比如日常使用较多的缓存中间件memcached使用的路由算法用的就是一致性哈希算法。
  此外,其它的应用场景还有很多:RPC框架Dubbo用来选择服务提供者分布式关系数据库分库分表:数据与节点的映射关系LVS负载均衡调度器
  三、一致性哈希的原理2。1算法原理
  前面介绍的取模算法虽然使用简单,但缺陷也很明显,如果服务器中保存有服务请求对应的数据,那么如果重新计算请求的哈希值,会造成缓存的雪崩的问题。这种情况在分布式系统中是非常糟糕的。一个设计良好的分布式系统应该具有良好的单调性,即服务器的添加与移除不会造成大量的哈希重定位,而一致性哈希恰好可以解决这个问题。
  其实,一致性哈希算法本质上也是一种取模算法。只不过前面介绍的取模算法是按服务器数量取模,而一致性哈希算法是对固定值232取模,这就使得一致性算法具备良好的单调性:不管集群中有多少个节点,只要key值固定,那所请求的服务器节点也同样是固定的。其算法的工作原理如下:一致性哈希算法将整个哈希值空间映射成一个虚拟的圆环,整个哈希空间的取值范围为02321;计算各服务器节点的哈希值,并映射到哈希环上;将服务发来的数据请求使用哈希算法算出对应的哈希值;将计算的哈希值映射到哈希环上,同时沿圆环顺时针方向查找,遇到的第一台服务器就是所对应的处理请求服务器。当增加或者删除一台服务器时,受影响的数据仅仅是新添加或删除的服务器到其环空间中前一台的服务器(也就是顺着逆时针方向遇到的第一台服务器)之间的数据,其他都不会受到影响。
  综上所述,一致性哈希算法对于节点的增减都只需重定位环空间中的一小部分数据,具有较好的容错性和可扩展性。
  2。2深入剖析
  说了那么多,可能你还是云里雾里的,那么接下来我们详细剖析一致性哈希的实现原理。2。2。1哈希环
  首先,一致性哈希算法将整个哈希值空间映射成一个虚拟的圆环。整个哈希空间的取值范围为02321,按顺时针方向开始从02321排列,最后的节点2321在0开始位置重合,形成一个虚拟的圆环。如下图所示:
  2。2。2服务器映射到哈希环
  接下来,将服务器节点映射到哈希环上对应的位置。我们可以对服务器IP地址进行哈希计算,哈希计算后的结果对232取模,结果一定是一个0到2321之间的整数。最后将这个整数映射在哈希环上,整数的值就代表了一个服务器节点的在哈希环上的位置。即:hash(服务器ip)232。下面我们依次将node0、node1、node2三个缓存服务器映射到哈希环上,如下图所示:
  2。2。3对象key映射到服务器
  当服务器接收到数据请求时,首先需要计算请求Key的哈希值;然后将计算的哈希值映射到哈希环上的具体位置;接下来,从这个位置沿着哈希环顺时针查找,遇到的第一个节点就是key对应的节点;最后,将请求发送到具体的服务器节点执行数据操作。
  假设我们有key01:张三、key02:李四、key03:王五三条缓存数据。经过哈希算法计算后,映射到哈希环上的位置如下图所示:
  如上图所示,通过哈希计算后,key01顺时针寻找将找到node0,key02顺时针寻找将找到node1,key03顺时针寻找将找到node2。最后,请求找到的服务器节点执行具体的业务操作。
  以上便是一致性哈希算法的工作原理。四、服务器扩容缩容
  前面介绍了一致性哈希算法的工作原理,那么,一致性哈希算法如何避免服务器动态伸缩的问题的呢?4。1服务器缩容
  服务器缩容就是减少集群中服务器节点的数量或是集群中某个节点的故障。假设,集群中的某个节点故障,原本映射到该节点的请求,会找到哈希环中的下一个节点,数据也同样被重新分配至下一个节点,其它节点的数据和请求不受任何影响。这样就确保节点发生故障时,集群能保持正常稳定。如下图所示:
  如上图所示:节点node2发生故障时,数据key01和key02不会受到影响,只有key03的请求被重定位到node0。在一致性哈希算法中,如果某个节点宕机不可用了,那么受影响的数据仅仅是会寻址到此节点和前一节点之间的数据。其他哈希环上的数据不会受到影响。4。2服务器扩容
  服务器扩容就是集群中需要增加一个新的数据节点,假设,由于需要缓存的数据量太大,必须对集群进行扩容增加一个新的数据节点。此时,只需要计算新节点的哈希值并将新的节点加入到哈希环中,然后将哈希环中从上一个节点到新节点的数据映射到新的数据节点即可。其他节点数据不受影响,具体如下图所示:
  如上图所示,加入新的node3节点后,key01、key02不受影响,只有key03的寻址被重定位到新节点node3,受影响的数据仅仅是会寻址到新节点和前一节点之间的数据。
  通过一致性哈希算法,集群扩容或缩容时,只需要重新定位哈希环空间内的一小部分数据。其他数据保持不变。当节点数越多的时候,使用哈希算法时,需要迁移的数据就越多,使用一致哈希时,需要迁移的数据就越少。所以,一致哈希算法具有较好的容错性和可扩展性。五、数据倾斜与虚拟节点5。1什么是数据倾斜?
  前面说了一致性哈希算法的原理以及扩容缩容的问题。但是,由于哈希计算的随机性,导致一致性哈希算法存在一个致命问题:数据倾斜,,也就是说大多数访问请求都会集中少量几个节点的情况。特别是节点太少的情况下,容易因为节点分布不均匀造成数据访问的冷热不均。这就失去了集群和负载均衡的意义。如下图所示:
  如上图所示,key1、key2、key3可能被映射到同一个节点node0上。导致node0负载过大,而node1和node2却很空闲的情况。这有可能导致个别服务器数据和请求压力过大和崩溃,进而引起集群的崩溃。5。2如何解决数据倾斜?
  为了解决数据倾斜的问题,一致性哈希算法引入了虚拟节点机制,即对每一个物理服务节点映射多个虚拟节点,将这些虚拟节点计算哈希值并映射到哈希环上,当请求找到某个虚拟节点后,将被重新映射到具体的物理节点。虚拟节点越多,哈希环上的节点就越多,数据分布就越均匀,从而避免了数据倾斜的问题。
  说起来可能比较复杂,一句话概括起来就是:原有的节点、数据定位的哈希算法不变,只是多了一步虚拟节点到实际节点的映射。具体如下图所示:
  如上图所示,我们可以在服务器ip或主机名的后面增加编号来实现,将全部的虚拟节点加入到哈希环中,增加了节点后,数据在哈希环上的分布就相对均匀了。当有访问请求寻址到node01这个虚拟节点时,将被重新映射到物理节点node0。六、一致性Hash算法实现
  前面介绍了一致性哈希算法的原理、动态伸缩以及数据倾斜的问题后,下面我们根据上面的讲述,使用Java实现一个简单的一致性哈希算法。6。1数据节点
  首先定义一个节点类,实现数据节点的功能,具体代码如下:publicclassNode{privatestaticfinalintVIRTUALNODENOPERNODE200;privatefinalSprivatefinalListIntegervirtualNodeHashesnewArrayList(VIRTUALNODENOPERNODE);privatefinalMapObject,ObjectcacheMapnewHashMap();publicNode(Stringip){Objects。requireNonNull(ip);this。initVirtualNodes();}privatevoidinitVirtualNodes(){StringvirtualNodeKfor(inti1;iVIRTUALNODENOPERNODE;i){virtualNodeKvirtualNodeHashes。add(HashUtils。hashcode(virtualNodeKey));}}publicvoidaddCacheItem(Objectkey,Objectvalue){cacheMap。put(key,value);}publicObjectgetCacheItem(Objectkey){returncacheMap。get(key);}publicvoidremoveCacheItem(Objectkey){cacheMap。remove(key);}publicListIntegergetVirtualNodeHashes(){returnvirtualNodeH}publicStringgetIp(){}}
  6。2实现一致性哈希算法
  接下来实现核心功能:一致性哈希算法,主要使用java的TreeMap类,实现哈希环和哈希查找的功能。具体代码如下所示:publicclassConsistentHash{privatefinalTreeMapInteger,NodehashRingnewTreeMap();publicListNodenodeListnewArrayList();增加节点每增加一个节点,就会在闭环上增加给定虚拟节点例如虚拟节点数是2,则每调用此方法一次,增加两个虚拟节点,这两个节点指向同一NodeparamippublicvoidaddNode(Stringip){Objects。requireNonNull(ip);NodenodenewNode(ip);nodeList。add(node);for(IntegervirtualNodeHash:node。getVirtualNodeHashes()){hashRing。put(virtualNodeHash,node);System。out。println(虚拟节点〔node〕hash:virtualNodeHash,被添加);}}移除节点paramnodepublicvoidremoveNode(Nodenode){nodeList。remove(node);}获取缓存数据先找到对应的虚拟节点,然后映射到物理节点paramkeyreturnpublicObjectget(Objectkey){NodenodefindMatchNode(key);System。out。println(获取到节点:node。getIp());returnnode。getCacheItem(key);}添加缓存先找到hash环上的节点,然后在对应的节点上添加数据缓存paramkeyparamvaluepublicvoidput(Objectkey,Objectvalue){NodenodefindMatchNode(key);node。addCacheItem(key,value);}删除缓存数据publicvoidevict(Objectkey){findMatchNode(key)。removeCacheItem(key);}获得一个最近的顺时针节点paramkey为给定键取Hash,取得顺时针方向上最近的一个虚拟节点对应的实际节点return节点对象returnprivateNodefindMatchNode(Objectkey){Map。EntryInteger,NodeentryhashRing。ceilingEntry(HashUtils。hashcode(key));if(entrynull){entryhashRing。firstEntry();}returnentry。getValue();}}
  如上所示,通过TreeMap的ceilingEntry()方法,实现顺时针查找下一个的服务器节点的功能。
  6。3哈希计算方法
  哈希计算方法比较常见,网上也有很多计算hash值的函数。示例代码如下:publicclassHashUtils{FNV132HASHparamobjobjectreturnhashcodepublicstaticinthashcode(Objectobj){finalintp16777619;inthash(int)2166136261L;Stringstrobj。toString();for(inti0;istr。length();i)hash(hashstr。charAt(i))p;hashhash13;hashhash7;hashhash3;hashhash17;hashhash5;if(hash0)hashMath。abs(hash);System。out。println(hashcomputer:hash);}}
  6。4验证测试
  一致性哈希算法实现后,接下来添加一个测试类,验证此算法时候正常。示例代码如下:publicclassConsistentHashTest{publicstaticfinalintNODESIZE10;publicstaticfinalintSTRINGCOUNT100100;privatestaticConsistentHashconsistentHashnewConsistentHash();privatestaticListStringsListnewArrayList();publicstaticvoidmain(String〔〕args){增加节点for(inti0;iNODESIZE;i){StringipnewStringBuilder(10。2。1。)。append(i)。toString();consistentHash。addNode(ip);}生成需要缓存的数据;for(inti0;iSTRINGCOUNT;i){sList。add(RandomStringUtils。randomAlphanumeric(10));}将数据放入到缓存中。for(Strings:sList){consistentHash。put(s,s);}for(inti0;i10;i){intindexRandomUtils。nextInt(0,STRINGCOUNT);StringkeysList。get(index);Stringcache(String)consistentHash。get(key);System。out。println(Random:index,key:key,consistentHashgetvalue:cache,valueis:key。equals(cache));}输出节点及数据分布情况for(Nodenode:consistentHash。nodeList){System。out。println(node);}新增一个数据节点consistentHash。addNode(10。2。1。110);for(inti0;i10;i){intindexRandomUtils。nextInt(0,STRINGCOUNT);StringkeysList。get(index);Stringcache(String)consistentHash。get(key);System。out。println(Random:index,key:key,consistentHashgetvalue:cache,valueis:key。equals(cache));}输出节点及数据分布情况for(Nodenode:consistentHash。nodeList){System。out。println(node);}}}
  运行此测试,输出结果如下所示:
  最后
  以上,我们就把一致性哈希算法的实现原理,应用场景、解决了哪些问题都介绍完了,并用java简单实现了一个一致性哈希算法。相信看完之后,大家对一致性哈希算法应该不会那么陌生害怕了吧。
投诉 评论

中国智能手机销量降至2012年以来的最低水平中国的智能手机销量下滑,第二季度中国销量恢复到2012年的水平当年三星推出GalaxySIII和苹果向世界推出iPhone5。CounterpointResearchMa……Netflix宣布爱死亡和机器人第三季今日上线并公布最终预告IT之家5月20日消息,网飞奈飞官方今日公布了《爱、死亡和机器人》。此外,Netflix还在其YouTube频道上免费发布了第3季的单集剧情,也就是第三季的终极预告。简单……图解一致性哈希算法,看这一篇就够了近段时间一直在总结分布式系统架构常见的算法。前面我们介绍过布隆过滤器算法。接下来介绍一个非常重要、也非常实用的算法:一致性哈希算法。通过介绍一致性哈希算法的原理并给出了一种实现……刘诗雯人生赢家!陪百亿富豪打球,为退役铺路,喜提150万豪车近段时间,国乒编外人员郭斌前往广东谈合作,和当地富豪夫妇刘志强、翟美卿聚会交流,刘志强、翟美卿夫妇可是有名的商人,资产雄厚达到百亿。刘诗雯作为国家队队员,同时也是广东队代表人物……成长是什么?你回望过去的自己,现在的你是什么样子,还是和以前一样吗?或许比以前更加的优秀?还是大不如以前?在小的时候一起的玩伴,一起述说着长大以后的梦想。在学生阶段,在学校里的……无人驾驶出租车上路了,可道路行为预测还任重道远最近几天,自动驾驶圈动静不小。4月25号,小马智行宣布中标广州市南沙区2022年出租车运力指标,成为国内首个获得出租车经营许可的自动驾驶公司。3天后,也就是28号,……所有人的祖先在这儿呢有史以来最大人类家谱建成所有人的祖先,在这儿呢有史以来最大人类家谱建成科技日报北京2月24日电(记者张梦然)英国牛津大学大数据研究所研究人员在绘制人类之间的全部遗传关系图方面迈出了重要的一……小鹏被踢出群聊,美团王兴又来指点江山?美团新能源汽车的火爆,直接带动了造车新势力的发展。其中,蔚来汽车、理想汽车以及小鹏汽车是最先一批上市的新势力,同时也有着不错的销量表现。因此被业界称之为蔚小理,也是不少人……正式出山!中国男篮名宿重返赛场,担任教练,帮助姚明打造未来随着CBA联赛对于球员要求越发严格,很多当打之年的球员都选择了退役,或者是转型成为教练员,转战其他国内联赛。孙悦作为CBA传奇老将,中国男篮功勋人物,在退役之后,选择隐退一年之……让我们一起读书有很多小朋友都不喜欢读书,可是我不一样,我爱读书,从很小开始,就跟书有着深厚的感情。从上幼儿园起,爸爸就买了许多书给我看,从图画书到现在的小说,我看过的书可多了,例如《西……太空PK2印度空间站vs中国空间站援引印度媒体《欧亚时报》报道,印度原子能和太空发展部长吉滕德拉辛格在议会上宣布,印度的第一个空间站将于2030年建成,而期待已久的印度载人航天计划加甘扬(Gaganyaan)于……13!中国队输球,被判2点球红牌进球被吹,球迷炮轰裁判黑哨U17国足迎来亚预赛小组赛的第三场较量,这场比赛可以说是生死战,对手是澳大利亚U17,双方在赛前都是6分,这场比赛争夺小组榜首。最终,国足13输给对手,小组排名第2,无缘直接出……
53个故事8句话罗振宇2022时间的朋友跨年演讲全文2021年12月31日20:30,五粮液成都金融城演艺中心,罗振宇时间的朋友跨年演讲如约而至。罗胖曾发下大愿望:跨年演讲要连办二十年。今年是第七场,也是最特殊的一场,罗胖……DOTA2虎牙冬邀IG吃败,面对狼小束手无策在前不久结束的虎牙冬邀的淘汰赛中,RNG成功淘汰了VG,IG和OB的胜利也开始了对决。本来打败RNG的OB只是侥幸取胜,却没想到IG选手在DPC东南亚联赛对这支可怜的OB队伍有……更加简洁?三星折叠屏手机采用全新命名方式近期,爆料人SnoopyTech便透露了一则关于三星下一代折叠屏手机的消息。据爆料表示,三星下一代折叠旗舰的命名,将不在使用Z字母,最终命名为GalaxyFold4和Galax……烟囱有一天我抬头寻觅诗意望见我房瓦上耸立的烟囱它轻藐的对我说你就没有注意到我的存在吗我听着它继续说我原谅了你的傲慢虽然我立于高处在你……摄影第183期单反的成像为何会倒过来?单反单反相机的光学系统关键是由一套复杂的光学元件组成的,光学系统的好坏直接决定了取景的效果和最终成像效果,所以单反相机所采用的系统是最为专业的反光系统。单反相机的光……拒绝勇士,降薪加盟湖人!为错误决定买单,嘴硬但你的行为很诚实对于任何一名NBA球员来讲,不管他们在联盟中打球的目的是为了金钱还是名利或是梦想什么的,总冠军都会是这些球员最一致的目标,有了冠军,其他东西都会是相辅相成的。有的球星会为了总冠……排列五22085期规律走势图千百十位记录,4月5号开奖个人记录。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。……沪媒广州队相关人士否认收到调节费只能寄希望年度分红直播吧7月13日讯据《东方体育日报》报道,目前面临资金困难的广州队,重回天河体育场的可能性已经不大,而且俱乐部也并未收到足协退换的引援调节费。缺乏国企支持的广州队,目前显……奥尼尔力挺巴克利言论杜兰特他是成年人,不需要你的保护布鲁克林篮网自季后赛首轮被淘汰后,球队核心凯文杜兰特似乎有了很多空闲时间。考虑到他刚刚打了一个累人的赛季,现在花些时间与球迷互动也就不足为奇了。杜兰特还利用闲暇时间回应了……盛夏疗养好伴侣,左点智能走罐器轻体验进入盛夏,炎热的天气经常会给身体带来各种不适。在酷热的太阳下中暑后我们习惯用刮痧的手法为身体舒筋通络、排湿、驱寒。虽然刮痧能给身体有效排毒,但是刮痧带来的痛觉也不是一般人可承受……定了!2022最新婚假产假育儿假标准近期,随着多地修改《人口计划与生育条例》,跟大家息息相关的产假、婚假、育儿假、陪产假都有所调整。比如上海生育假由30天延长到60天,女职工可有158天假期;浙江生育一孩延……中国经济大变局未来十年见真金世界上有2大谎言,大家都知道是假的,可依然选择相信,第一个谎言是砖石稀少,砖石的产量其实很高,只不过被资本垄断掌控,披上了真爱的袈裟,让无数情侣为之买单;还有一大谎言,更是荒谬……

友情链接:中准网聚热点快百科快传网快生活快软网快好知文好找