




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
面试官:为什么需要Hystrix?为什么需要hystrixHystrix官网地址Github:/Netflix/Hystrix/Hystrix同样是netfix公司在分布式系统中的贡献。同样的也进入的不维护阶段。不维护不代表被淘汰。只能说明推陈出新技术在不断迭代。曾今的辉煌曾经的设计还是值得我们去学习的。在分布式环境中,服务调度是特色也是头疼的一块。在服务治理章节我们介绍了服务治理的功能。前一课我们也介绍了ribbon、feign进行服务调用。现在自然的到了服务监控管理了。hystrix就是对服务进行隔离保护。以实现服务不会出现连带故障。导致整个系统不可用hystrix对服务进行隔离保护如上图所示,当多个客户端进行服务调用Aservice时,而在分布式系统中Aservice存在三台服务,其中Aservice某些逻辑需要Bservice处理。Bservice在分布式系统中部署了两台服务。这个时候因为网络问题导致Aservice中有一台和Bservice的通信异常。如果Bservice是做日志处理的。在整个系统看来日志丢了和系统宕机比起来应该无所谓了。但是这个时候因为网络通信问题导致Aservice整个服务不可用了。有点得不尝试。系统雪崩在看上图。A-->B-->C-->D。此时D服务宕机了。C因为D宕机出现处理异常。但是C的线程却还在为B响应。这样随着并发请求进来时,C服务线程池出现爆满导致CPU上涨。在这个时候C服务的其他业务也会受到CPU上涨的影响导致响应变慢。特色功能Hystrix是一个低延迟和容错的第三方组件库。旨在隔离远程系统、服务和第三方库的访问点。官网上已经停止维护并推荐使用resilience4j:/resilience4j/resilience4j。
但是国内的话我们有springcloudalibaba。Hystrix通过隔离服务之间的访问来实现分布式系统中延迟及容错机制来解决服务雪崩场景并且基于hystrix可以提供备选方案(fallback)。对网络延迟及故障进行容错阻断分布式系统雪崩快速失败并平缓恢复服务降级实时监控、警报上面试官网给出的一个统计。在30台服务中每台出现异常的概览是0.01%。一亿个请求就会有300000失败。这样换算下每个月至少有2小时停机。这对于互联网系统来说是致命的。服务雪崩的场景上图是官网给出的两种情况。和我们上章节的类似。都是介绍服务雪崩的场景。项目准备在openfeign专题中我们就探讨了基于feign实现的服务熔断当时说了内部就是基于hystrix。当时我们也看了pom内部的结构在eureka中内置ribbon的同时也内置了hystrix模块。引入hystrix虽然包里面包含了hystrix。我们还是引入对应的start开启相关配置吧。这里其实就是在openfeign专题中的列子。在那个专题我们提供了PaymentServiceFallbackImpl、PaymentServiceFallbackFactoryImpl两个类作为备选方案。不过当时我们只需指出openfeign支持设置两种方式的备选方案。今天我们
org.springframework.cloud
spring-cloud-starter-netflix-hystrix
演示下传统企业没有备选方案的情况会发生什么灾难。openfeign使用接口调用接口测试首先我们对payment#createByOrder接口进行测试。查看下响应情况接口响应情况在测试payment#getTimeout/id方法。postman接口调用jmeter压测tomcat最大线程数测试spring中默认的tomcat的最大线程数是200.为了保护我们辛苦的笔记本。这里我们将线程数设置小点。这样我们更容易复现线程被打满的情况。线程满了就会影响到payment#createByOrder接口。现在我们用jmeter来压测payment#getTimeOut/id这个接口。一位需要4S等待会照成资源消耗殆尽问题。这个时候我们的payment#createByOrder也会被阻塞。上面我们压测的是payment的原生接口。如果压测的是order模块。如果没有在openfeign中配置fallback。那么order服务就会因为payment#getTimeOut/id接口并发导致线程满了从而导致order模块响应缓慢。这就是雪崩效应。下面我们从两个方面来解决雪崩的发生。业务隔离上面的场景发生是因为payment#createByOrder和payment#getTimeOut/id同属于payment服务。一个payment服务实际上就是一个Tomcat服务。同一个tomcat服务是有一个线程池的。每次请求落到该tomcat服务里就会去线程池中申请线程。获取到线程了才能由线程来处理请求的业务。就是因为tomcat内共享线程池。所以当payment#getTimeOut/id并发上来后就会抢空线程池。导致别的借口甚至是毫不相关的接口都没有资源可以申请。只能干巴巴的等待资源的释放。这就好比上班高峰期乘坐电梯因为某一个公司集中上班导致一段时间电梯全部被使用了。这时候国家领导过来也没办法上电梯。我们也知道这种情况很好解决。每个园区都会有专用电梯供特殊使用。我们解决上述问题也是同样的思路。进行隔离。不同的接口有不同的线程池。这样就不会造成雪崩。线程隔离线程隔离还记得我们上面为了演示并发将order模块的最大线程数设置为10.这里我们通过测试工具调用下order/getpayment/1这个接口看看日志打印情况接口日志我们接口调用的地方将当前线程打印出来。我们可以看到一只都是那10个线程在来回的使用。这也是上面为什么会造成雪崩现象。搜索公众号顶级架构师后台回复“offer”,获取一份惊喜礼包。 @HystrixCommand(
groupKey="order-service-getPaymentInfo",
commandKey="getPaymentInfo",
threadPoolKey="orderServicePaymentInfo",
commandProperties={
@HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="1000")
},
threadPoolProperties={
@HystrixProperty(name="coreSize",value="6"),
@HystrixProperty(name="maxQueueSize",value="100"),
@HystrixProperty(name="keepAliveTimeMinutes",value="2"),
@HystrixProperty(name="queueSizeRejectionThreshold",value="100")
},
fallbackMethod="getPaymentInfoFallback"
)
@RequestMapping(value="/getpayment/{id}",method=RequestMethod.GET)
publicResultInfogetPaymentInfo(@PathVariable("id")Longid){
(Thread.currentThread().getName());
returnrestTemplate.getForObject(PAYMENT_URL+"/payment/get/"+id,ResultInfo.class);
}
publicResultInfogetPaymentInfoFallback(@PathVariable("id")Longid){
("已经进入备选方案了,下面交由自由线程执行"+Thread.currentThread().getName());
returnnewResultInfo();
}
@HystrixCommand(
groupKey="order-service-getpaymentTimeout",
commandKey="getpaymentTimeout",
threadPoolKey="orderServicegetpaymentTimeout",
commandProperties={
@HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="10000")
},
threadPoolProperties={
@HystrixProperty(name="coreSize",value="3"),
@HystrixProperty(name="maxQueueSize",value="100"),
@HystrixProperty(name="keepAliveTimeMinutes",value="2"),
@HystrixProperty(name="queueSizeRejectionThreshold",value="100")
}
)
@RequestMapping(value="/getpaymentTimeout/{id}",method=RequestMethod.GET)
publicResultInfogetpaymentTimeout(@PathVariable("id")Longid){
(Thread.currentThread().getName());
returnorderPaymentService.getTimeOut(id);
}这里演示效果不好展示,我就直接展示数据吧。如果我们将hystrix加载payment原生服务就不会出现上面第三条情况。为什么我会放在order上就是想让大家看看雪崩的场景。在并发50的时候因为payment设置的最大线程也是10,他本身也是有吞吐量的。在order#getpyament/id接口虽然在order模块因为hystrix线程隔离有自己的线程运行,但是因为原生服务不给力导致自己调用超时从而影响运行的效果。这样演示也是为了后续引出fallback解决雪崩的一次场景模拟吧。我们可以在payment服务中通过hystrix设置fallback。保证payment服务低延迟从而保证order模块不会因为payment自己缓慢导致order#getpayment这种正常接口异常。还有一点虽然通过hystrix进行线程隔离了。但是我们在运行其他接口时响应时间也会稍长点。因为CPU在进行线程切换的时候是有开销的。这一点也是痛点。我们并不能随心所欲的进行线程隔离的。这就引出我们的信号量隔离了。信号量隔离关于信号量隔离这里也就不演示了。演示的意义不是很大@HystrixCommand(
commandProperties={
@HystrixProperty(name="execution.isolation.thread.timeoutInMilliseconds",value="1000"),
@HystrixProperty(name=HystrixPropertiesManager.EXECUTION_ISOLATION_STRATEGY,value="SEMAPHORE"),
@HystrixProperty(name=HystrixPropertiesManager.EXECUTION_ISOLATION_SEMAPHORE_MAX_CONCURRENT_REQUESTS,value="6")
},
fallbackMethod="getPaymentInfoFallback"
)我们如上配置表示信号量最大为6。表示并发6之后就会进行等待。等待超时时间未1s。除了线程隔离、信号量隔离等隔离手段我们可以通过请求合并、接口数据缓存等手段加强稳定性。服务降级触发条件程序发生除HystrixBadRequestException异常。服务调用超时服务熔断线程池、信号量不够timeout在上面我们的timeout接口。不管是线程隔离还是信号量隔离在条件满足的时候就会直接拒绝后续请求。这样太粗暴了。上面我们也提到了fallback。还记的上面我们order50个并发的timeout的时候会导致getpayment接口异常,当时定位了是因为原生payment服务压力撑不住导致的。如果我们在payment上加入fallback就能保证在资源不足的时候也能快速响应。这样至少能保证order#getpayment方法的可用性。配置fallback但是这种配置属于实验性配置。在真实生产中我们不可能在每个方法上配置fallback的。这样愚蠢至极。hystrix除了在方法上特殊定制的fallback以外,还有一个全局的fallback。只需要在类上通过@DefaultProperties(defaultFallback="globalFallback")来实现全局的备选方案。一个方法满足触发降级的条件时如果该请求对应的HystrixCommand注解中没有配置fallback则使用所在类的全局fallback。如果全局也没有则抛出异常。不足虽然DefaultProperties
可以避免每个接口都配置fallback。但是这种的全局好像还不是全局的fallback。我们还是需要每个类上配置fallback。笔者查阅了资料好像也没有但是在openfeign专题里我们说了openfeign结合hystrix实现的服务降级功能。还记的里面提到了一个FallbackFactory这个类吗。这个类可以理解成spring的BeanFactory。这个类是用来产生我们所需要的FallBack的。我们在这个工厂里可以生成一个通用类型的fallback的代理对象。代理对象可以根据代理方法的方法签名进行入参和出参。这样我们可以在所有的openfeign地方配置这个工厂类。这样的话就避免的生成很多个fallback。美中不足的还是需要每个地方都指定一下。关于FallBackFactory感兴趣的可以下载源码查看或者进主页查看openfeign专题。服务熔断@HystrixCommand(
commandProperties={
@HystrixProperty(name="circuitBreaker.enabled",value="true"),//是否开启断路器
@HystrixProperty(name="circuitBreaker.requestVolumeThreshold",value="10"),//请求次数
@HystrixProperty(name="circuitBreaker.sleepWindowInMilliseconds",value="10000"),//时间范围
@HystrixProperty(name="circuitBreaker.errorThresholdPercentage",value="60"),//失败率达到多少后跳闸
},
fallbackMethod="getInfoFallback"
)
@RequestMapping(value="/get",method=RequestMethod.GET)
publicResultInfoget(@RequestParamLongid){
if(id<0){
inti=1/0;
}
(Thread.currentThread().getName());
returnorderPaymentService.get(id);
}
publicResultInfogetInfoFallback(@RequestParamLongid){
returnnewResultInfo();
}首先我们通过circuitBreaker.enabled=true开启熔断器circuitBreaker.requestVolumeThreshold设置统计请求次数circuitBreaker.sleepWindowInMilliseconds
设置时间滑动单位,在触发熔断后多久进行尝试开放,及俗称的半开状态circuitBreaker.errorThresholdPercentage
设置触发熔断开关的临界条件上面的配置如果最近的10次请求错误率达到60%,则触发熔断降级,在10S内都处于熔断状态服务进行降级。10S后半开尝试获取服务最新状态下面我们通过jmeter进行接口http://localhost/order/get?id=-1进行20次测试。虽然这20次无一例额外都会报错。但是我们会发现一开始报错是因为我们代码里的错误。后面的错误就是hystrix熔断的错误了。一开始试byzero错误、后面就是short-circuitedandfallbackfailed熔断错误了jmeter压测正常我们在hystrix中会配置fallback,关于fallback两种方式我们上面降级章节已经实现了。这里是为了方便看到错误的不同特意放开了。HystrixCommand中配置的参数在HystrixCommand中配置的参数基本都是在HystrixPropertiesManager对象中。我们可以看到关于熔断器的配置有6个参数。基本就是我们上面的四个配置服务限流服务降级我们上面提到的两种隔离就是实现限流的策略。请求合并除了熔断、降级、限流意外hystrix还为我们提供了请求合并。顾名思义就是将多个请求合并成一个请求已达到降低并发的问题。比如说我们order有个接个是查询当个订单信息order/getId?id=1
突然有一万个请求过来。为了缓解压力我们集中一下请求每100个请求调用一次order/getIds?ids=xxxxx
。这样我们最终到payment模块则是10000/100=100个请求。下面我们通过代码配置实现下请求合并。HystrixCollapser@Target({ElementType.METHOD})
@Retention(RetentionPolicy.RUNTIME)
@Documented
public@interfaceHystrixCollapser{
StringcollapserKey()default"";
StringbatchMethod();
Scopescope()defaultScope.REQUEST;
HystrixProperty[]collapserProperties()default{};
}HystrixPropertiesManager在Hystrix中所有的properties配置都会在HystrixPropertiesManager.java中。我们在里面可以找到Collapser只有两个相关的配置。分别表示最大请求数和统计时间单元。搜索公众号后端架构师后台回复“架构整洁”,获取一份惊喜礼包。 @HystrixCollapser(
scope=flix.hystrix.HystrixCollapser.Scope.GLOBAL,
batchMethod="getIds",
collapserProperties={
@HystrixProperty(name=HystrixPropertiesManager.MAX_REQUESTS_IN_BATCH,value="3"),
@HystrixProperty(name=HystrixPropertiesManager.TIMER_DELAY_IN_MILLISECONDS,value="10")
}
)
@RequestMapping(value="/getId",method=RequestMethod.GET)
publicResultInfogetId(@RequestParamLongid){
if(id<0){
inti=1/0;
}
(Thread.currentThread().getName());
returnnull;
}
@HystrixCommand
publicListgetIds(Listids){
System.out.println(ids.size()+"@@@@@@@@@");
returnorderPaymentService.getIds(ids);
}上面我们配置了getId会走getIds请求,最多是10S三个请求会合并在一起。然后getIds有payment服务在分别去查询最终返回多个ResultInfo。通过jemeter进行getId接口压测我们通过jemeter进行getId接口压测,日志中ids的长度最大是3。验证了我们上面getId接口的配置。这样就能保证在出现高并发的时候会进行接口合并降低TPS。上面我们是通过请求方法注解进行接口合并处理。实际上内部hystrix是通过HystrixCommand工作流程Hystrix官网给出的流程图官网给出的流程图示,并配备流程说明一共是9部。下面我们就翻译下。①、创建HystrixCommand或者HystrixObservableCommand对象HystrixCommand:用在依赖单个服务上HystrixObservableCommand:用在依赖多个服务上②、命令执行,hystrrixCommand执行execute、queue;hystrixObservableCommand执行observe、toObservable③、查看缓存是否开启及是否命中缓存,命中则返回缓存响应④、是否熔断,如果已经熔断则fallback降级;如果熔断器是关闭的则放行⑤、线程池、信号量是否有资源供使用。如果没有足够资源则fallback。有则放行⑥、执行run或者construct方法。这两个是hystrix原生的方法,java实现hystrix会实现两个方法的逻辑,springcloud已经帮我们封装了。这里就不看这两个方法了。如果执行错误或者超时则fallback。在此期间会将日志采集到监控中心。⑦、计算熔断器数据,判断是否需要尝试放行;这里统计的数据会在hystrix.stream的dashboard中查看到。方便我们定位接口健康状态⑧、在流程图中我们也能看到④、⑤、⑥都会指向fallback。也是我们俗称的服务降级。可见服务降级是hystrix热门业务啊。⑨、返回响应HystrixDashboardhystrix除了服务熔断、降级、限流以外,还有一个重要的特性是实时监控。并形成报表统计接口请求信息。关于hystrix的安装也很简单,只需要在项目中配置actutor和hystrix-dashboard两个模块就行了
org.springframework.cloud
spring-cloud-starter-netflix-hystrix-dashboard
org.springframework.boot
spring-boot-starter-actuator
启动类上添加EnableHystrixDashboard
就引入了dashboard了。我们不需要进行任何开发。这个和eureka一样主需要简单的引包就可以了。hystrixdashboard就这样dashboard搭建完成了。dashboard主要是用来监控hystrix的请求处理的。所以我们还需要在hystrix请求出将端点暴露出来。在使用了hystrix命令的模块加入如下配置即可,我就在order模块加入@Component
publicclassHystrixConfig{
@Bean
publicServletRegistrationBeangetServlet(){
HystrixMetricsStreamServletstreamServlet=newHystrixMetricsStreamServlet();
ServletRegistrationBeanregistrationBean=newServletRegistrationBean(streamServlet);
registrationBean.setLoadOnStartup(1);
//注意这里配置的/hystrix.stream最终访问地址就是localhost:port/hystrix.stream;如果在配置文件中配置在新版本中是需要
//加上actuator即localhost:port/actuator
registrationBean.addUrlMappings("/hystrix.stream");
registrationBean.setName("HystrixMetricsStreamServlet");
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 五年级上册数学教案 第3课时 小数的性质 苏教版
- 2025年中国X剂量率报警仪项目投资可行性研究报告
- 2025年中国PP-B直通市场调查研究报告
- 高血压护理10分钟小讲课
- 2025年中国EPE轧花片数据监测报告
- 校园急救知识
- 冬季七防培训课件范本
- 站立的扑克牌说课
- 2025-2031年中国鱼片行业市场供需格局及投资规划建议报告
- 中班防踩踏安全教案课件
- 2024年南阳农业职业学院单招职业技能测试题库及解析答案
- 2025年中国电信山东分公司招聘笔试参考题库含答案解析
- 中国糖尿病防治指南(2024版)解读-1
- 2024年计算机二级WPS考试题库(共380题含答案)
- 汉字的奥秘探索
- 2023河南专升本英语真题及答案
- 项目EPC总承包工程施工技术总体规划及重难点分析
- 《办公场所用电安全》课件
- 第十三届全国交通运输行业城市轨道交通列车司机(学生组)职业技能大赛技术方案
- 同煤集团巷道支护理论计算设计方法(初稿)
- 2024综合基础知识考试题库及解析(146题)
评论
0/150
提交评论