首页 > 编程语言 > springcloud之Feign、ribbon如何设置超时时间和重试机制
2022
03-17

springcloud之Feign、ribbon如何设置超时时间和重试机制

Feign、ribbon设置超时时间和重试机制

前言

我们在微服务调用服务的时候,会使用feign和ribbon,比如有一个实例发生了故障而该情况还没有被服务治理机制及时的发现和摘除,这时候客户端访问该节点的时候自然会失败。

所以,为了构建更为健壮的应用系统,我们希望当请求失败的时候能够有一定策略的重试机制,而不是直接返回失败。

先看一个配置:

#预加载配置,默认为懒加载
ribbon:
  eager-load:
    enabled: true
    clients: zoo-plus-email
 
zoo-plus-email:
  ribbon:
    # 代表Ribbon使用的负载均衡策略
    NFLoadBalancerRuleClassName: com.netflix.loadbalancer.RandomRule
    # 每台服务器最多重试次数,但是首次调用不包括在内
    MaxAutoRetries: 1
    # 最多重试多少台服务器
    MaxAutoRetriesNextServer: 1
    # 无论是请求超时或者socket read timeout都进行重试
    OkToRetryOnAllOperations: true
    ReadTimeout: 3000
    ConnectTimeout: 3000
 
hystrix:
  command:
    default:
      execution:
        isolation:
          thread:
            timeoutInMilliseconds: 4000

一般情况下 都是 ribbon 的超时时间(<)hystrix的超时时间(因为涉及到ribbon的重试机制)

Feign重试:

因为ribbon的重试机制和Feign的重试机制有冲突,所以源码中默认关闭Feign的重试机制,具体看一看源码

要开启Feign的重试机制如下:(Feign默认重试五次 源码中有)

@Bean
Retryer feignRetryer() {
        return  new Retryer.Default();
}

ribbon的重试机制 :

ribbon:
  ReadTimeout: 3000
  ConnectTimeout: 3000
  MaxAutoRetries: 1 #同一台实例最大重试次数,不包括首次调用
  MaxAutoRetriesNextServer: 1 #重试负载均衡其他的实例最大重试次数,不包括首次调用
  OkToRetryOnAllOperations: false  #是否所有操作都重试 

计算重试的次数:

MaxAutoRetries+MaxAutoRetriesNextServer+(MaxAutoRetries *MaxAutoRetriesNextServer) 

即重试3次 加上第一次调用一共产生4次调用 。

注意:如果在重试期间,时间超过了hystrix的超时时间,便会立即执行熔断,fallback。所以要根据上面配置的参数计算hystrix的超时时间,使得在重试期间不能达到hystrix的超时时间,不然重试机制就会没有意义 。

hystrix超时时间的计算:

(1 + MaxAutoRetries + MaxAutoRetriesNextServer) * ReadTimeout 

即按照以上的配置 hystrix的超时时间应该配置为 (1+1+1)*3=9秒

当ribbon超时后且hystrix没有超时,便会采取重试机制。当OkToRetryOnAllOperations设置为false时,只会对get请求进行重试。如果设置为true,便会对所有的请求进行重试,如果是put或post等写操作,如果服务器接口没做幂等性,会产生不好的结果,所以OkToRetryOnAllOperations慎用。

如果不配置ribbon的重试次数,默认会重试一次

注意: 默认情况下,GET方式请求无论是连接异常还是读取异常,都会进行重试 ,非GET方式请求,只有连接异常时,才会进行重试

Feign、Ribbon、Hystrix三者超时时间配置

Feign设置

feign:
  hystrix:
    enabled: true
  client:
    config:
      # 全局配置
      default:
        connectTimeout: 5000
        readTimeout: 5000  
      # 实例配置,feignName即@feignclient中的value,也就是服务名
      feignName:
        connectTimeout: 5000
        readTimeout: 5000

Ribbon设置

# 全局配置
ribbon:
# 单个服务最大重试次数,不包含对单个服务的第一次请求,默认0
MaxAutoRetries: 3
# 服务切换次数,不包含最初的服务,如果服务注册列表小于 nextServer count 那么会循环请求  A > B > A,默认1
MaxAutoRetriesNextServer: 2
#是否所有操作都进行重试,默认只重试get请求,如果修改为true,则需注意post\put等接口幂等性
OkToRetryOnAllOperations: false
#连接超时时间,单位为毫秒,默认2秒
ConnectTimeout: 3000
#读取的超时时间,单位为毫秒,默认5秒
ReadTimeout: 3000
# 实例配置
clientName:
 ribbon:
  MaxAutoRetries: 5
  MaxAutoRetriesNextServer: 3
  OkToRetryOnAllOperations: false
  ConnectTimeout: 3000
  ReadTimeout: 3000

Hystrix设置

hystrix:
 command:
   #全局默认配置
   default:
     #线程隔离相关
     execution:
       timeout:
         #是否给方法执行设置超时时间,默认为true。一般我们不要改。
         enabled: true
       isolation:
         #配置请求隔离的方式,这里是默认的线程池方式。还有一种信号量的方式semaphore。
         strategy: THREAD
         thread:
           #方式执行的超时时间,默认为1000毫秒,在实际场景中需要根据情况设置
           timeoutInMilliseconds: 10000
   # 实例配置
   HystrixCommandKey:
     execution:
       timeout:
         enabled: true
       isolation:
         strategy: THREAD
         thread:
           timeoutInMilliseconds: 10000

Feign重试和Ribbon重试

feign自身重试目前只有一个简单的实现Retryer.Default,包含三个属性:

  • maxAttempts:重试次数,包含第一次
  • period:重试初始间隔时间,单位毫秒
  • maxPeriod:重试最大间隔时间,单位毫秒

ribbon重试包含两个属性:MaxAutoRetries和MaxAutoRetriesNextServer

总重试次数= 访问的服务器数 * 单台服务器最大重试次数

即:(1+MaxAutoRetriesNextServer)*(1+MaxAutoRetries )

按上面实例的配置,则总重试次数 =(1+2)*(1+3) = 12

超时时间设置

feign和ribbon的超时时间只会有一个生效,规则:如果没有设置过feign超时,也就是等于默认值的时候,就会读取ribbon的配置,使用ribbon的超时时间和重试设置。否则使用feign自身的设置。两者是二选一的,且feign优先。

以Ribbon的时间生效为例,Hystrix的超时时间需大于Ribbon重试总和时间,否则重试将失效,即: Hystrix超时时间 > (Ribbon超时时间总和)*重试次数

按上面的例子,hystrix超时时间>12*(3000+3000)

以上为个人经验,希望能给大家一个参考,也希望大家多多支持自学编程网。

编程技巧