iis服务器助手广告广告
返回顶部
首页 > 资讯 > 后端开发 > Python >spring cloud eureka注册原理-注册失败填坑笔记
  • 821
分享到

spring cloud eureka注册原理-注册失败填坑笔记

2024-04-02 19:04:59 821人浏览 薄情痞子

Python 官方文档:入门教程 => 点击学习

摘要

目录写在前面Eureka Client注册过程分析遗留问题写在前面 我们知道Eureka分为两部分,Eureka Server和Eureka Client。Eureka Server

写在前面

我们知道Eureka分为两部分,Eureka Server和Eureka Client。Eureka Server充当注册中心的角色,Eureka Client相对于Eureka Server来说是客户端,需要将自身信息注册到注册中心。

本文主要介绍的就是在Eureka Client注册到Eureka Server时RetryableClientQuarantineRefreshPercentage参数的使用技巧。

Eureka Client注册过程分析

Eureka Client注册到Eureka Server时,首先遇到第一个问题就是Eureka Client端要知道Server的地址,这个参数对应的是eureka.client.service-url.defaultZone举个例子,在Eureka Client的properties文件中配置如下:

eureka.client.service-url.defaultZone=
Http://localhost:8761/eureka,http://localhost:8762/eureka,http://localhost:8763/eureka,http://localhost:8764/eureka

如上所示,Eureka Client配置对应的Eureka Server地址分别是8761、8762、8763、8764。这里存在两个问题:

  • Eureka Client会将自身信息分别注册到这四个地址吗?
  • Eureka Clinent注册机制是怎样的?

源码面前一目了然,带着这两个问题我们通过源码来解答这两个问题。Eureka Client在启动的时候注册源码如下:

RetryableEurekaHttpClient中的execut方法

@Override
  protected <R> EurekaHttpResponse<R> execute(RequestExecutor<R> requestExecutor) {
      List<EurekaEndpoint> candidateHosts = null;
      int endpointIdx = 0;
      for (int retry = 0; retry < numberOfRetries; retry++) {
          EurekaHttpClient currentHttpClient = delegate.get();
          EurekaEndpoint currentEndpoint = null;
          if (currentHttpClient == null) {
              if (candidateHosts == null) {
                  candidateHosts = getHostCandidates();
                  if (candidateHosts.isEmpty()) {
                      throw new TransportException("There is no known eureka server; cluster server list is empty");
                  }
              }
              if (endpointIdx >= candidateHosts.size()) {
                  throw new TransportException("Cannot execute request on any known server");
              }
              currentEndpoint = candidateHosts.get(endpointIdx++);
              currentHttpClient = clientFactory.newClient(currentEndpoint);
          }
          try {
              EurekaHttpResponse<R> response = requestExecutor.execute(currentHttpClient);
              if (serverStatusEvaluator.accept(response.getStatusCode(), requestExecutor.getRequestType())) {
                  delegate.set(currentHttpClient);
                  if (retry > 0) {
                      logger.info("Request execution succeeded on retry #{}", retry);
                  }
                  return response;
              }
              logger.warn("Request execution failure with status code {}; retrying on another server if available", response.getStatusCode());
          } catch (Exception e) {
              logger.warn("Request execution failed with message: {}", e.getMessage());  // just log message as the underlying client should log the stacktrace
          }
          // Connection error or 5xx from the server that must be retried on another server
          delegate.compareAndSet(currentHttpClient, null);
          if (currentEndpoint != null) {
              quarantineSet.add(currentEndpoint);
          }
      }
      throw new TransportException("Retry limit reached; giving up on completing the request");
  }

按照我的理解,代码精简后内容如下:

int endpointIdx = 0;
//用来保存所有Eureka Server信息(8761、8762、8763、8764)
List<EurekaEndpoint> candidateHosts = null;
//numberOfRetries的值代码写死默认为3次
for (int retry = 0; retry < numberOfRetries; retry++) {
    
    if (candidateHosts == null) {
        candidateHosts = getHostCandidates();
    }
    
    currentEndpoint = candidateHosts.get(endpointIdx++);
    currentHttpClient = clientFactory.newClient(currentEndpoint);
    try {
       
        response = requestExecutor.execute(currentHttpClient);
        return respones;
    } catch (Exception e) {
        //向注册中心(Eureka Server)发起注册的post出现异常时,打印日志...
    }
    //如果此次注册动作失败,将当前的信息保存到quarantineSet中(一个Set集合)
    if (currentEndpoint != null) {
        quarantineSet.add(currentEndpoint);
    }
}
//如果都失败,则以异常形式抛出...
throw new TransportException("Retry limit reached; giving up on completing the request");

上面代码中还有一个方法很重要就是List<EurekaEndpoint> candidateHosts = getHostCandidates();接下来看下getHostCandidates()方法源码 

    private List<EurekaEndpoint> getHostCandidates() {
        List<EurekaEndpoint> candidateHosts = clusterResolver.getClusterEndpoints();
        quarantineSet.retainAll(candidateHosts);
        // If enough hosts are bad, we have no choice but start over again
        int threshold = (int) (candidateHosts.size() * transportConfig.getRetryableClientQuarantineRefreshPercentage());
        if (quarantineSet.isEmpty()) {
            // no-op
        } else if (quarantineSet.size() >= threshold) {
            logger.debug("Clearing quarantined list of size {}", quarantineSet.size());
            quarantineSet.clear();
        } else {
            List<EurekaEndpoint> remainingHosts = new ArrayList<>(candidateHosts.size());
            for (EurekaEndpoint endpoint : candidateHosts) {
                if (!quarantineSet.contains(endpoint)) {
                    remainingHosts.add(endpoint);
                }
            }
            candidateHosts = remainingHosts;
        }
        return candidateHosts;
    }

按照我的理解,将代码精简下,只包括关键逻辑,内容如下:

private List<EurekaEndpoint> getHostCandidates() {
    
    List candidateHosts = clusterResolver.getClusterEndpoints();
    
    quarantineSet.retainAll(candidateHosts);
    
    int threshold = 
       (int) (
        candidateHosts.size()
              *
        transportConfig.getRetryableClientQuarantineRefreshPercentage()
        );
    if (quarantineSet.isEmpty()) {
        
    } else if (quarantineSet.size() >= threshold) {
        
        quarantineSet.clear();
    } else {
        
        List<EurekaEndpoint> remainingHosts = new ArrayList<>(candidateHosts.size());
        for (EurekaEndpoint endpoint : candidateHosts) {
            if (!quarantineSet.contains(endpoint)) {
                remainingHosts.add(endpoint);
            }
        }
        candidateHosts = remainingHosts;
    }
    return candidateHosts;
}

通过源码分析,我们现在初步知道,当Eureka Client向Eureka Server发起注册请求的时候(根据defaultZone寻找Eureka Server列表),如果有一次请求注册成功,那么后续就不会在向其他Eureka Server发起注册请求。以本文为例,注册中心有四个(8761、8762、8763、8764)。如果8761对应的Eureka Server服务的状态是UP,那么Eureka Client向该注册中心注册成功后,不会再向(8762、8763、8764)对应的Eureka Server发起注册请求(对应程序是在for循环中直接return respones)。

说到这里又引出来另外一个问题,如果8761这个Eureka Server是down掉的呢?

根据源码我们可知Eureka Client首次会向8761这个Server发起注册请求,如果该Server的状态是down,那么它会将该Server保存到quarantineSet这个Set集合中,然后再次访问8762这个Eureka Server,如果8762这个Server的状态依旧是down,它也会把这个Server保存到quarantineSet这个Set集合中,然后继续访问8763这个Server,如果8763这个Server的状态依旧是down,此时除了会将其保存到quarantineSet这个Set集合中之外,还会跳出本次循环。从而结束此次注册过程。

道这里有人要问接下来会不会向8764这个Server发起注册,答案是否定的,因为循环的次数默认是3次。所以即使8764这个Server的状态是UP,它也不会接收到来自Eureka Client发起的注册信息。

Eureka Client向Eureka Server发起注册信息的过程除了在Eureka Client启动的时候触发,还有另外一种方式,就是后台定时任务。

假设我们上面描述的场景是在Eureka Client启动的时候,因为在启动的时候注册这个过程全部失败了,当后台定时任务执行时,还会进入该注册流程。注意此时quarantineSet的值为3(8761、8762、8763之前注册失败的Eureka Server)。

所以当程序再次进入getHostCandidates()方法时,if (quarantineSet.isEmpty())这个方法是不满足的,接下来会走else if (quarantineSet.size() >= threshold)这个判断,如果这个判断成立,那么会将quarantineSet集合清空,同时返回全量的Eureka Server列表,如果这个判断不成立,会拿quarantineSet集合中保存的内容去过滤Eureka Server的全量列表。以本文为例:

  • quarantineSet中保存的是(8761、8762、8763)三个Eureka Server
  • Eureka Server全量列表的内容是(8761、8762、8763、8764)四个Eureka Server过滤后返回的结果为8764这个Eureka Server。

在本文的例子中8761、8762、8763这三个Eureka Server的状态是down而8764这个Eureka Server的状态是UP,我们其实是想走到最后的else分支,从而完成过滤操作,并最终得到8764这个Server,遗憾的是它并不会走到这个分支,而是被上面的else if (quarantineSet.size() >= threshold)这个分支所拦截,返回的依旧是全量的Eureka Server列表。这样造成的后果就是Eureka Client依旧会依次向(8761、8762、8763)这三个down的Eureka Server发起注册请求。

那么问题的关键在哪里呢?问题的关键就是threshold这个值的由来,因为此时quarantineSet.size()的值为3,而3这个值大于threshold,从而导致,会将quarantineSet集合清空,返回全量的Server列表。  

我们知道threshold这个值是根据全量的Eureka Server列表乘以一个可配置的参数计算出来的,在本文的例子当中,我的properties文件中除了defaultZone之外并没有配置这个参数,那么也就是说这个参数是有默认值的,通过源码我们了解到,这个默认值是0.66。具体源码如下:

final class PropertyBasedTransportConfiGConstants {
    
    static class Values {
        static final int SESSION_RECONNECT_INTERVAL = 20*60;
        //默认值为0.66
        static final double QUARANTINE_REFRESH_PERCENTAGE = 0.66;
        static final int DATA_STALENESS_TRHESHOLD = 5*60;
        static final int ASYNC_RESOLVER_REFRESH_INTERVAL = 5*60*1000;
        static final int ASYNC_RESOLVER_WARMUP_TIMEOUT = 5000;
        static final int ASYNC_EXECUTOR_THREADPOOL_SIZE = 5;
    }
}

double getRetryableClientQuarantineRefreshPercentage();

看到这里就不难理解了,因为这个值是0.66而此时全量的Eureka Server值为4。计算之后的值为2,而由于注册的for循环为3次,所以当第二次发起注册流程的时候quarantineSet的值始终大于threshold。这样就会导致一个问题,就是如果8761、8762、8763一直是down即使8764一直是好的,那么Eureka Client也不会注册成功。而且这个参数值的区间为0到1.

既然通过源码分析我们找到了问题根源,其实对应的我们也找到了解决这个问题的办法,就是对应把这个参数值调大些。这个值在properties中对应的写法如下:

eureka.client.transport.retryableClientQuarantineRefreshPercentage = xxx

接下来我们修改下properties文件,修改后的内容如下:

eureka.client.service-url.defaultZone=
http://localhost:8761/eureka,http://localhost:8762/eureka,http://localhost:8763/eureka,http://localhost:8764/eureka
eureka.client.transport.retryableClientQuarantineRefreshPercentage=1
eureka.client.service-url.defaultZone=
http://localhost:8761/eureka,http://localhost:8762/eureka,http://localhost:8763/eureka,http://localhost:8764/eureka
eureka.client.transport.retryableClientQuarantineRefreshPercentage=1

接下来按照这个配置再次回顾下上面的流程:

  • Eureka Client启动时进行注册(8761、8762、8763的状态是down),所以此时quarantineSet的值为3.
  • 接下来在定时任务中又触发注册事件,此时因为参数的值从0.66调整为1。所以计算出的threshold的值为4。而此时quarantineSet的值为3。所以不会进入到else if (quarantineSet.size() >= threshold)分支,而是会进入最后的esle分支。
  • 在else分支中会完成过滤功能,最终返回的list中的结果只有一个就是8764这个Eureka Server。
  • Eureka Client向8764这个Eureka Server发起注册请求,得到成功相应,并返回。

遗留问题

说道这里我们感觉好像是解决了这个问题,那么问一个问题,这个参数值可以设置的无限大吗?

比如我将这个参数值设置为10,虽然javaDoc中说明这个参数值的范围在0-1之间,但是并没有说明如果将这个参数调整大于1会出现什么情况。接下来按照上面的流程我们分析下:

之前我们分析的流程中的前提是8761、8762、8763这三台Server的状态是down而8764这个server的状态是up,现在我们修改下这个前提。

假设一开始8761、8762、8763、8764这四台Eureka Server的状态都是down。

Eureka Client启动时进行注册(8761、8762、8763的状态是down),所以此时quarantineSet的值为3.

  • 接下来在定时任务中又触发注册事件,此时因为参数的值从0.66调整为10。所以计算出的threshold的值为40。而此时quarantineSet的值为3。所以不会进入到else if (quarantineSet.size() >= threshold)分支,而是会进入最后的esle分支。
  • 在else分支中会完成过滤功能,最终返回的list中的结果只有一个就是8764这个Eureka Server。
  • Eureka Client向8764这个Eureka Server发起注册请求,因为此时8764的状态也是down导致注册失败,此时quarantineSet中的内容是(8761、8762、8763、8764)
  • 当定时任务再次触发时if (quarantineSet.isEmpty())这个分支不会进入,因为此时quarantineSet的值为4else if (quarantineSet.size() >= threshold)这分支也不会进入因为threshold的值为40
  • 最终会进入else分支,这个分支原本的含义是想通过quarantineSet来充当过滤器,从全量的Eureka Server中过滤掉之前状态为down的Eureka Server,但是由于quarantineSet的值现在已经是全量,导致过滤后的结果返回的是一个空的list。即使此时Eureka Server列表(8761、8762、8763、8764)任何一个Server的状态变为UP,该Eureka Client也不可能完成注册事件。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持编程网。

--结束END--

本文标题: spring cloud eureka注册原理-注册失败填坑笔记

本文链接: https://www.lsjlt.com/news/148172.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
  • spring cloud eureka注册原理-注册失败填坑笔记
    目录写在前面Eureka Client注册过程分析遗留问题写在前面 我们知道Eureka分为两部分,Eureka Server和Eureka Client。Eureka Server...
    99+
    2024-04-02
  • 怎么用Spring Cloud的Eureka实现服务注册
    今天小编给大家分享一下怎么用Spring Cloud的Eureka实现服务注册的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有...
    99+
    2024-04-02
  • Spring Cloud Eureka 注册与发现操作步骤详解
    目录一、注册中心二、服务提供者三、服务消费者在搭建Spring Cloud Eureka环境前先要了解整个架构的组成,常用的基础模式如下图: 服务提供者:将springboot...
    99+
    2024-04-02
  • Spring Cloud Eureka服务注册中心入门流程分析
    目录项目搭建客户端注册聚合层处理Eureka架构集群搭建多区域配置自我保护开关心跳机制Eureka实例信息存储项目地址在学习Ribbon使用的时候,我们是直接在配置文件中写死服务地址...
    99+
    2024-04-02
  • Spring Cloud中服务注册与发现Eureka的示例分析
    这篇文章将为大家详细讲解有关Spring Cloud中服务注册与发现Eureka的示例分析,小编觉得挺实用的,因此分享给大家做个参考,希望大家阅读完这篇文章后可以有所收获。一、spring cloud简介spring cloud 为开发人员...
    99+
    2023-06-19
  • Spring Cloud Eureka:注册中心揭秘,服务发现的利器
    Spring Cloud Eureka 是一个服务发现框架,用于在分布式系统中管理和发现服务。它在微服务架构中扮演着至关重要的角色,提供了一种机制,使服务能够互相识别并与之通信。 Eureka 的架构 Eureka 采用客户端-服务器架...
    99+
    2024-03-07
    Spring Cloud Eureka 注册中心 服务发现 微服务
  • 域名注册失败什么原因
    域名注册的会失败原因:1.付款失败引起注册失败;2.内容违反国家法规;3.被其他注册商抢先一步。域名注册失败的原因有:在注册时付款失败,从而导致注册失败。注册的域名不规范或者是商标保护域名等高级域名,从而导致注册失败。注册的域名违反 《中国...
    99+
    2024-04-02
  • 腾讯云服务器域名注册失败原因
    腾讯云服务器域名注册失败的原因可能有很多,以下是一些可能的原因: 配置错误:服务器上的配置可能被误操作或者恶意篡改。建议您备份服务器的配置,重新安装服务器的驱动程序,更新服务器的软件包,并进行必要的配置和安全设置。 服务不可用:如果您访...
    99+
    2023-10-26
    腾讯 域名注册 原因
  • Spring Cloud中如何使用Eureka集群搭建高可用服务注册中心
    今天就跟大家聊聊有关Spring Cloud中如何使用Eureka集群搭建高可用服务注册中心,可能很多人都不太了解,为了让大家更加了解,小编给大家总结了以下内容,希望大家根据这篇文章可以有所收获。这一篇主要介绍一下如何搭建一个高可用的 Eu...
    99+
    2023-06-04
  • Spring Cloud | 实现Eureka Server 高可用服务注册中心全套解决方案
    目录 1、在搭建Eureka Server,配置高可用服务注册中心,配置3个Eureka Server:2、因为是在本地实现的话,需要在localhost加入三个服务,需要改变etc/host...
    99+
    2023-10-23
    java spring spring cloud eureka 微服务
  • php连接数据库注册和登录失败原因
    PHP连接数据库注册和登录失败原因PHP是一种流行的开源脚本语言,可用于创建动态网站和应用程序。数据库是包含重要信息的重要组件,因此,PHP连接数据库是Web开发中必不可少的部分。在开发流程中,注册和登录是最基本的功能。然而,有时候这些功能...
    99+
    2023-05-14
    php
  • 腾讯云服务器域名注册失败原因分析
    腾讯云服务器域名注册失败的原因可能有很多,以下是一些可能的原因: 数据库连接超时:当您输入的数据库连接尝试连接失败后,连接会被停止,您的数据将无法加载到服务器中。请检查数据库连接的超时时间设置,并尝试在规定的时间内重新尝试连接; DNS...
    99+
    2023-10-26
    腾讯 域名注册 原因
  • 亚马逊邮件服务器注册失败原因分析
    账户信息错误:检查注册时所提供的用户名、密码、邮箱地址、验证码等信息是否正确。 邮件服务器故障:邮件服务器可能已经宕机或不可用,这可能是由于邮件服务器配置不当、垃圾邮件过多、服务器维护等原因导致的。 邮件内容有误:检查邮件内容是否符合用户...
    99+
    2023-10-27
    亚马逊 邮件服务器 原因
  • 亚马逊注册登录云服务器失败什么原因
    1. 亚马逊注册登录云服务器失败的可能原因 在使用亚马逊云服务器(Amazon Web Services,AWS)时,可能会遇到注册登录失败的情况。以下是一些可能的原因: 1.1 无效的凭证或访问密钥 在注册登录AWS时,您需要提供有效的...
    99+
    2023-10-27
    亚马逊 原因 服务器
  • 腾讯云服务器域名注册失败原因有哪些
    腾讯云服务器域名注册失败的原因可能有很多,以下是一些常见的原因: 服务器配置错误:服务器配置错误也可能导致域名无法解析,请联系腾讯云提供商解决问题。 服务器硬件故障:服务器硬件故障也可能导致域名无法解析,请联系腾讯云提供商协助解决问题。...
    99+
    2023-10-26
    腾讯 域名注册 原因
  • 腾讯云服务器域名注册失败原因是什么
    腾讯云服务器域名注册失败的原因可能有很多,以下是一些可能的原因: 证书错误:请确保您的腾讯云服务器域名已获得了一个有效的证书,因为证书可能已过期或被遗失。 配置错误:您的腾讯云服务器域名可能被配置为不存在或者不正确,导致无法注册或者访问...
    99+
    2023-10-26
    腾讯 域名注册 原因
  • 腾讯云服务器域名注册失败原因分析报告
    一、域名失败原因的分类 域名注册失败 域名注册失败通常是指注册商或服务商在注册域名时出现问题,导致域名无法正常解析或者无法正常使用。 常见的域名失败原因包括域名未指向服务器、域名已被他人抢注、域名解析异常、域名未续费等。 域名解析失...
    99+
    2023-10-28
    腾讯 域名注册 分析报告
  • 腾讯云服务器域名注册失败原因有哪些呢
    首先,如果服务器域名注册失败,用户无法访问网站,无法获取所需的信息或者服务。在这种情况下,用户可以考虑采取以下措施: 重新注册域名 如果服务器域名注册失败,用户可以考虑重新注册一个新的域名。但是,重新注册域名可能会带来一些风险,例如可...
    99+
    2023-10-28
    腾讯 域名注册 原因
  • 腾讯云服务器域名注册失败原因有哪些问题
    域名未被占用 当服务器域名未被占用时,服务器将会自动解析该域名并返回相应的页面。但是,如果用户在注册域名时未设置有效的DNS服务器地址,那么域名将无法正常解析,导致无法访问网站。 解决方法:可以通过设置有效的DNS服务器地址来解决这个...
    99+
    2023-10-28
    腾讯 域名注册 原因
  • php连接数据库注册和登录失败的原因有哪些
    今天小编给大家分享一下php连接数据库注册和登录失败的原因有哪些的相关知识点,内容详细,逻辑清晰,相信大部分人都还太了解这方面的知识,所以分享这篇文章给大家参考一下,希望大家阅读完这篇文章后有所收获,下面我们一起来了解一下吧。PHP连接数据...
    99+
    2023-07-05
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作