百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术资源 > 正文

解决Snowflake算法时钟回拨的一种方案

lipiwang 2025-06-15 17:22 2 浏览 0 评论




01 算法介绍


Snowflake是Twitter开源的分布式ID生成算法,结果是一个19位的Long型的ID。其核心思想是:使用41bit作为毫秒数,10bit作为机器的ID,12bit作为毫秒内的流水号(即每个节点在每毫秒可以产生 4096 个 ID),最后还有一个符号位,永远是0。

布局如下图所示:

二进制字符串位(64位):

0101111001101110110111100011011101011110000000000000000000000000

该算法的优缺点在网上很容易找到。

优点:

1、整体呈递增趋势

2、不依赖第三方系统,稳定性更高

3、可以根据自身业务特性分配bit位

缺点:

1、严重依赖时钟


Snowflake算法使用时间戳,个人认为是由于时间戳为全局整体呈递增趋势,在防重上区别性比较大,同时方便获取。


02 方案介绍



今天我主要介绍的是一种时间回拨时的解决方案:


回到snowflake算法结构,仔细分析会发现:

1、10位的workId属于自定义

2、12位的顺序号主要是高并发

3、41位的时间戳本质为时间的差值,并非一定要求为当前时间。比如:System.currentTimeMillis(), 其实质为当前时间距离1970-01-01的时间差值的毫秒数。


实质上时间戳位置也可以是当前时间 - 基线时间(timeEpoch)计算之后的时间差值。而解决时间回拨的问题,入手点便在当前时间。虽然申明为当前时间,其实际上可以为任意一个大于基线时间的时间,只要保证随着时间推移,整体递增,且全局唯一。


比如41位的时间戳的值为:

41位的时间戳 = 当前基础时间 - 基线时间。

当前基础时间 = 当前系统时间 - 时钟回拨缓冲时间(比如1年 = 365 * 24 * 3600 * 1000L)。

上一次访问时间 = 上一次访问的基础时间。

上一次访问时间 大于 当前基础时间 ,表示系统时间已经回拨。

此时通过调整时钟回拨缓冲时间,修复当前基础时间

时钟回拨调整的幅度 = 上一次访问时间 - 发生时钟回拨之后的系统时间

当前基础时间 = 当前系统时间 -( 时间回拨缓冲时间 - 时钟回拨调整的幅度 )


修复示例图:

注意:

1、方案中的的“上一次访问时间”需要在当前节点持久化至文件或者可持久化的位置

2、可修复的差值 = 上一次访问时间 - 发生时钟回拨之后的系统时间

从图中示例可以看出,正常情况下,“时钟回拨缓存时间”为365天,如果发生时钟回拨1天,可修复的差值 = 1,“时钟回拨缓存时间”调整为364(天) = 365(天) - 1(天)


如果时间回拨缓存时间等于1年时,就表示系统运行时,时间回拨最大的时间为1年。


反馈问题:

1、我为什么自定义基线时间即时间纪元。

经过测试,我发现时间差值在2000年左右才可以保证生成的ID为整数,如果超过则会产生负数,我修改时间纪元,主要为了延长使用的时间


2、上述时钟缓存时间为什么是1年

时钟缓存时间可以自定义,1年只是我当前的使用值

代码如下:

// 获取snowflake算法计算之后的值
public synchronized long getId() {
        long timestamp = currentBaseTime();
        if (timestamp < lastTimestamp) {
            long offset = lastTimestamp - timestamp;
            //毫秒级的时间倒退,直接等待
            if (offset <= 5) {
                try {
                    wait(offset << 1);
                } catch (Exception ex) {
                    logger.error("wait={} 异常", offset);
                }
            } else {
                //超过5ms的时间倒退,则直接修复
                this.fixStepMills = offset;
            }
            timestamp = currentBaseTime();
            //此处为两次校验,提高准确性
            if (timestamp < lastTimestamp) {
                this.fixStepMills = lastTimestamp - timestamp;
                timestamp = currentBaseTime();
            }
        }
        //最后的时间戳与当前时间相等
        if (lastTimestamp == timestamp) {
            sequence = (sequence + 1) & sequenceMask;
            if (sequence == 0) {
                sequence = random.nextInt(100);
                timestamp = tilNextTimestamp(lastTimestamp);
            }
        } else {
            sequence = random.nextInt(100);
        }
        this.lastTimestamp = timestamp;
        return (timestamp - timeEpoch) << timestampShift | workId << workIdShift | sequence;
}


//获取当前基础时间
private long currentBaseTime() {
        // baseBackupMills:时间回拨缓冲时间
        // fixStepMills:待修复的时间,即时钟回拨的时间差值
        long baseTimeEpoch = baseBackupMills - fixStepMills;
        if (baseTimeEpoch <= 0) {
            throw new IllegalArgumentException("time back to long");
        }
        LocalDateTime currentTime = getCurrentTime();
        if (Objects.isNull(currentTime)) {
            currentTime = LocalDateTime.now();
        }
        return currentTime.minusSeconds(baseTimeEpoch / 1000).atZone(ZoneId.systemDefault()).toInstant().toEpochMilli();
}

相关推荐

软件测试|MySQL CROSS JOIN:交叉连接的详细解析

简介在MySQL数据库中,CROSSJOIN是一种用于生成两个或多个表的笛卡尔积的连接方法。CROSSJOIN不需要任何连接条件,它将左表的每一行与右表的每一行进行组合,从而生成一个包含所...

「MySQL笔记」left join-on-and 与 left join-on-where 的区别

1.摘要关于这两种写法的重要知识点摘要如下:left-join时,即使有相同的查询条件,二者的查询结果集也不同,原因是优先级导致的,on的优先级比where高on-and是进行韦恩运算连接...

MySQL中的JOIN——联合查询的基本语法

MySQL中的JOIN指令用来将两个或多个表中的数据进行联合查询,根据连接条件来匹配记录,从而得到需要的结果集。在MySQL中,常见的JOIN类型包括INNERJOIN、LEFTJOIN和RIGH...

MySQL 中的 CROSS JOIN:强大的连接工具

CROSSJOIN在MySQL里是一种挺特别的连接操作,它能弄出连接表的笛卡尔积。这就是说,要是表A有m行,表B有n行,那ACROSSJOINB的结果就会有m*n...

大厂必问:MySQL 三表 JOIN 操作的解析与性能优化,效率又如何?

大厂必问:MySQL三表JOIN操作的解析与性能优化策略,效率又如何?点击关注,开启技术之旅!大家好,这里是互联网技术学堂,无论你是一名程序员、设计师、还是对技术充满好奇心的普通人,都欢迎你加入...

面试题:MySQL 的 JOIN 查询优化(mysql查询优化方法)

MySQL的JOIN查询优化是提升数据库性能的关键环节。以下是综合多个技术文档的核心优化策略,按优先级和实现难度分类:一、索引优化:性能提升的基础为连接字段建立索引确保参与JOIN的列(通常...

Flink中处理维表关联技术实现路径

在Flink中处理维表关联大体氛围TableSQLLookupJoin和DataStream算子函数,主要技术实现路径:I.FlinkSQL/TableAPI中的Lookup...

深入剖析Zookeeper原理(一)整体设计

1.ZK集群架构设计与特性1.ZK集群架构设计:ZK主要分为三种角色:Leader(领导者):一个Zookeeper集群同一时间只会有一个实际工作的Leader,它会发起并维护与各Follwer及...

多种负载均衡算法及其Java代码实现

首先给大家介绍下什么是负载均衡负载均衡建立在现有网络结构之上,它提供了一种廉价有效透明的方法扩展网络设备和服务器的带宽、增加吞吐量、加强网络数据处理能力、提高网络的灵活性和可用性。负载均衡,英...

一分钟了解SpringCloud中的ribbon到底是什么,原理是啥?

1.概念ribbon是一款客户端负载均衡器,用于微服务之间的负载均衡。首先,什么是客户端负载均衡?如图,ribbon可以通过注册中心获取服务列表,然后自己执行自己的负载均衡策略来决定要访问哪个微服务,...

Step by Step之腾讯云短信-验证码实践

在商城小程序和前端上线用了一阵子之后,用户提出了体验提升的需求,如忘记密码、绑定用户、快捷注册等,作为业界最佳实践的短信验证码登录、重置密码和注册等功能开发也就提上日程了,本文就以重置密码为例,将验证...

10分钟入门响应式:Springboot整合kafka实现reactive

Springboot引入Reactor已经有一段时间了,笔者潜伏在各种技术群里暗中观察发现,好像scala圈子的同仁们,似乎对响应式更热衷一点。也许是因为他们对fp理解的更深吧,所以领悟起来障碍性更少...

使用java随机生成有个性的用户名,LOL地名+水浒传,合计2808个

*随机生成用户名*取水浒传108好汉名字*取LOL地名26个,组合而成*一共可以生成2808个不同特色的用户名如果你在上网的时候,用户名难取的话,这里有很多可选择的用户名,现提供100个...

深入理解Math.random()的概率分布特性

直接上源码/***Returnsa{@codedouble}valuewithapositivesign,*返回一个带符号的double类型的数字,说人话就是返回一个非负...

编程英文 - 创建/生成/构建 (create/generate/build)

在软件开发中,create、generate和build这三个词经常被用到,它们都与"创造"或"产生"某些东西有关,但在具体使用场景和含义上有所不同。基本含义creat...

取消回复欢迎 发表评论: