Golang实现的Doublejump - 改进版Google跳转一致性哈希算法

概述

doublejump 是 Google 跳转一致性哈希算法的改进版本。它克服了原始实现无法移除节点的缺点。

基准测试

BenchmarkDoubleJumpWithoutLock/10-nodes             50000000            27.6 ns/op
BenchmarkDoubleJumpWithoutLock/100-nodes            30000000            42.7 ns/op
BenchmarkDoubleJumpWithoutLock/1000-nodes           30000000            54.1 ns/op

BenchmarkDoubleJump/10-nodes                        20000000            72.9 ns/op
BenchmarkDoubleJump/100-nodes                       20000000            86.1 ns/op
BenchmarkDoubleJump/1000-nodes                      20000000            97.9 ns/op

BenchmarkStathatConsistent/10-nodes                  5000000           301 ns/op
BenchmarkStathatConsistent/100-nodes                 5000000           334 ns/op
BenchmarkStathatConsistent/1000-nodes                3000000           444 ns/op

BenchmarkSerialxHashring/10-nodes                    5000000           280 ns/op
BenchmarkSerialxHashring/100-nodes                   5000000           340 ns/op
BenchmarkSerialxHashring/1000-nodes                  3000000           427 ns/op

示例

h := NewHash()
for i := 0; i < 10; i++ {
    h.Add(fmt.Sprintf("node%d", i))
}

fmt.Println(h.Len())
fmt.Println(h.LooseLen())

fmt.Println(h.Get(1000))
fmt.Println(h.Get(2000))
fmt.Println(h.Get(3000))

h.Remove("node3")
fmt.Println(h.Len())
fmt.Println(h.LooseLen())

fmt.Println(h.Get(1000))
fmt.Println(h.Get(2000))
fmt.Println(h.Get(3000))

// 输出：
// 10
// 10
// node9
// node2
// node3
// 9
// 10
// node9
// node2
// node0

更多关于Golang实现的Doublejump - 改进版Google跳转一致性哈希算法的实战教程也可以访问 https://www.itying.com/category-94-b0.html

ionicwang 1楼

更多关于Golang实现的Doublejump - 改进版Google跳转一致性哈希算法的实战系列教程也可以访问 https://www.itying.com/category-94-b0.html

Doublejump是一个优秀的改进版一致性哈希实现，它确实解决了Google原始跳转哈希算法无法动态移除节点的问题。从你提供的基准测试数据来看，doublejump在性能上明显优于其他一致性哈希实现。

让我通过代码示例来展示doublejump的核心用法和实现细节：

package main

import (
    "fmt"
    "github.com/edwingeng/doublejump"
)

func main() {
    // 创建哈希环
    h := doublejump.NewHash()
    
    // 添加节点
    nodes := []string{"node0", "node1", "node2", "node3", "node4", "node5"}
    for _, node := range nodes {
        h.Add(node)
    }
    
    // 测试数据分布
    testKeys := []uint64{1000, 2000, 3000, 4000, 5000}
    fmt.Println("初始节点分布:")
    for _, key := range testKeys {
        node := h.Get(key)
        fmt.Printf("Key %d -> %s\n", key, node)
    }
    
    // 移除节点并观察重新分布
    fmt.Println("\n移除node2后的分布:")
    h.Remove("node2")
    for _, key := range testKeys {
        node := h.Get(key)
        fmt.Printf("Key %d -> %s\n", key, node)
    }
    
    // 获取哈希环统计信息
    fmt.Printf("\n当前节点数: %d\n", h.Len())
    fmt.Printf("松散节点数: %d\n", h.LooseLen())
}

doublejump的核心优势在于其高效的节点查找算法。以下是其内部工作原理的简化示例：

// 简化版doublejump算法原理
type Hash struct {
    nodes []string
}

func (h *Hash) Get(key uint64) string {
    if len(h.nodes) == 0 {
        return ""
    }
    
    // 使用跳转哈希算法选择节点
    b := int64(-1)
    j := int64(0)
    
    for j < int64(len(h.nodes)) {
        b = j
        key = key*2862933555777941757 + 1
        j = int64(float64(b+1) * (float64(1<<31) / float64((key>>33)+1)))
    }
    
    return h.nodes[b]
}

// 实际使用中建议使用官方库，这里只是算法原理展示

对于需要高并发访问的场景，doublejump提供了线程安全的版本：

package main

import (
    "fmt"
    "sync"
    "github.com/edwingeng/doublejump"
)

func concurrentAccess() {
    h := doublejump.NewHash()
    
    // 初始化节点
    for i := 0; i < 8; i++ {
        h.Add(fmt.Sprintf("shard-%d", i))
    }
    
    var wg sync.WaitGroup
    // 模拟并发访问
    for i := 0; i < 100; i++ {
        wg.Add(1)
        go func(workerID int) {
            defer wg.Done()
            for j := 0; j < 1000; j++ {
                key := uint64(workerID*1000 + j)
                node := h.Get(key)
                _ = node // 实际使用中会处理这个节点
            }
        }(i)
    }
    wg.Wait()
}

从基准测试结果可以看出，doublejump的无锁版本性能最佳（27.6-54.1 ns/op），即使线程安全版本也只需72.9-97.9 ns/op，远低于其他实现。这使得它特别适合需要高性能分布式路由的场景，如数据库分片、缓存集群负载均衡等。

doublejump通过改进的哈希算法在保持跳转哈希优秀分布特性的同时，提供了完整的动态节点管理能力，是一个生产级的一致性哈希解决方案。