Golang中如何复用Zlib的Reader和Writer

Golang中如何复用Zlib的Reader和Writer 你好，

我有超过1024个goroutine在运行，它们偶尔需要压缩和解压各自的私有数据。（通常这些操作会同时发生）

为了避免占用大量内存，我按如下方式实现了编码函数：通过使用互斥锁，我能够复用zlibWriter和encodeBuffer，这极大地减少了内存占用。

//全局变量
encodeBuffer = bytes.NewBuffer(nil)|
zlibWriter, _ = zlib.NewWriterLevelDict(encodeBuffer, zlib.BestSpeed, dict)|

func EncodeData(input []byte) []byte {
    encodeMutex.Lock()
    encodeBuffer.Reset()
    zlibWriter.Reset(encodeBuffer)
    zlibWriter.Write(input)
    zlibWriter.Flush()
    zlibWriter.Close()
    ret := bytes.Clone(encodeBuffer.Bytes())
    encodeMutex.Unlock()
    return ret
}

我正尝试为我的解码函数实现同样的复用。

//全局变量
decodeBuffer = bytes.NewBuffer(nil)

func DecodeData(buffer []byte) []byte {
    decodeMutex.Lock()
    decodeBuffer.Reset()
    zlibReader, _ := zlib.NewReaderDict(bytes.NewBuffer(buffer), dict)
    decodeBuffer.ReadFrom(zlibReader)
    zlibReader.Close()
    ret := bytes.Clone(decodeBuffer.Bytes())
    decodeMutex.Unlock()
    return ret
}

不幸的是，我不知道如何复用zlibReader。首先，它缺少一个Reset()函数。这甚至可能实现吗？

更多关于Golang中如何复用Zlib的Reader和Writer的实战教程也可以访问 https://www.itying.com/category-94-b0.html

bupafengyu 1楼

更多关于Golang中如何复用Zlib的Reader和Writer的实战系列教程也可以访问 https://www.itying.com/category-94-b0.html

在Go中复用zlib.Reader确实比复用zlib.Writer更复杂，因为它缺少Reset()方法。不过，可以通过zlib.NewReaderDict()配合io.MultiReader或自定义io.Reader来实现复用。以下是两种可行的解决方案：

方案1：使用`io.MultiReader`复用Reader

这种方法通过预创建zlib.Reader并重置其底层数据源来实现复用：

var (
    decodeMutex sync.Mutex
    decodeBuffer = bytes.NewBuffer(nil)
    zlibReader *zlib.Reader
    readerInit sync.Once
)

func initZlibReader() {
    // 使用空数据初始化Reader
    var err error
    zlibReader, err = zlib.NewReaderDict(bytes.NewReader(nil), dict)
    if err != nil {
        panic(err)
    }
}

func DecodeData(buffer []byte) ([]byte, error) {
    decodeMutex.Lock()
    defer decodeMutex.Unlock()
    
    readerInit.Do(initZlibReader)
    
    // 重置buffer
    decodeBuffer.Reset()
    
    // 创建新的数据源，复用现有的zlibReader
    dataReader := bytes.NewReader(buffer)
    
    // 重置Reader的内部状态
    if err := zlibReader.(zlib.Resetter).Reset(dataReader, dict); err != nil {
        return nil, err
    }
    
    // 读取解压数据
    if _, err := decodeBuffer.ReadFrom(zlibReader); err != nil {
        return nil, err
    }
    
    return bytes.Clone(decodeBuffer.Bytes()), nil
}

方案2：使用`Resetter`接口（Go 1.4+）

Go的zlib.Reader实现了Resetter接口，可以通过类型断言调用Reset()方法：

var (
    decodeMutex sync.Mutex
    decodeBuffer = bytes.NewBuffer(nil)
    zlibReader *zlib.Reader
)

func DecodeData(buffer []byte) ([]byte, error) {
    decodeMutex.Lock()
    defer decodeMutex.Unlock()
    
    decodeBuffer.Reset()
    
    if zlibReader == nil {
        // 首次创建Reader
        var err error
        zlibReader, err = zlib.NewReaderDict(bytes.NewReader(buffer), dict)
        if err != nil {
            return nil, err
        }
    } else {
        // 复用现有的Reader
        resetter, ok := zlibReader.(zlib.Resetter)
        if !ok {
            return nil, errors.New("reader does not implement Resetter")
        }
        
        // 重置Reader以读取新数据
        if err := resetter.Reset(bytes.NewReader(buffer), dict); err != nil {
            return nil, err
        }
    }
    
    // 读取解压数据
    if _, err := decodeBuffer.ReadFrom(zlibReader); err != nil {
        return nil, err
    }
    
    return bytes.Clone(decodeBuffer.Bytes()), nil
}

方案3：使用sync.Pool管理Reader池

对于高并发场景，使用sync.Pool可以进一步优化性能：

var (
    decodeBufferPool = sync.Pool{
        New: func() interface{} {
            return bytes.NewBuffer(nil)
        },
    }
    zlibReaderPool = sync.Pool{
        New: func() interface{} {
            r, _ := zlib.NewReaderDict(bytes.NewReader(nil), dict)
            return r
        },
    }
)

func DecodeData(buffer []byte) ([]byte, error) {
    // 从池中获取buffer和reader
    decodeBuffer := decodeBufferPool.Get().(*bytes.Buffer)
    zlibReader := zlibReaderPool.Get().(*zlib.Reader)
    
    defer func() {
        // 重置并放回池中
        decodeBuffer.Reset()
        decodeBufferPool.Put(decodeBuffer)
        zlibReaderPool.Put(zlibReader)
    }()
    
    // 重置Reader
    if err := zlibReader.(zlib.Resetter).Reset(bytes.NewReader(buffer), dict); err != nil {
        return nil, err
    }
    
    // 读取解压数据
    if _, err := decodeBuffer.ReadFrom(zlibReader); err != nil {
        return nil, err
    }
    
    return bytes.Clone(decodeBuffer.Bytes()), nil
}

注意事项

错误处理：实际使用中需要添加适当的错误处理，特别是Reset()和ReadFrom()可能返回错误
并发安全：方案1和2使用互斥锁确保线程安全，方案3的sync.Pool本身是并发安全的
内存管理：bytes.Clone()会创建新的字节切片，确保返回的数据不会在后续操作中被修改
性能测试：在高并发场景下，建议对不同方案进行基准测试以选择最优方案

这些方案都能有效复用zlib.Reader，减少内存分配和垃圾回收压力。方案3的sync.Pool实现通常在高并发场景下性能最佳。

Golang中如何复用Zlib的Reader和Writer

方案1：使用io.MultiReader复用Reader

方案2：使用Resetter接口（Go 1.4+）

方案3：使用sync.Pool管理Reader池

注意事项

方案1：使用`io.MultiReader`复用Reader

方案2：使用`Resetter`接口（Go 1.4+）