Golang Go语言中如何用 Go 语言解析 word 文档(doc, docx)?
Golang Go语言中如何用 Go 语言解析 word 文档(doc, docx)?
没有找到能用的库,RT
github 搜了一下,比如 https://github.com/unidoc/unioffice,符合要求吗
更多关于Golang Go语言中如何用 Go 语言解析 word 文档(doc, docx)?的实战系列教程也可以访问 https://www.itying.com/category-94-b0.html
go 是挺猛啊,,操作 excel 、word 的库都有了,,看起来还挺完善
这库你们用过没, 刚才折腾了一番要去他官网注册弄 license,注册完只有一个生成 api key 的按钮,兜兜转转代码也没跑起来气死我了.
有没有更简洁的库推荐呢
简洁的功能怕就不是太多
https://github.com/nguyenthenguyen/docx
如果技术栈里有 python 的话,上 python 吧
推荐使用 Java docx4j 。golang 的这个库我们原来也用现在重构了用 Java 写
推荐 java 的 xdoc
可以看看 github 的这个库 bobiverse/docxplate
在Go语言中解析Word文档(无论是.doc
还是.docx
格式),通常需要使用第三方库,因为标准库并不直接支持这一功能。以下是针对这两种格式分别推荐的库及简要使用方法:
-
解析
.docx
文档:- 推荐使用
github.com/unidoc/unioffice
库。该库功能强大,支持读写.docx
文档。 - 安装方法:
go get -u github.com/unidoc/unioffice
- 示例代码:
package main import ( "fmt" "log" "github.com/unidoc/unioffice/document" ) func main() { file := "example.docx" doc, err := document.Open(file) if err != nil { log.Fatal(err) } for _, para := range doc.Paragraphs() { fmt.Println(para.Text()) } }
- 推荐使用
-
解析
.doc
文档:- 对于
.doc
格式,可以使用github.com/go-ole/go-ole
和github.com/unidoc/com
等库结合COM接口来操作Word应用程序,但这通常只在Windows平台上有效。 - 由于
.doc
格式较为老旧且复杂,直接解析不如.docx
方便,建议尽可能将文档转换为.docx
格式处理。
- 对于
总之,处理.docx
文档推荐使用unioffice
库,而.doc
文档则建议转换为.docx
后再进行解析。根据具体需求选择合适的库和方法。