PDFMathTranslate:科学 PDF 文件翻译及双语对照工具

发布于:2025-05-15 ⋅ 阅读:(18) ⋅ 点赞:(0)

PDFMathTranslate:科学 PDF 文件翻译及双语对照工具

在科研和学习过程中,我们经常会遇到大量的英文 PDF 文献,翻译这些文献成为了一项繁琐且耗时的工作。PDFMathTranslate 是一款强大的科学 PDF 文件翻译及双语对照工具,它能够保留公式、图表、目录和注释,支持多种语言和诸多翻译服务,还提供了命令行工具、图形用户界面以及容器化部署等多种使用方式。本文将详细介绍 PDFMathTranslate 的功能、安装方法和使用教程。

一、功能特点

  1. 保留关键元素:能够保留 PDF 文件中的公式、图表、目录和注释,确保翻译后的文档格式完整。
  2. 多语言支持:支持多种语言的翻译,满足不同用户的需求。
  3. 多种翻译服务:集成了多种翻译服务,如 Google、Bing、DeepL 等,用户可以根据自己的需求选择合适的翻译服务。
  4. 多种使用方式:提供命令行工具、图形用户界面和容器化部署等多种使用方式,方便不同场景下的使用。

二、安装方法

PDFMathTranslate 提供了多种安装方法,用户可以根据自己的需求选择合适的安装方式。

1. UV 安装

# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 uv 工具
pip install uv
# 使用 uv 工具安装 pdf2zh
uv tool install --python 3.12 pdf2zh

2. Windows exe 安装

发布页面 下载 pdf2zh-version-win64.zip,解压缩并双击 pdf2zh.exe 运行。

3. 图形用户界面 (GUI) 安装

# 安装 Python (3.10 <= 版本 <= 3.12)
# 安装 pdf2zh 包
pip install pdf2zh
# 在浏览器中开始使用
pdf2zh -i

如果浏览器没有自动启动,请访问 http://localhost:7860/

4. Docker 安装

# 拉取 Docker 镜像
docker pull byaidu/pdf2zh
# 运行 Docker 容器
docker run -d -p 7860:7860 byaidu/pdf2zh

在浏览器中打开 http://localhost:7860/

对于云服务上的 Docker 部署,还提供了多种一键部署的链接:

三、使用教程

1. 命令行工具使用

# 执行翻译,文件生成在当前工作目录
pdf2zh document.pdf

2. 图形用户界面使用

打开浏览器,访问 http://localhost:7860/,在界面中上传需要翻译的 PDF 文件,选择翻译服务和目标语言,点击翻译按钮即可开始翻译。

3. 高级使用选项

选项 功能 示例
-f, -c 异常 pdf2zh example.pdf -f "(MS.*)"
-cp 兼容模式 pdf2zh example.pdf --compatible
--share 公开链接 pdf2zh -i --share
--authorized 授权 pdf2zh -i --authorized users.txt [auth.html]
--prompt 自定义提示 pdf2zh --prompt [prompt.txt]
--onnx [使用自定义 DocLayout-YOLO ONNX 模型] pdf2zh --onnx [onnx/model/path]
--serverport [使用自定义 WebUI 端口] pdf2zh --serverport 7860
--dir [批量翻译] pdf2zh --dir /path/to/translate/
--config 配置文件 pdf2zh --config /path/to/config/config.json

4. 无法安装时的解决方案

  • Python API:可以在其他 Python 程序中使用该程序,详细信息请参考 Python API 文档
  • HTTP API:可以与已安装该程序的服务器进行通信,详细信息请参考 HTTP API 文档

四、待办事项

项目还有一些待办事项,如使用基于 DocLayNet 的模型解析布局、修复页面旋转和目录格式、支持非 PDF/A 文件等,感兴趣的开发者可以参与项目的开发。

五、致谢

Immersive Translation 为此项目的活跃贡献者提供每月的专业会员兑换码,详细信息请查看 CONTRIBUTOR_REWARD.md

六、总结

PDFMathTranslate 是一款功能强大、使用方便的科学 PDF 文件翻译及双语对照工具,它提供了多种安装和使用方式,能够满足不同用户的需求。无论是科研人员、学生还是其他需要翻译 PDF 文献的用户,都可以尝试使用 PDFMathTranslate 来提高翻译效率。


网站公告

今日签到

点亮在社区的每一天
去签到