首页 > AI教程资讯

终于等到不怕PDF排版乱码的翻译AI了。

文章来源:08ai导航网发布时间:2025-08-13 09:22:40

你见过一个翻译软件,

能把一个pdf的文字、表格、公式都翻译出来,还保持原本的排版吗?

每一次看 deepseek、mcp 这些论文时,

铺天盖地的英文,看得我就脑壳疼。

也用过一些AI翻译,但大多都是一段一段的或者排版是错乱的,我需要仔细分辨对应的语句,也就是说,我脑子里还是做了一遍翻译,实际上花的时间也没少。

那今天就要和大家隆重介绍,能够精准翻译并排版的

BabelDOC

Github 全站全开发语言 Trending 榜登上了第三名,同期的第一名第二名是微软的 markitdown mcp 和 Meta 的 Llama 大语言模型。

感受到这个含金量了吧!

话不多说,我们来具体看几个case:

比如说,我先给了一个32页论文,这种包含了很多排版方式的论文首页,BabelDOC 几乎都能1:1复刻一下来,甚至就连引用文献的数字角标都保持了下来。

仔细看,下方这里引用和标注的位置,虽然中间那条横线不见了,但是位置和字号还有小角标都很保持住了,我截取了文章中多处引用位置,都很完美。

在看一些学术论文时,里面经常会插入很多公式,翻译一遇到这种东西,简直就是噩梦,基本上乱码无疑。

比如这个页面,满屏的公式、图片还有带颜色的文本框,可以说是地狱级难度,BabelDOC 就是能轻轻松松的复制下来,让他们在该在的位置,有着该有的颜色。

再有就是表格啊、页眉页码啊,这些排版都能翻译并复刻下来:

接下来,我们玩个难一点的,

搞一个排版很复杂的,带有很多色块,文字大小和位置花样很多的英文PDF,看看 BabelDOC 还能不能保持。

真的很神,复杂排版也不在话下。

色块、文字,logo都能一一对应上,原文的设计全部重现。

美中不足的是,一旦英文变成特殊字体就没办法翻译出来,

但好在可以直接无痛导出中英文对照版pdf,因为排版位置一一对应上,直接就能对比原文来看翻译,省时省力。

还要提一句,即使我上传的是几百页的文章,

BabelDOC 都能稳定翻译输出,而且用时很短,一百多页的文章,几分钟就翻译好了。

所以,BabelDOC 为什么能有这样的性能呢?

当一个程序打开 PDF 文档时,我们可以大致把打开的过程想象为下图的流程:

为了做好翻译和排版复原,BabelDOC PDF 在上述流程中增加了几个关键步骤

抵达页面树后,引入了「 AI 布局识别」技术,辨认文本的布局、段落结构,以及一些复杂的内容排版情况,例如图片、表格和数学公式,并「记忆」下来。

2.识别完成后,提取文本并交给大模型进行翻译

3.最后,把翻译好的文字和第一步识别记录下来的排版情况进行比对,智能匹配对应的字体、行距等样式,确保文本能够适应新的布局。

这时候走到第五步,通过智能渲染的方式,将翻译好的文字调整好大小尺寸,连同上面说的的数学公式、图片、表格等重新排版一遍,写入新文档。

到这一步,经过 BabelDOC PDF 处理好的翻译文档就这样新鲜出炉了

而这个 BabelDOC 功能就是由沉浸式翻译推出的。

沉浸式翻译相信很多人都知道,非常无敌好用的翻译插件,

能实时视频翻译,我熬夜追 openai 直播的时候都用它 :

不开玩笑,可以说是我的十大爱用插件之一!

经常看我文章的朋友不知道有没有注意到,我的截图经常会有这个小图标,

好用啊,真的好用。

只需要我们进入这里