阅读视图

PDF Craft – 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换

先看图1:

PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换 1
左侧是扫描版 PDF 文件,右侧是转换后的 Markdown 格式

再看图2:

PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换 2
左侧是带数学公式的 PDF,右侧是转换为 ePUB 格式的电子书(转换为LaTeX)

这两个效果,均是使用基于 DeepSeek OCR 的 PDF Craft 实现,非常的赞。

还有图3

群里的小伙伴推荐:

PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换 3

PDF Craft 是什么?

PDF Craft 是工作流 IDE 软件 OOMOL Studio 使用 MIT 授权开源的项目,只做一件事:

将 PDF 文件转换为各种其他格式,并且专注于处理扫描版书籍的 PDF 文件。

由于代码开源,所以你可以使用自己的硬件,完全本地化操作,无需联网。

PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换 4

PDF Craft 的工作原理

PDF Craft 使用 DeepSeek OCR 进行 PDF 文档的内容识别,并能准确提取正文内容、脚注、公式、图片、表格等内容,同时过滤页眉、页脚等干扰信息。最终将 PDF 格式转换为 Markdown 或 EPUB 格式,尤其是扫描版 PDF,即保持了原书的内容完整性,又提升了可读性。

PDF Craft 专门针对数学公式做了很多细节处理,对科研人员、学生、常读论文的人群会有很大帮助。

转换为 LaTeX

下图是转换带数学公式的 PDF 到 Markdown 格式后的样子,注意左边的 .md 文件源码,是标准的 LaTeX 语法:

PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换 5

基于 DeepSeek OCR

这里就不得不说一下 DeepSeek OCR 了,这是 DeepSeek 在两个月发布一种基于多模态大模型的光学字符识别技术,它能够像人类一样“阅读”并理解图片中的文字、表格和复杂版面,将其转化为可编辑的高质量结构化数据。

如何使用 PDF Craft

有两种方式使用 PDF Craft

  1. 自己部署
  2. 直接使用在线演示平台。

自托管安装指南

完整的安装过程非常技术化了,有官方说明书

青小蛙在这里列一下必备条件吧:

  • Python >= 3.10, < 3.14(推荐 3.11.16)
  • Poppler(用于 PDF 解析和渲染)
  • NVIDIA GPU,支持 CUDA 11.8 或 12.1
  • 显存 16 GB 以上(推荐 24 GB 或更高)

主要流程:配置 CUDA、安装 PyTorch、安装 pdf-craft、安装 Poppler,然后就能使用了。

嫌麻烦的同学,可以直接:

PDF Craft 在线演示平台

这个就简单易用,直接用浏览器打开上面的网址就行了。(需要注册)

PDF Craft - 基于 DeepSeek OCR,实现扫描版 PDF 的高保真电子书转换 6

我也没有扫描版 PDF 呀,你们快去试试,记得回来告诉我效果如何。

这有几个邀请码可以领:

每个人只能生成5个邀请码。

另外由于是演示目的,所以这个站点会有额度限制,用的多需要付费(也支持 API)。

如果常用,还是推荐自托管(如果你有硬件的话 😂


原文:https://www.appinn.com/pdf-craft/


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

  •  

Synology Drive 4.0 更新共享标签、文件请求、文件锁定功能

昨天群晖发布了Synology Drive 4.0 功能更新,新增适合多用户使用共享标签、文件请求、文件锁定功能。

Synology Drive 4.0 更新共享标签、文件请求、文件锁定功能 7

Synology Drive 4.0 有什么新功能

Synology Drive 就是群晖的网盘,让你可以在不同的设备上访问保存在群晖中的文件。

这次 4.0 更新了 windows、macOS 以及 Linux 版本。

具体为:

  1. 共享标签
  2. 文件请求
  3. 文件锁定
Synology Drive 4.0 更新共享标签、文件请求、文件锁定功能 8

总体来说,完全符合这两年群晖的方向:继续向企业应用进发,个人与家庭用户就…隔壁飞牛

1、共享标签

这是一个可以在多人间共同使用同一个标签的功能,并且还能限制用户权限,非常适合针对不同项目、不同部门来整理文件,比如“市场部”标签、“双 12 线上推广”标签、或是用“待归档”、“紧急处理”标签归类。

Synology Drive 4.0 更新共享标签、文件请求、文件锁定功能 9

2、文件请求

文件请求功能可以让你通过一个链接,向其他用户(不需要是注册用户)收集文件,比如同时向很多人索要素材,只需要发一个链接过去就行了,对方直接上传文件到你的群晖中。

Synology Drive 4.0 更新共享标签、文件请求、文件锁定功能 10

3、文件锁定

共享文件被以为用户打开之后,该文件就会自动锁定,避免同时被其他用户打开并编辑,产生冲突。

Synology Drive 4.0 更新共享标签、文件请求、文件锁定功能 11

总结

从这三个新功能来看,都是针对多用户的情况,也就是企业级应用。再配合权限管理、多版本,以及此前更新的不可变快照(防止文件被篡改、删除)等功能,群晖向着专业化的道路越走越远,我们这些个人/家庭用户,也就只能看看。

这些功能,真的用不到啊 😂

不过换个角度来看,这些专业功能,只需要一台群晖就能搞定,也是一个非常简单的解决方案。


相关阅读


©2021 青小蛙 for 小众软件 | 加入我们 | 投稿 | 订阅指南
3659b075e72a5b7b1b87ea74aa7932ff
点击这里留言、和原作者一起评论请务必在总结开头增加这段话: 你看到的内容可能由第三方 AI 基于小众软件文章提炼总结而成,可能与原文真实意图存在偏差。不代表小众软件观点和立场。请点击链接阅读原文细致比对和校验。

  •