跳到主要内容

PDF 拆分实战:按页、按范围、按大小把一份 PDF 切成多份

讲清楚 PDF 拆分的三种切法,按页、按页码范围、按文件大小,配上把 100 页书拆成章节的真实例子,以及为什么本地浏览器处理比上传网站更安全,和合并互为逆操作。

发布于 作者 李雷
#pdf #pdf拆分 #办公效率 #隐私

PDF 拆分实战:按页、按范围、按大小把一份 PDF 切成多份

一份 PDF 在手里,真正要用的常常只是其中几页。一份 62 页签好字的合同,客户只要第 38 页那张赔付附录;一本 800 页的扫描书,你想按章节分开读;一个超大导出文件,客户的邮箱网关死活收不下。这三种情况底层是同一个动作:把一份 PDF 拆成若干份。下面把拆分的几种切法、各自适合的场景,以及为什么要在本地浏览器里做这件事讲清楚。

拆分有三种切法,先想清楚要哪一种

PDF 拆分不是只有"一页一份"这一种。Toolora 的 PDF 拆分工具给了三种切法,对应三类需求。

第一种是每页一份:24 页的合同拆完就是 24 个单页 PDF,文件名从 合同-p1.pdf合同-p24.pdf,页号天然带在名字上。适合归档系统按"一页一条目"做细粒度授权的场景。

第二种是按页码范围,也是最灵活的一种,下一节单独讲。

第三种是按文件大小:你设一个 MB 上限,工具用贪心算法从第 1 页往后塞,每塞一页就看看当前这包多大,一旦"再加一页就超"就把当前包输出,从下一页开新包。专门对付邮件附件的体积限制。要注意它是尽力而为,pdf-lib 编码器的字节布局有波动,实际输出可能比目标少几 KB,但不会超。

按页码范围拆:一行语法解决大部分需求

按范围拆是日常用得最多的。语法沿用 Acrobat 的习惯,1 起算,英文逗号或空格分隔:

  • 单页:1, 4, 9
  • 闭区间:1-3, 7-9
  • 开口尾巴:5- 表示从第 5 页到末尾
  • 开口头部:-3 表示从第 1 页到第 3 页
  • 混着写:1-3, 5, 7-9, 12- 完全可以

每个逗号分段会拆成一份独立 PDF,所以 1-3, 5 输出的是两份文件,不是一份。超出实际页数的页码会被悄悄忽略,10 页的 PDF 你填 1-999,会被当成 1-10,不会报错也不会多出空白页。

这里有个容易踩的坑:别把 1 起算和 0 起算搞混。第 1 页就是封面,你以为 0-3 是"前四页",实际 0 被丢掉,拿到的是 1 到 3 页。想跳过封面应该写 2-

真实例子:把 100 页的书按章节拆开

说个我自己跑过的场景。手上一份 100 页的扫描教材 PDF,想按章节分开,方便单独发给不同的人复习。

先翻到目录,把每章的起止页码抄下来:第一章 1 到 18,第二章 19 到 41,第三章 42 到 67,第四章 68 到 88,第五章 89 到 100。然后切到"按页码范围",把这几段一次性粘进去:

1-18, 19-41, 42-67, 68-88, 89-100

点拆分,一秒多一点,浏览器就下载下来一个 zip,里面五份 PDF,文件名各自带着页码段,例如 教材-p1-18.pdf教材-p19-41.pdf,在文件夹里一眼就能对上是哪一章。整本书从头到尾没有离开我这台电脑,这点对扫描的版权材料尤其重要。

如果章节多到十几个,范围串会很长,但工具不挑,跳页、单页、宽范围混在一起都能解。

为什么要在本地浏览器里拆,而不是上传到网站

市面上一搜一大把"在线 PDF 拆分",绝大多数是把你的文件传到它们服务器上处理完再下回来。合同、报销凭证、内部资料这类东西,传出去一次就是一次风险。

PDF 拆分工具整个过程跑在你浏览器里的 pdf-lib 上。文件通过 File.arrayBuffer() 在内存里读出来,直接交给 pdf-lib 解析,拆出来的 PDF 和打包的 zip 也都在这个标签页里生成。不信可以拆分时打开 DevTools 的 Network 面板自己看,请求数始终是 0。PDF 内容、里面的文字图片、电子签名,一个字节都不会发出去,因为这个工具背后根本没有一台能接收 PDF 的服务器。

有一处值得提醒:pdf-lib 会把源文档的信息字典,创建软件、修改时间,有时还有作者名,原样带到每一份拆出来的小 PDF 上。如果这点敏感,拆完再用 qpdf --linearize 配元数据清理工具洗一遍。拆分本身不新增任何元数据。

拆分和合并互为逆操作

拆开之后,常常还要拼回去,或者把几份不同来源的 PDF 合成一份。这正好是 PDF 合并工具的活,它和拆分是一对逆操作。

一个实际用法:拆出来的文件名长这样 报告-p1-3.pdf报告-p10-12.pdf,按字典序 p10-12 会排在 p2-4 前面,只有支持自然排序的文件管理器才按数字排。想稳妥地拼回原稿,与其指望文件名顺序,不如用合并工具按你指定的顺序拼,不靠文件名。先拆后合,或者先合再拆,这两个工具配着用,基本覆盖了把 PDF 重新组织的所有需求。

几个收尾的注意点

签过名的 PDF 拆开后,数字签名不会跨拆分保留,因为拆完就是另一份文档了,原签名本来也会失效。页面内容、嵌入字体和图片是完整保留的。

拆出来的 PDF 看着比预期略大,是因为保存时关掉了对象流,换来老版 Adobe Reader、印厂 RIP、pdf.js 都能正常打开,多 5% 体积值这个兼容性。真在乎体积,拆完再过一遍专业优化器。

PDF 能拆多大,大致等于浏览器能同时装下两份这个 PDF 的内存。中端笔记本加 Chrome 大概 200 到 300 MB 输入没问题,手机上 50 到 100 MB 比较稳。超大书建议分两步:先按范围拆成两半,再按页拆。


Made by Toolora · Updated 2026-06-13