优草派  >   Python

Python如何拆分pdf文件?Python怎么将pdf分割成多个小文件

罗西汉            来源:优草派

pdf文件是诸多文件类型之中都比较特别的一个,因为它是以每一页组合起来形成文档的,而pdf内的每一页也可以单独的拆分出来。本篇文章小编要来给大家介绍的内容就是,python将pdf文件拆分成多个小文件的方法教程,有需要的小伙伴可以往下阅读哦。

Python如何拆分pdf文件?Python怎么将pdf分割成多个小文件

1.在python中对pdf文件进行操作的模块和库有很多,其中PyPDF2就是一个支持读写个样式修改等操作的模块。通过pip工具将其下载安装好之后就可以在python程序内导入它,示例如下:

from PyPDF2 import PdfFileReader, PdfFileWriter

以上导入的是该模块之中的两个方法,分别是用来读取pdf文件以及构建PDF文件编写器对象的。

2.所以模块导入之后的第二步就是定义一个函数并且需要四个参数,定义函数的作用是为了让这个python程序可以复用。而这四个参数则分别为待拆分的pdf文件路径、起始页和结束页、以及拆分完成后保存的文件路径,示例如下:

def split_pdf(file_name, start_page, end_page, output_pdf):

3.那么下一步就是要将pdf文件给读取出来并定义一个文件写入对象,然后使用for循环根据range()函数迭代起始页和结束页之间的数字,这样就能取出pdf文件中这几页的数据了。然后将每一页的数据又放在一起写入新的pdf文件之中就完成了拆分,只需要多调用几次这个函数并传入不同的参数就可以实现pdf分割成多个小文件的需求,示例如下:

      input_file = PdfFileReader(open(file_name, 'rb'))
    output_file = PdfFileWriter()
    for i in range(start_page, end_page):
        output_file.addPage(input_file.getPage(i))
    with open(output_pdf, 'wb') as f:
        output_file.write(f)
if __name__ == '__main__':
    split_pdf("test.pdf", 0, 3, "0-2.pdf")
    split_pdf("test.pdf", 7, 12, "7-11.pdf")
    split_pdf("test.pdf", 18, 23, "18-22.pdf")

以上就是关于“Python如何拆分pdf文件?Python怎么将pdf分割成多个小文件”的全部内容了,希望对你有所帮助。

【原创声明】凡注明“来源:优草派”的文章,系本站原创,任何单位或个人未经本站书面授权不得转载、链接、转贴或以其他方式复制发表。否则,本站将依法追究其法律责任。