Python 处理PDF
Python可以读取PDF文件并从中提取文本后打印内容。为此,我们首先要安装所需的模块是 PyPDF2 。以下是安装该模块的命令。您的Python环境中应该已经安装了pip。
安装成功后,我们可以使用模块中可用的方法来读取 PDF 文件。
运行上面的程序时,我们得到以下输出 –
阅读多个页面
要阅读带有多个页面并打印每个页面的页面编号的pdf,我们使用一个循环并配合getPageNumber()函数。在下面的示例中,我们有一个包含两个页面的PDF文件。内容将分别打印在两个独立的页面标题下。
当我们运行上面的程序时,我们得到以下输出: