Python 处理 Word 文档
要读取一个 Word 文档,我们需要使用名为 docx 的模块。首先按照下面的示例安装 docx。然后编写一个程序,使用 docx 模块中的不同函数来通过段落读取整个文件。
我们使用下面的命令将 docx 模块引入我们的环境中。
在下面的示例中,我们通过将每行追加到一个段落中来读取Word文档的内容,并最后打印出所有段落的文本。
当我们运行上面的程序时,我们得到以下输出 –
阅读单个段落
我们可以使用paragraphs属性从Word文档中读取特定的段落。在下面的示例中,我们只读取了Word文档中的第二个段落。
运行上面的程序,我们得到以下输出 −