用python处理pdf

不知道python处理pdf,word文档有什么模块吗?

想写一个抽取pdf或是word文档内容的工具

谢谢

作者: alexandnpu   发布时间: 2011-05-17

简单讲,如果只折腾现成的PDF文件,用pyPdf,如果要生成新内容的PDF文件用ReportLab,如果要分析现有PDF文件的内容,用PDFMiner。

对于你提的需求,建议使用PDFMiner

作者: sofoot   发布时间: 2011-05-17