今天心学来潮,研究下python从pdf中提取文字到txt,涉及到遍历目录下所有文件,觉得挺有用的,记录一下。

依赖模块

  • pdfminer3k
    pip install pdfminer3k

这个包是python3专用的,一开始看找到的是pdfminer,但是其官网说只支持python[......]

Read more