linux make & makefile(draft)

September 19, 2017 Uncategorized No comments

http://blog.csdn.net/ruglcc/article/details/7814546/

http://www.cnblogs.com/hnrainll/archive/2011/04/12/2013377.html

我读《阐释并守护世界意义的人》

September 16, 2017 Art, Book Review No comments , ,

像文艺复兴时期的所有伟大人物一样,他说:“人们能够完成他们想做的一切事情。”

前生今世

距离读完上一本书《失控》至今,已一个月有余(8.12--9.16),回想为什么会看这么久才看完的原因,可能是这段时间由于晚上要练车和其他事,看书的时间仅限于在搭乘地铁上。更由于此种非所擅长领域的书、偏哲学的书,每页带来的信息量都是新鲜的与厚实的,有点难啃。

本书作者为尤西林,可以说是我大学时期的人文启蒙导师。很难想象,在大学期间,经常逃课做自己事情的我会有一门课是拿100分的,而这门课就是他所教导的《人文科学导论》。在我之前的博文中也提到过他。当时那门课程的推荐教材就是他写的另一本书《人文科学[......]

Read more

python从pdf中提取信息,并统计文本英语单词个数

September 10, 2017 IT, Python No comments , , ,

完整版代码,从pdf提取文本、进行清洗、统计字数等,还有可以优化的地方,有时间了再重构,后期可以整合为一个框架。先记着。

# encoding: utf-8

"""
    author: Gupern 
    purpose: extract text from pdf, clean useless text and count words.
    usage: 
        0. windows + python3.6.2
        1. pip install pdfminer.six
        2. put this py script and all[......]

Read more

python进行目录遍历并将pdf转换为txt(二)

September 9, 2017 IT, Python No comments , , ,

前言

刚刚用的是pdfminer3k的版本,解析某个pdf的时候出现了一个问题,如图:
pdfminer3k的问题

于是继续深入,发现pdfminer3k这个包已经很久远了,再找到一个pdfminer.six的包,并进行代码编写。

  • 注意,要把pdfminer3k卸载了才能用pdfminer.six,总之两个不兼容。

找到了一个代码:

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter
from pdfminer.converter import TextConverter
from pdfminer.layout imp[......]

Read more

python进行目录遍历并将pdf转换为txt(一)

September 9, 2017 IT, Python No comments , , , ,

今天心学来潮,研究下python从pdf中提取文字到txt,涉及到遍历目录下所有文件,觉得挺有用的,记录一下。

依赖模块

  • pdfminer3k
    pip install pdfminer3k

这个包是python3专用的,一开始看找到的是pdfminer,但是其官网说只支持python2。

上网查阅了一些资料,还有个叫pypdf的包,详见下文参考文章部分。

代码

# encoding: utf-8
from pdfminer.pdfinterp import PDFResourceManager, process_pdf
from pdfminer.converter im[......]

Read more

linux tips之docker、tmux和nginx

September 3, 2017 IT, Unix/Linux No comments , , ,

由于项目需要,这几天接触到了如题的一些tips

docker 相关

docker log -f dockerName用来查看docker容器日志

docker exec -ti dockerName /bin/bash 用来进入docker容器进行操作

tmux

tmux是一个终端分屏软件,也可以用来多人协作或展示。比如在同一台服务器上,使用tmux a,那么另一个登陆的人也输入tmux a,就可以共同协作。

nginx

本博客是用apache,以前也一直没接触过nginx,昨天配置了一下,感觉很容易上手,也没那么难。

总结

其实很多技术都不难掌握,所以要分配好学习的[......]

Read more