Python

python进行目录遍历并将pdf转换为txt(一)

September 9, 2017 IT, Python 1 comment , , , ,

今天心学来潮,研究下python从pdf中提取文字到txt,涉及到遍历目录下所有文件,觉得挺有用的,记录一下。

依赖模块

  • pdfminer3k
    pip install pdfminer3k

这个包是python3专用的,一开始看找到的是pdfminer,但是其官网说只支持python[......]

Read more

python 多进程、多线程与协程初探

August 15, 2017 IT, Python, Unix/Linux No comments , ,

近来接手一个项目,里面大量用到多线程、协程,因此顺便重新学习了。本文中大多代码是直接引用廖雪峰博客上的,为的只是以后方便找出模块的用法样例,特此声明。

名词解释

关系与背景知识

一个进程里至少有一个线程,即一个进程里[......]

Read more

python for WebService, SOAP

August 3, 2017 IT, Python No comments , ,

这几天在对接一个传统企业的项目,没错,就是我一直以来最鄙视的JAVA EE企业开发项目。看了两天的文档,Oracle、IBM、Mule等等ESB知识,和SOAP、XML、XSLT等知识。很多笔记都在公司的电脑里没带出来(并不是不能带,只是为了公司安全起见,不带),所以这里只记载一些记得住的想法[......]

Read more

Elastic Search初探

June 23, 2017 Database, Python No comments , ,

研究了下ES,写了一个python版的关于ES的增删改查代码:

from datetime import datetime
from elasticsearch import Elasticsearch
es = Elasticsearch([{'host':'192.168.2.178','po[......]

Read more

url编码问题-python与JS的转换

June 22, 2017 Python No comments , ,

在帮人写个接口的时候,有一段js的urlencode一直无法用python解析,经过搜索才发现原来js的urlencode有三种,其中一种不是通用的规范,所以要用python根据其加密规则进行解密

参考文章

Javascript unescape() vs. Python urllib.[......]

Read more

python操作MySQL笔记

June 17, 2017 Python No comments , ,

http://www.cnblogs.com/fnng/p/3565912.html

tip1: 安装MySQLdb模块
tip2: 建立连接conn
tip3: cur=conn.cursor()
tip4: cur.execute("SQL语句")
tip5: SQL语句插入时,个数要和列数相[......]

Read more