python

python3 加密文件算法 DES/AES/RC4/RSA

April 1, 2018 IT, Python No comments , ,

最近帮人写了一个python3对文件加密解密的脚本,项目https://github.com/Gupern/python3_crypto/ 放在github上,先记录下。

# -*- coding: utf-8 -*-
'''
    author:         Gupern[......]

Read more

python实行栈的括号处理算法

March 14, 2018 IT, Python 2 comments , ,

问题描述

“+”代表AND,“|”代表OR,如何基于这个两个运算符号写个类似四则运算优先处理“()”内的逻辑?
A+B代表A and B;没毛病
A|B代表A或B;没毛病
很简单对吧?
那么((A+B)|C)+(D|(E+F))
(((A+B)|C)+(D|(E+F)))l(G+H)
怎么设计程序[......]

Read more

python从pdf中提取信息,并统计文本英语单词个数

September 10, 2017 IT, Python No comments , , ,

完整版代码,从pdf提取文本、进行清洗、统计字数等,还有可以优化的地方,有时间了再重构,后期可以整合为一个框架。先记着。

# encoding: utf-8

"""
    author: Gupern 
    purpose: extract text from pdf, clean[......]

Read more

python进行目录遍历并将pdf转换为txt(二)

September 9, 2017 IT, Python No comments , , ,

前言

刚刚用的是pdfminer3k的版本,解析某个pdf的时候出现了一个问题,如图:
pdfminer3k的问题

于是继续深入,发现pdfminer3k这个包已经很久远了,再找到一个pdfminer.six的包,并进行代码编写。

  • 注意,要把pdfminer3k卸载了才能用pdfminer.six,总之两个不兼容。

[......]

Read more

python进行目录遍历并将pdf转换为txt(一)

September 9, 2017 IT, Python 1 comment , , , ,

今天心学来潮,研究下python从pdf中提取文字到txt,涉及到遍历目录下所有文件,觉得挺有用的,记录一下。

依赖模块

  • pdfminer3k
    pip install pdfminer3k

这个包是python3专用的,一开始看找到的是pdfminer,但是其官网说只支持python[......]

Read more

python for WebService, SOAP

August 3, 2017 IT, Python No comments , ,

这几天在对接一个传统企业的项目,没错,就是我一直以来最鄙视的JAVA EE企业开发项目。看了两天的文档,Oracle、IBM、Mule等等ESB知识,和SOAP、XML、XSLT等知识。很多笔记都在公司的电脑里没带出来(并不是不能带,只是为了公司安全起见,不带),所以这里只记载一些记得住的想法[......]

Read more