‘python’ 分类的存档

# ########################################## # 需要安装的软件 1: ImageMagick 官网地址http://www.imagemagick.org/script/convert.php 2: python-tesseract 官网地址https://code.google.com/p/python-tesseract/downloads/list # ############################################ # 参考文档 1/http://www.imagemagick.org/script/convert.php 2/http://hilojack.sinaapp.com/?p=866#_6 3/http://lxy.me/tesseract-ocr-introduction-and-tutorial.html 4/http://lxy.me/how-the-text-in-centos-next-picture-identification-and-storage-to-txt.html # ############################################# # 环境部署 Windows+tesseract-orc+imagemagick 1/下载&安装tesseract-ocr-setup-3.02.02.exe和chi_sim.traineddata.gz 下载地址:https://tesseract-ocr.googlecode.com/files/tesseract-ocr-setup-3.02.02.exe 下载地址:https://tesseract-ocr.googlecode.com/files/chi_sim.traineddata.gz 最后将下载的chi_sim.traineddata.gz中文字库放入安装目录的tessdata目录中 2/下载安装imagemagick # ############################################### # cmd识别方法 1/将图片转化为高质量图片(灰度化/二值化/去噪) > convert demo.jpg -grayscale Rec709Luminance out.png > convert demo.jpg -grayscale gray out2.png > convert demo.jpg -grayscale Rec709Luma out3.png > convert demo.jpg -set [...]

2013年8月5日09:39 | 没有评论
分类: linux, python
标签:

h3{margin:5px;} .title_p{margin:3px;padding:5px;border-bottom:1px solid gray;font-weight:bold;} .con_p{margin-bottom:20px;} .con_p span{margin:5px;} Scrapy简介 Scrapy是一个快速,高效的网页抓取python框架。主要用于Web抓取&提取信息&格式化数据。经常用此做数据挖掘、检测、测试等。 安装所需软件 python python python 安装步骤 1、安装Python 官网下载python(http://www.python.org/ftp/python/2.7.5/python-2.7.5.msi)& 傻瓜安装 将python路径(D:\Python27;D:\Python27\Scripts;)加入环境变量 验证是否安装ok 2、安装setuptools 官网下载setuptools(http://pypi.python.org/pypi/setuptools)& 傻瓜安装 3、安装Zope.Interface 官网下载Zope.Interface(http://pypi.python.org/pypi/zope.interface/)& 傻瓜安装 验证是否安装ok 4、安装Twisted 官网下载Twisted(http://twistedmatrix.com/trac/wiki/Downloads)& 傻瓜安装 5、安装w3lib 官网下载w3lib(http://pypi.python.org/pypi/w3lib) 安装 验证 6、安装libxml2 官网下载libxml2(http://users.skynet.be/sbi/libxml-python/)& 傻瓜安装 7、安装pyOpenSSL 官网下载pyOpenSSL(https://pypi.python.org/pypi/pyOpenSSL)& 傻瓜安装 8、安装scrapy 官网下载scrapy(https://pypi.python.org/pypi/Scrapy) 安装 验证 安装完毕 OK

2013年6月23日21:44 | 没有评论
分类: python
标签:

问题描述:在引入BeautifulSoup的时候报错 解决方案: 修改程序: 问题所在:版本不同 导致引入的模块名不同

2013年5月21日15:25 | 没有评论
分类: python

问题:在创建好了第一个模型(`books`)后使用python manage.py validate后报错 H:\django-root\mysite>python manage.py validate Error: No module named books 解决方案: 在配置文件settings.py中INSTALLED_APPS 的模块里修改mysite.books为books

2013年5月18日14:14 | 没有评论
分类: python
标签:

问题描述:在创建django模型的时候报出一下错误 TypeError: __init__() got an unexpected keyword argument ‘maxlength’ 问题所在:新版本和老版本定义冲突 如何解决: 将 maxlength 改为 max_length 即可

2013年5月18日13:58 | 没有评论
分类: python
标签: ,

问题:在django的字符界面(python manage.py shell)下 使用 >>> from django.db import connection >>> cursor = connection.cursor() 无法链接数据库 “OperationalError: (2003, “Can’t connect to MySQL server on ‘localhost’ (10061)”)” 解决方法: 引入django的settings配置文件 os.environ['DJANGO_SETTINGS_MODULE'] = ‘mysite.settings’ 程序如下

2013年5月18日10:23 | 没有评论
分类: python
标签:

直接贴代码

2013年5月1日23:46 | 没有评论
分类: python
标签:

直接上代码 一早上的成绩 呵呵

2013年4月30日10:38 | 1 条评论
分类: python
标签:

在采集网页信息的时候,经常需要伪造报头来实现采集脚本的有效执行 下面,我们将使用urllib2的header部分伪造报头来实现采集信息   方法1、 方法2、

2012年11月16日13:34 | 没有评论
分类: python
标签: ,

说明:python的urllib2获取网页(urlopen)会自动重定向(301,302)。但是,有时候我们需要获取302,301页面的状态信息。就必须获取到转向前的调试信息。 下面代码将可以做到避免302重定向到新的网页

2012年11月1日14:25 | 没有评论
分类: python
标签: