Python爬虫框架开发环境简介和Scrapy安装
一、开发环境
创新互联建站十余年专注成都高端网站建设按需规划网站服务,为客户提供专业的成都网站制作,成都网页设计,成都网站设计服务;创新互联建站服务内容包含成都网站建设,重庆小程序开发,软件开发,网络营销推广,网络运营服务及企业形象设计;创新互联建站拥有众多专业的高端网站制作开发团队,资深的高端网页设计团队及经验丰富的架构师高端网站策划团队;我们始终坚持从客户的角度出发,为客户量身订造网络营销方案,解决网络营销疑问。
Centos6.0
Scrapy1.5
Python3.6
MongoDB3.6
Pycharm
二、Scrapy1.5安装
pip install scrapy
如果Python3.6时通过编译安装的,先进行如下设置,设置环境变量,设置别名。
安装遇到的问题:
pip无法请求HTTPS类型的网站,原因是缺少SSL模块。解决办法安装openssl-devel。命令是 sudo yum install -y openssl-devel
SSL安装成功
现在执行pip3 install scrapy 还是报错,这是因为我们的Python3.6是通过编译安装的,所以要重新编译Python以兼容SSL模块。
编译安装执行make && make install完毕后,再执行pip3 install scrapy又报了一个错误,找不到twisted大于13.1.0的版本。
打开浏览器,输入https://pypi.org/ 搜索twisted并下载。完成后通过rz命令导入到服务器中,移动到soft文件中。使用tar -xvjf 进行解压缩,进入到解压后的twisted文件中,使用Python3 setup.py install安装。
再次pip3 install scrapy,成功。安装位置在python安装文件的bin目录下,编辑.bashrc,设置别名。使用source .bashrc编译。在命令行输入scrapy即可。
文章标题:Python爬虫框架开发环境简介和Scrapy安装
文章源于:http://hbruida.cn/article/ggpdcp.html