陈奇网络工作室

python爬行动物用户代理

系统运输

学习爬虫的时候不用脑子,用python的爬虫脚本刚爬了两次,只测试过就打不开这个页面。 刚开始还有点迷糊,后来我才知道,python做爬虫的缺省用户代理是python的大版本,python2.7 .的用户代理:python3.5 .的用户代理

让我们做个实验:

python代码如下所示。

python2

import urllib2

url= http://www.baidu.com/

request=urllib2.request(URL )

response=urllib2. urlopen ( request )

print(response.read ) )

python3

来自urllib导入请求

url= http://www.baidu.com/

req=request.request(URL )

response=request.urlopen(req )

print ( response.read.decode ) )。

我们打开fiddler,执行完成代码,在fiddler上确认我们的数据

很明显是python的版本

所以我们学习爬行动物的时候不管爬什么,代码都要加上这个头的信息

把头放在代码里吧

来自urllib导入请求

头儿={

user-agent:Mozilla/5.0 ( windows nt 10.0; WOW64

}

url= http://www.baidu.com/

req=request.request(URL,headers=headers ) )。

response=request.urlopen(req )

print ( response.read.decode ) )

抓住包的结果如下。

详情请访问云服务器、域名注册、虚拟主机的问题,请访问西部数码代理商官方网站: www.chenqinet.cn

相关推荐

后台-系统设置-扩展变量-手机广告位-内容页底部广告位3