2018-11-07
阅读量:
1073
python-爬虫(模仿浏览器)--(一)
许多公司网站都有反爬虫,因为爬虫会给该公司服务器造成很大压力
所以需要冒充浏览器,完成这个功能需要加入以下东西:
请求头headers(寻找方法如下,找到后全部拷贝)——要求传过去一个字典

不想那么复杂,就至拷贝user-agent

key和value都加上引号,放在代码中:







评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论