python线程池、自定义异常、请求伪装 2020年3月7日peakchao没有评论伪装, 异常, 线程池 线程池概念: 线程池可以理解为一个装载多线程的池子,池中放置了指定数量的线程,当我们提交的任务超过线程池的数量时,多余的任务会进行排队等待,待其他任务执行完毕后,再将队列中的任务提交到线程执行,线程池的好处是,能同时执行多个任务,复用线程资源,减少线程的创建和销毁,更节约系统资源。 1.普通代码,理论是在一个线程执行任务,和其他语言类似,代码从上至下依次执行。 import time def te…
Python爬虫入门-正则匹配图片资源 2020年3月3日peakchao没有评论python, 图片, 爬虫 闲来无事看了半天Python语法,写了一个图片抓取脚本,功能也比较单一,目前已实现功能: 1.获取首页所有包含图片的网页地址。 2.一一将首页获取的地址打开,获取单页下面的所有图片地址。 3.下载单页包含的所有图片到img目录下。 4.查找翻页参数,如果有下一页,页码+1后递归下载每页图片。 注:请勿频繁抓取数据,对服务器压力较大,请大家都做有素质的网民。数据来源于网络,侵权请告知。 运行示例: …