kavin

下载网页图片小爬虫getjpg

kavin Python 2018-05-07 2419浏览 0


最近学习python,根据教程自己编写了一段采取网页上图片的脚本,

导入模块,定义函数,筛选图片信息,并制定下载位置。

代码如下,仅供大家参考:

#!/usr/bin/python
import re
import urllib
def getHtml(url):
    page = urllib.urlopen(url)
    html = page.read()
    return html
def getImg(html):
    reg = r'src="(.*?\.jpg)'  #定义图片格式
    imgre = re.compile(reg)
    imglist = re.findall(imgre,html)
    x = 0
    for imgurl in imglist:
        urllib.urlretrieve(imgurl,'%s.jpg' % x)
        x+=1
html = getHtml("http://tieba.baidu.com/p/5235046213?see_lz=1")  #地址换成你想要采集图片的地址
print getImg(html)


继续浏览有关 爬虫 的文章
发表评论