演示:

接下来代码展示:
# !/user/bin/env python
# -*- coding: utf-8 -*-
# des: 下载任何网页的图片
import re
import requests
def download_img():
error_count = 0
success_count = 0
url = input('请输入您要下载的图片的网址:')
headers = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.141 Safari/537.36 Edg/87.0.664.75'
}
web_text = requests.get(url, headers=headers).text
ex = '<img.*?src="(.*?)".*?'
img_list = re.findall(ex, web_text)
print('图片地址:', img_list)
if len(img_list) == 0:
print('该网站有反爬虫机制,爬取失败,请换个网站继续尝试。')
for img in img_list:
try:
# 补充协议头
if not (img.startswith('http') or img.startswith('https')):
img = 'http:' + img
img_binary = requests.get(img, headers=headers).content
# 切割出最后一个字符串
file_name = img.split('/')[-1]
# 切割 query字符
file_name = file_name.split('?')[0]
with open(f'./img/{file_name}', 'wb') as fp:
fp.write(img_binary)
print(file_name, ',下载成功')
success_count += 1
except Exception as e:
print(e)
error_count += 1
continue
print('下载图片结束!')
return success_count, error_count
if __name__ == '__main__':
success_count, error_count = download_img()
print(f'总计下载:{success_count},下载失败:{error_count}')
© 版权声明
本站网络名称:
蚩梦博客
本站永久网址:
https://chimengblog.com/
网站侵权说明:
本网站的文章部分内容可能来源于网络,仅供大家学习与参考,如有侵权,请联系站长QQ45096653删除处理。
1 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
2 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
3 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
1 本站一切资源不代表本站立场,并不代表本站赞同其观点和对其真实性负责。
2 本站一律禁止以任何方式发布或转载任何违法的相关信息,访客发现请向站长举报
3 本站资源大多存储在云盘,如发现链接失效,请联系我们我们会第一时间更新。
THE END
- 最新
- 最热
只看作者