|
|
EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
8 o# H, H% {( N) o5 u9 v% F2 B怎样爬取网页图片并保存在本地
6 G! l1 H8 K' k# k- ?9 B7 N3 q+ r
2 S9 j3 O% G. f将网页上的图片爬取之后,以图片原有名字保存在本地 5 g1 a/ t3 [3 l/ j4 q# M: n5 `
; h+ r& c& P1 {
. e3 c- T/ d) O1 F6 L代码:% s9 Z: J. m* D& G7 w) x; L3 g6 }
) n5 W k6 z' O3 w" Y2 a
7 E, O; Z; D" h' H- import requests
- import os
- url="http://p1.so.qhmsg.com/bdr/_240_/t01dab8b2e73fe661d6.jpg"
- root="D://pics//" #根目录
- path=root+url.split('/')[-1] #根目录加上url中以反斜杠分割的最后一部分,即可以以图片原来的名字存储在本地
- try:
- if not os.path.exists(root):#判断当前根目录是否存在
- os.mkdir(root) #创建根目录
- if not os.path.exists(path):#判断文件是否存在
- r=requests.get(url)
- with open(path,'wb')as f:
- f.write(r.content)
- f.close()
- print("文件保存成功")
- else:
- print("文件已存在")
- except:
- print("爬取失败")
& I/ l. \3 R0 t; y/ u* Y; [: e1 U$ O! D/ R: b' ?* H) ~
" x6 h" R7 ~% K. i3 j' W2 o) l0 ~9 U) V- P
+ G! G2 m( a; X: ?
5 O% `, i5 [/ |6 |( M7 |* [
6 n/ O8 k) C7 w运行结果: + p- e5 U e( O* `0 D; j8 K
: N' P( Z3 {7 G2 o* Q1 O# ]3 q+ \: k. ~/ m# ]
! f: e3 V% s3 w2 ?0 x4 \9 n
% z _/ K( m& R- g9 R% M
: Y u7 i0 J3 A, n; N |
|