mirror of https://github.com/TwoWater/Python
30 lines
765 B
Python
30 lines
765 B
Python
#!/usr/bin/env python3
|
|
# -*- coding: UTF-8 -*-
|
|
|
|
# 提取图片的地址
|
|
|
|
import re
|
|
|
|
a = '<img src="https://s-media-cache-ak0.pinimg.com/originals/a8/c4/9e/a8c49ef606e0e1f3ee39a7b219b5c05e.jpg">'
|
|
|
|
# 使用 re.search
|
|
search = re.search('<img src="(.*)">', a)
|
|
# group(0) 是一个完整的分组
|
|
print(search.group(0))
|
|
print(search.group(1))
|
|
|
|
# 使用 re.findall
|
|
findall = re.findall('<img src="(.*)">', a)
|
|
print(findall)
|
|
|
|
# 多个分组的使用(比如我们需要提取 img 字段和图片地址字段)
|
|
re_search = re.search('<(.*) src="(.*)">', a)
|
|
# 打印 img
|
|
print(re_search.group(1))
|
|
# 打印图片地址
|
|
print(re_search.group(2))
|
|
# 打印 img 和图片地址,以元祖的形式
|
|
print(re_search.group(1, 2))
|
|
# 或者使用 groups
|
|
print(re_search.groups())
|