五行资源分享网
分享一个代码,Python正则爬取的数据,这个帖子是从葫芦侠三楼分享过来的,用来爬取电影高分排行榜,其实我也看不懂,所以分享到这来了!
所需包 request re
爬取豆瓣电影高分榜
import requests
import re
headers = {
'User-Agent': 'Mozilla/5.0 (Linux; U; Android 8.1.0; zh-cn; BLA-AL00 Build/HUAWEIBLA-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/57.0.2987.132 MQQBrowser/8.9 Mobile Safari/537.36'
}
url = 'https://m.douban.com/doulist/240962/'
response = requests.get(url)
results = re.findall('.*?href="(.*?)".*?cover.*?src="(.*?)"\salt="(.*?)">.*?(.*?).*?meta.*?>(.*?).*?recommend.*?>(.*?)',response.text,re.S)
for result in results:
#print(result)
print(result[0],result[1],result[2],result[3],result[4])
评论