【代码分享】 Python正则爬取数据 - 网站代码 - 五行资源分享网

【代码分享】 Python正则爬取数据

作者头像图片

作者: 五行

网络资源搬砖的爱好者

文章二维码手机扫码查看

特别声明:文章多为网络转载,资源使用一般不提供任何帮助,如有侵权请联系!

五行资源分享网

分享一个代码,Python正则爬取的数据,这个帖子是从葫芦侠三楼分享过来的,用来爬取电影高分排行榜,其实我也看不懂,所以分享到这来了!

 

所需包 request re

 

爬取豆瓣电影高分榜

 

import requests

import re

headers = {

      'User-Agent': 'Mozilla/5.0 (Linux; U; Android 8.1.0; zh-cn; BLA-AL00 Build/HUAWEIBLA-AL00) AppleWebKit/537.36 (KHTML, like Gecko) Version/4.0 Chrome/57.0.2987.132 MQQBrowser/8.9 Mobile Safari/537.36'

}

 

url = 'https://m.douban.com/doulist/240962/'

 

response = requests.get(url)

results = re.findall('.*?href="(.*?)".*?cover.*?src="(.*?)"\salt="(.*?)">.*?(.*?).*?meta.*?>(.*?).*?recommend.*?>(.*?)',response.text,re.S)

for result in results:

      #print(result)

      print(result[0],result[1],result[2],result[3],result[4])

 

【代码分享】 Python正则爬取数据-五行资源分享网-第1张图片

本文最后更新于2019-10-2,已超过 1 年没有更新,如果文章内容或图片资源失效,请留言反馈,我们会及时处理,谢谢!
分享到:
打赏
未经允许不得转载:

作者: 五行, 转载或复制请以 超链接形式 并注明出处 五行资源分享网
原文地址: 《【代码分享】 Python正则爬取数据》 发布于2019-10-2 17:54
帖子声明: 本站对文章进行整理、排版、编辑,是出于传递信息之目的, 并不意味着赞同其观点或证实其内容的真实性,不拥有所有权,不承担相关法律责任。

评论

在线链接输入图片 打卡按钮图片 私密评论按钮图片 51 + 99 =
乱评论、多次评论者一律禁言帐号或封禁IP
本站已经全面开启缓存,评论查看隐藏内容需等待1分钟后再刷新本页!

 

觉得文章有用就打赏一下文章作者

微信扫一扫打赏

打赏图片