19年深圳杯D题之爬取实时收视率信息

文章目录

  • 前言
  • 网站分析
  • 具体代码

前言

由于了解每个时段的收视率信息,这里爬取了酷云的数据

网站分析

进入酷云的界面,可以发现它的数据是通过Ajax获取
http://eye.kuyun.com/web/#epglist/225/深圳卫视
在这里插入图片描述
双击刚才的请求进去,可以直接拿到json数据,并没有过滤操作,使用直接用request请求即可。
在这里插入图片描述
广告表现也是一样的道理
在这里插入图片描述

具体代码

获得EPG信息直接写入文件

def get_EPG():response = requests.get("http://eye.kuyun.com/api/recent_epgs?tv_id=225")jsonStr = response.textjsonDict = json.loads(jsonStr)data = jsonDict['data']for item in data:print(item)with open('TV/0430EPG.txt', 'a', encoding='utf-8') as f:line = json.dumps(item)f.write(line + '\n')

由于json.dumps()处理了汉字,所以出现\u的字符不用担心,在json.loads()之后会变回正常的汉字
在这里插入图片描述
获得广告表现信息直接写入文件

def get_adv():response = requests.get("http://eye.kuyun.com/kuyun_eye_ad/cbd_public/perform?tv_id=225&day=2019-04-18")jsonStr = response.textjsonDict = json.loads(jsonStr)print(jsonDict)data = jsonDict['response']['result']['list']for item in data:print(item)with open('TV/0426adv.txt', 'a', encoding='utf-8') as f:line = json.dumps(item)f.write(line + '\n')

在这里插入图片描述


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部