初级爬虫--网易云音乐歌单
目标地址:http://music.163.com/discover/playlist
目标:爬取,歌单封面图、歌单名、歌单链接、播放量、用户名、用户主页链接。并将数据写入Excel表格
步骤:
1.分析页面源码,所需要的数据所在层级关系
2.获取HTML源码
3.解析HTML源码并筛选所需数据
4.将数据写入表格
代码实现如下:
总结:
1.根据层级关系获取元素的规律还需要摸索,了解爬虫的一些理论知识。
2.数据写入表格的方法还需要优化,是否可以一次性写入一行,使代码更简洁明了。
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
