爬虫之代理池学习(二)

接上一篇:爬虫之代理池学习(一)

7、实现数据库模块

  • 作用:用于对Proxies集合进行数据库的相关操作
  • 目标: 实现对数据库增删改查相关操作
  • 步骤:
    • 1、在init中, 建立数据连接, 获取要操作的集合, 在 del 方法中关闭数据库连接
    • 2、提供基础的增删改查功能
      • 实现插入功能
      • 实现修改该功能
      • 实现删除代理: 根据代理的IP删除代理
      • 查询所有代理IP的功能
    • 3、提供代理API模块使用的功能
      • 实现查询功能: 根据条件进行查询, 可以指定查询数量, 先分数降序, 速度升序排, 保证优质的代理IP在上面.
      • 实现根据协议类型 和 要访问网站的域名, 获取代理IP列表
      • 实现根据协议类型 和 要访问网站的域名, 随机获取一个代理IP
      • 实现把指定域名添加到指定IP的disable_domain列表中.

在这里插入代码片

8、实现代理IP爬虫模块

在这里插入代码片

9、实现代理IP检测模块

在这里插入代码片

10、实现代理IP检测模块

在这里插入代码片

11、实现代理IP池启动入口

在这里插入代码片


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部