斗鱼爬虫以及服务器部署

以下内容仅限于学习使用

文章目录

  • 用到的工具
  • 爬了什么
  • 如何部署

用到的工具

  • selenium
  • python
  • docker 用来部署在云端服务器上
  • xpath 用来定位元素

爬了什么

主要爬了直播房间的名字、热度、作者、分类。
主要思路就是使用selenium直接爬

import time
import loggingfrom selenium import webdriver
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities# LOG_FORMAT = "%(asctime)s - %(levelname)s - %(message)s"
# logging.basicConfig(filename='scrapy.log', level=logging.DEBUG,
#                     format=LOG_FORMAT)with webdriver.Remote("http://127.0.0.1:4444/wd/hub",DesiredCapabilities.CHROME) as driver:url = 'https://www.douyu.com/directory/all'driver


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部