用selenium定位网页元素并储存到文本文件中
#导包
from selenium import webdriver
#创建类
class spider():# 定义属性def __init__(self):self.url = "https://tieba.baidu.com/index.html"
#定义方法def write_keep(self):# 打开谷歌driver = webdriver.Chrome()# 设置隐式等待driver.implicitly_wait(5)#窗口最大化driver.maximize_window()# 打开百度贴吧网址driver.get(self.url)#打开文件file = open("spider1.txt", "w")#抓取元素保存到文件中for i in range(1, 11):ele = driver.find_element_by_xpath('//*[@id="right_wrap"]/div[3]/div/ul/li[' + str(i) + ']/a').textprint(i,ele)# 去掉字符间可能存在的空格ss = ''.join(ele.split())# 写入文件file.write(str(i) + " " + ss + "\n")# 关闭文件file.close()
#类的实例化与调用
if __name__ == '__main__':spider1 = spider()spider1.write_keep()
结果:



本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
