python 反扒技巧 爬虫失败的原因分析 html的学习 css java html dom bs4 xpath selenium js混淆加密 反混淆 ajaxs

1. requests = requests.Session()# 保留缓存

2 headers={"Referer": "https://m.douban.com/tv/american",#由于豆瓣加了反扒机制如果不加Refer就会报错

    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}

(1080条消息) js逆向案例-空气质量_十一姐的博客-CSDN博客

波晓张 - 博客园 (cnblogs.com)   非常重要!

全网最佳Python高级爬虫逆向精品【励做全网最佳】_哔哩哔哩_bilibili

对 js加密数据进行爬取和解密

selenium使用 - adrian-boy - 博客园

爬虫中你不知道的js加密、逆向、混淆_哔哩哔哩_bilibili   讲的很详细

https://www.cnblogs.com/zhufanyu/p/11997817.html  爬取js加密和混淆的例子

对 js加密数据进行爬取和解密 - adrian-boy - 博客园

爬虫之数据解析 - adrian-boy - 博客园

 爬虫中你不知道的js加密、逆向、混淆_哔哩哔哩_bilibili

分析 

(1080条消息) jQuery的Ajax实例(附完整代码)_Yuan_mingyu的博客-CSDN博客_jquery ajax

$.ajax({          url:"发送请求(提交或读取数据)的地址", dataType:"预期服务器返回数据的类型",  type:"请求方式", async:"true/false",data:{发送到/读取后台(服务器)的数据},success:function(data){请求成功时执行},      error:function(){请求失败时执行}
});

 

 

 操作

 

 分析

 

 

波晓张 - 博客园 (cnblogs.com)

html的学习

HTML 简介 | 菜鸟教程

HTML 基础 | 菜鸟教程

HTML 元素

开始标签 *元素内容结束标签 *

这是一个段落

这是一个链接

换行

*开始标签常被称为起始标签(opening tag),结束标签常称为闭合标签(closing tag)

HTML 空元素

没有内容的 HTML 元素被称为空元素。空元素是在开始标签中关闭的。


就是没有关闭标签的空元素(
标签定义换行)。

在 XHTML、XML 以及未来版本的 HTML 中,所有元素都必须被关闭。

在开始标签中添加斜杠,比如
,是关闭空元素的正确方法
,HTML、XHTML 和 XML 都接受这种方式。

即使
在所有浏览器中都是有效的,但使用
其实是更长远的保障。

HTML 提示:使用小写标签

HTML 标签对大小写不敏感

等同于

。许多网站都使用大写的 HTML 标签。

菜鸟教程使用的是小写标签,因为万维网联盟(W3C)在 HTML 4 中推荐使用小写,而在未来 (X)HTML 版本中强制使用小写。

HTML 属性参考手册

查看完整的HTML属性列表: HTML 标签参考手册。

下面列出了适用于大多数 HTML 元素的属性:

属性描述
class为html元素定义一个或多个类名(classname)(类名从样式文件引入)
id定义元素的唯一id
style规定元素的行内样式(inline style)
title描述了元素的额外信息 (作为工具条使用)

HTML 标题

标题(Heading)是通过

-

标签进行定义的。

定义最大的标题。

定义最小的标题。

实例

这是一个标题。

这是一个标题。

这是一个标题。


尝试一下 »

注释: 浏览器会自动地在标题的前后添加空行。


标题很重要

确保将 HTML 标题 标签只用于标题。不要仅仅是为了生成粗体大号的文本而使用标题。

搜索引擎使用标题为您的网页的结构和内容编制索引。

因为用户可以通过标题来快速浏览您的网页,所以用标题来呈现文档结构是很重要的。

应该将 h1 用作主标题(最重要的),其后是 h2(次重要的),再其次是 h3,以此类推。

HTML 水平线


标签在 HTML 页面中创建水平线。

hr 元素可用于分隔内容。

实例

这是一个段落。


这是一个段落。


这是一个段落。


HTML 注释

可以将注释插入 HTML 代码中,这样可以提高其可读性,使代码更易被人理解。浏览器会忽略注释,也不会显示它们。

注释写法如下:

实例

 

HTML 标签参考手册

菜鸟教程的标签参考手册提供了有关这些标题及其属性的更多信息。

您将在本教程下面的章节中学到更多有关 HTML 标签和属性的知识。

标签描述
定义 HTML 文档
定义文档的主体

-

定义 HTML 标题

定义水平线
定义注释

 

区分一下:
,
以及
(带有空格)


 是 HTML 写法。
是 XHTML1.1 的写法, 也是 XML 写法。
 是 XHTML 为兼容 HTML 的写法,也是 XML 写法。HTML5 因为兼容 XHTML,所以三种写法都可以使用。

早期发布的 HTML 规范当中,
等元素是不用封闭自身的,但是这种元素造成了 HTML 规范的不严谨,于是在之后发布的 XHTML 语言中,参考了更为严谨的 XML 规范,在这些不用自身封闭的元素后加 / 来表示自行封闭,在逻辑上来讲等同于
....
(但是没有 
 这种写法),这样一来保证了较少的代码量,二来保证了规范的严谨。

HTML 格式化标签

HTML 使用标签 ("bold") 与 ("italic") 对输出的文本进行格式, 如:粗体 or 斜体

这些HTML标签被称为格式化标签(请查看底部完整标签参考手册)。

通常标签 替换加粗标签 来使用, 替换 标签使用。

然而,这些标签的含义是不同的:

定义粗体或斜体文本。

或者 意味着你要呈现的文本是重要的,所以要突出显示。现今所有主要浏览器都能渲染各种效果的字体。不过,未来浏览器可能会支持更好的渲染效果。

 

HTML 文本格式化标签

标签描述
定义粗体文本
定义着重文字
定义斜体字
定义小号字
定义加重语气
定义下标字
定义上标字
定义插入字
定义删除字

HTML "计算机输出" 标签

标签描述
定义计算机代码
定义键盘码
定义计算机代码样本
定义变量
定义预格式文本

HTML 引文, 引用, 及标签定义

标签描述
定义缩写
定义地址
定义文字方向
定义长的引用
定义短的引用语
定义引用、引证
定义一个定义项目。

head 标签和 header 标签的不同

head 标签用于定义文档头部,它是所有头部元素的容器。 中的元素可以引用脚本、指示浏览器在哪里找到样式表、提供元信息等等。

如:

文档标题

header 标签用于定义文档的页眉(介绍信息)。

如:

段落

一级标题

注意千万不要弄混。

HTML 样式- CSS


CSS (Cascading Style Sheets) 用于渲染HTML元素标签的样式。

Look! Styles and colors

Manipulate Text

Colors,  Boxes

and more...


 

尝试一下 »

如何使用CSS

CSS 是在 HTML 4 开始使用的,是为了更好的渲染HTML元素而引入的.

CSS 可以通过以下方式添加到HTML中:

  • 内联样式- 在HTML元素中使用"style" 属性
  • 内部样式表 -在HTML文档头部 区域使用