python 反扒技巧 爬虫失败的原因分析 html的学习 css java html dom bs4 xpath selenium js混淆加密 反混淆 ajaxs
1. requests = requests.Session()# 保留缓存
2 headers={"Referer": "https://m.douban.com/tv/american",#由于豆瓣加了反扒机制如果不加Refer就会报错
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/108.0.0.0 Safari/537.36"}
(1080条消息) js逆向案例-空气质量_十一姐的博客-CSDN博客
波晓张 - 博客园 (cnblogs.com) 非常重要!
全网最佳Python高级爬虫逆向精品【励做全网最佳】_哔哩哔哩_bilibili
对 js加密数据进行爬取和解密

selenium使用 - adrian-boy - 博客园
爬虫中你不知道的js加密、逆向、混淆_哔哩哔哩_bilibili 讲的很详细
https://www.cnblogs.com/zhufanyu/p/11997817.html 爬取js加密和混淆的例子
对 js加密数据进行爬取和解密 - adrian-boy - 博客园
爬虫之数据解析 - adrian-boy - 博客园
爬虫中你不知道的js加密、逆向、混淆_哔哩哔哩_bilibili
分析

(1080条消息) jQuery的Ajax实例(附完整代码)_Yuan_mingyu的博客-CSDN博客_jquery ajax
$.ajax({ url:"发送请求(提交或读取数据)的地址", dataType:"预期服务器返回数据的类型", type:"请求方式", async:"true/false",data:{发送到/读取后台(服务器)的数据},success:function(data){请求成功时执行}, error:function(){请求失败时执行}
});



操作


分析


波晓张 - 博客园 (cnblogs.com)

html的学习
HTML 简介 | 菜鸟教程
HTML 基础 | 菜鸟教程
HTML 元素
| 开始标签 * | 元素内容 | 结束标签 * |
|---|---|---|
| 这是一个段落 | ||
| 这是一个链接 | ||
| 换行 |
*开始标签常被称为起始标签(opening tag),结束标签常称为闭合标签(closing tag)。
HTML 空元素
没有内容的 HTML 元素被称为空元素。空元素是在开始标签中关闭的。
就是没有关闭标签的空元素(
标签定义换行)。
在 XHTML、XML 以及未来版本的 HTML 中,所有元素都必须被关闭。
在开始标签中添加斜杠,比如
,是关闭空元素的正确方法,HTML、XHTML 和 XML 都接受这种方式。
即使
在所有浏览器中都是有效的,但使用
其实是更长远的保障。
HTML 提示:使用小写标签
HTML 标签对大小写不敏感:
等同于
。许多网站都使用大写的 HTML 标签。
菜鸟教程使用的是小写标签,因为万维网联盟(W3C)在 HTML 4 中推荐使用小写,而在未来 (X)HTML 版本中强制使用小写。
HTML 属性参考手册
查看完整的HTML属性列表: HTML 标签参考手册。
下面列出了适用于大多数 HTML 元素的属性:
| 属性 | 描述 |
|---|---|
| class | 为html元素定义一个或多个类名(classname)(类名从样式文件引入) |
| id | 定义元素的唯一id |
| style | 规定元素的行内样式(inline style) |
| title | 描述了元素的额外信息 (作为工具条使用) |
HTML 标题
标题(Heading)是通过
- 标签进行定义的。
定义最大的标题。 定义最小的标题。
实例
实例
这是一个标题。
这是一个标题。
这是一个标题。
尝试一下 »
注释: 浏览器会自动地在标题的前后添加空行。
标题很重要
请确保将 HTML 标题 标签只用于标题。不要仅仅是为了生成粗体或大号的文本而使用标题。
搜索引擎使用标题为您的网页的结构和内容编制索引。
因为用户可以通过标题来快速浏览您的网页,所以用标题来呈现文档结构是很重要的。
应该将 h1 用作主标题(最重要的),其后是 h2(次重要的),再其次是 h3,以此类推。
HTML 水平线
标签在 HTML 页面中创建水平线。
hr 元素可用于分隔内容。
实例
这是一个段落。
这是一个段落。
这是一个段落。
HTML 注释
可以将注释插入 HTML 代码中,这样可以提高其可读性,使代码更易被人理解。浏览器会忽略注释,也不会显示它们。
注释写法如下:
实例

HTML 标签参考手册
菜鸟教程的标签参考手册提供了有关这些标题及其属性的更多信息。
您将在本教程下面的章节中学到更多有关 HTML 标签和属性的知识。
| 标签 | 描述 |
|---|---|
| 定义 HTML 文档 | |
| 定义文档的主体 | |
- | 定义 HTML 标题 |
| 定义水平线 | |
| 定义注释 |

区分一下:
,
以及
(带有空格)
是 HTML 写法。
是 XHTML1.1 的写法, 也是 XML 写法。
是 XHTML 为兼容 HTML 的写法,也是 XML 写法。HTML5 因为兼容 XHTML,所以三种写法都可以使用。
早期发布的 HTML 规范当中,
与 等元素是不用封闭自身的,但是这种元素造成了 HTML 规范的不严谨,于是在之后发布的 XHTML 语言中,参考了更为严谨的 XML 规范,在这些不用自身封闭的元素后加 / 来表示自行封闭,在逻辑上来讲等同于
....(但是没有 这种写法),这样一来保证了较少的代码量,二来保证了规范的严谨。
HTML 格式化标签
HTML 使用标签 ("bold") 与 ("italic") 对输出的文本进行格式, 如:粗体 or 斜体
这些HTML标签被称为格式化标签(请查看底部完整标签参考手册)。
|
| 通常标签 替换加粗标签 来使用, 替换 标签使用。 然而,这些标签的含义是不同的: 与 定义粗体或斜体文本。 或者 意味着你要呈现的文本是重要的,所以要突出显示。现今所有主要浏览器都能渲染各种效果的字体。不过,未来浏览器可能会支持更好的渲染效果。 |
|---|

HTML 文本格式化标签
| 标签 | 描述 |
|---|---|
| 定义粗体文本 | |
| 定义着重文字 | |
| 定义斜体字 | |
| 定义小号字 | |
| 定义加重语气 | |
| 定义下标字 | |
| 定义上标字 | |
| 定义插入字 | |
| 定义删除字 |
HTML "计算机输出" 标签
| 标签 | 描述 |
|---|---|
| 定义计算机代码 |
| 定义键盘码 | |
| 定义计算机代码样本 | |
| 定义变量 | |
| 定义预格式文本 |
HTML 引文, 引用, 及标签定义
| 标签 | 描述 |
|---|---|
| 定义缩写 | |
| 定义地址 | |
| 定义文字方向 | |
| 定义长的引用 | |
| 定义短的引用语 | |
| 定义引用、引证 | |
| 定义一个定义项目。 |

head 标签和 header 标签的不同
head 标签用于定义文档头部,它是所有头部元素的容器。
中的元素可以引用脚本、指示浏览器在哪里找到样式表、提供元信息等等。如:
文档标题
header 标签用于定义文档的页眉(介绍信息)。
如:
段落
一级标题
注意千万不要弄混。
HTML 样式- CSS
CSS (Cascading Style Sheets) 用于渲染HTML元素标签的样式。
Look! Styles and colors
Manipulate Text
Colors, Boxes
and more...
尝试一下 »

如何使用CSS
CSS 是在 HTML 4 开始使用的,是为了更好的渲染HTML元素而引入的.
CSS 可以通过以下方式添加到HTML中:
- 内联样式- 在HTML元素中使用"style" 属性
- 内部样式表 -在HTML文档头部 区域使用
