“黑马程序员”正则表达式+html+css笔记
----- android培训、java培训、期待与您交流! ----------
正则表达式:
是一种专门用于操作字符串的规则
通过一些符合来表示,简化对喜欢穿的复杂操作。
弊端:阅读性差。
| 代码/语法 | 说明 |
|---|---|
| * | 重复零次或更多次 |
| + | 重复一次或更多次 |
| ? | 重复零次或一次 |
| {n} | 重复n次 |
| {n,} | 重复n次或更多次 |
| {n,m} | 重复n到m次 |
| 代码 | 说明 |
|---|---|
| . | 匹配除换行符以外的任意字符 |
| \w | 匹配字母或数字或下划线或汉字 |
| \s | 匹配任意的空白符 |
| \d | 匹配数字 |
| \b | 匹配单词的开始或结束 |
| ^ | 匹配字符串的开始 |
| $ | 匹配字符串的结束 |
常见的操作:
1.匹配,String matches(regex)//(Pattern,matcher)
2.获取(查找):pattern,matcher
Patern p=Pattern.compile(regex)
Matcher m=p.matcher(String);
while(m.find()){
syso(m.group);
}
3.切割:String split(regex)
4.替换:String replaceAll(regex,str);
示例:
String regex="\\d{5,}";
Pattern p=Pattern.compile(regex);
Matcher m=p.matcher(String);
while(m.find()){
String s=m.group();
s.replaceAll(regex,"#");
}
网页爬虫:
通过网络以及io读取网页源文件,并通过规则获取网页中的符合规则的数据。
比如:mail爬虫
String mailreg="[a-zA-Z0-9_]{6,12}@[a-zA-Z0-9]+{\\.[a-zA-Z]+}+";
正则表达式中组的含义:将部分进行封装以便重用。\\num 反向引用指定组。
示例:
IP地址排序。
-------------------------------------
1.html:超文本标记语言。
html语言中是由标签组成的。
html中的数据都会封装在标签当中,因为可以通过标签中的属性值的改变对封装
内数据进行操作
确定html代码范围
该范围中可以定义两部分一是:头:一是体
head:网页的一些属性信息。比如:标题
body:网页显示数据
标签特点:对于数据进行封装,那么久有开始标签和结束标签
但是也有一些标签只体现单一功能,所以不需要结束标签,规范中要求
标签必须要结束所以这样的标签在内部实现
标签格式:<标签名 属性名="属性值">数据标签名>
<标签名 属性名="属性值"/>
-----------------------
常见标签:
1.字体:
数据
特殊的部分:如果要在页面显示一些特殊符号时,需要进行转义。
<: <
>: >
空格:
&: &
标题:
...
--------------------------------------------
2.列表标签:
上层项目:
下层项目:
项目符号标签:
这两个标签中的列表项都由- 封装
示例:
1.游戏名称
a.星际
b.红警
2.游戏内容:
a.攻略
b.秘籍
- 游戏名称
- 星际
- 红警
- 游戏内容
- 攻略
- 秘籍
----------------------------
3.图像标签:
4.表格标签:
表格由行所组成,行由单元格所组成
表格中默认都有一个tbody标签
标题标签:
cellpadding="10" cellspacing="0">
表格是最常用的标签,用于对数据进行格式化
5.超链接 新浪网站
当被点击后,会启动引擎所对应的解析程序。
去查找指定的主机。
1.先找本地主机的hosts文件。如果没有找到该主机对应的ip地址
2.去找公网NDS服务器上找到对应ip地址。
联系
我们
当点击超链接时,就会出现邮件相关的解析程序,本机默认是outlook
超链接的另一个作用:
定位标记.
回到那个位置
6.表单标签:
该标签是可以和服务端进行交互的。(常用)
--------------------------------------------
2.列表标签:
上层项目:
下层项目:
项目符号标签:
- 封装
示例:
1.游戏名称
a.星际
b.红警
2.游戏内容:
a.攻略
b.秘籍
- 游戏名称
- 星际
- 红警
- 游戏内容
- 攻略
- 秘籍
----------------------------
3.图像标签:
4.表格标签:
表格由行所组成,行由单元格所组成
表格中默认都有一个tbody标签
标题标签:
cellpadding="10" cellspacing="0">
表格是最常用的标签,用于对数据进行格式化
5.超链接 新浪网站
当被点击后,会启动引擎所对应的解析程序。
去查找指定的主机。
1.先找本地主机的hosts文件。如果没有找到该主机对应的ip地址
2.去找公网NDS服务器上找到对应ip地址。
联系
我们
当点击超链接时,就会出现邮件相关的解析程序,本机默认是outlook
超链接的另一个作用:
定位标记.
回到那个位置
6.表单标签:
该标签是可以和服务端进行交互的。(常用)
这两个标签中的列表项都由
