rtrim函数 php,PHP源码阅读笔记七:nl2br, ltrim, rtrim, trim函数

PHP源码阅读笔记:nl2br, ltrim, rtrim, trim函数

string nl2br ( string string )

Returns string with ‘

‘ inserted before all newlines.

在代码中有注释如下:

/* it is really faster to scan twice and allocate mem once insted scanning once

and constantly reallocing */

程序先计算需要替换的个数,然后一次性计算需要分配的内存大小。从而减少了每次替换都重新分配内存的开销。

由此可见PHP源码的作者的程序优化上下了不少功夫。

源码摘抄如下:

str = Z_STRVAL_PP(zstr); // 字符串开始位置

end = str + Z_STRLEN_PP(zstr); // 字符串结束地址

/* it is really faster to scan twice and allocate mem once insted scanning once

and constantly reallocing */

while (str < end) { // 计算需要替换的位置个数

if (*str == '\r') {

if (*(str+1) == '\n') {

str++;

}

repl_cnt++;

} else if (*str == '\n') {

if (*(str+1) == '\r') {

str++;

}

repl_cnt++;

}

str++;

}

if (repl_cnt == 0) { // 如果没有可替换的字符串,直接返回

RETURN_STRINGL(Z_STRVAL_PP(zstr), Z_STRLEN_PP(zstr), 1);

}

// 给新生成的字符串分配内存

new_length = Z_STRLEN_PP(zstr) + repl_cnt * (sizeof("
") - 1);

tmp = target = emalloc(new_length + 1);

str = Z_STRVAL_PP(zstr);

while (str < end) {

switch (*str) {

case '\r': // 没有break,直接转下个case

case '\n':

*target++ = '

*target++ = 'b';

*target++ = 'r';

*target++ = ' ';

*target++ = '/';

*target++ = '>';

if ((*str == '\r' && *(str+1) == '\n') || (*str == '\n' && *(str+1) == '\r')) {

*target++ = *str++;

}

/* lack of a break; is intentional */

default:

*target++ = *str;

}

str++;

}

*target = '\0'; // 添加最后的结束字符

RETURN_STRINGL(tmp, new_length, 0); // 返回结果

ltrim — Strip whitespace (or other characters) from the beginning of a string

rtrim — Strip whitespace (or other characters) from the end of a string

trim — Strip whitespace (or other characters) from the beginning and end of a string

这三个函数都是调用static void php_do_trim(INTERNAL_FUNCTION_PARAMETERS, int mode)

===》PHPAPI char *php_trim(char *c, int len, char *what, int what_len, zval *return_value, int mode TSRMLS_DC)

实现,依据不同的mode(ltrim => 1, rtrim => 2, trim => 3)实现。

对于第二个参数,指过滤的字符,在默认情况下是 空格 \n\r\t\v\0

在程序中可以看到过滤用的字符仅有char mask[256];即ASCII 码的256个值

在使用php_charmask(unsigned char *input, int len, char *mask TSRMLS_DC)函数创建过滤用的字符HASH数组

如果是1或3(程序实现使用的是 mode & 1),则过滤源字符串前面的字符,从头开始遍历每个字符串,直接hash判断是否是需要过滤的字符,直到第一个不是过滤字符的位置结束

如果是2或 3(程序实现使用的是 mode & 2),则过滤源字符串后面的字符,过程与前面类似。


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部