php 空格不可能交替,utf-8空格惹的祸

来源:http://www.mnuet.com 作者:动态资讯 人气:56 发布时间:2019-10-18
摘要:   一遍坑爹的小bug。读取一段文字(编码utf-8),想替换掉空格,str_replace(""..)、preg_replace("/s/"..)都不起功效。 ?php// 替换p后4个空格$str = file_get_contents("http://m.ts.cn/new/99cms_ts/api.php?s=/News

    一遍坑爹的小bug。读取一段文字(编码utf-8),想替换掉空格,str_replace(" "..)、preg_replace("/s/"..)都不起功效。

<?php

// 替换<p>后4个空格
$str = file_get_contents("http://m.ts.cn/new/99cms_ts/api.php?s=/News/getNewsInfoTmp/Nid/51089");
$str = str_replace(" ", "-", $str);
$str = preg_replace("/s/", "-", $str);
echo $str;  // 不起作用

  没办法,将替换不了的空格ord()下才看见,那一个utf-8空格相比奇特。ASCII 194 + 160出去的。

<?php

// 替换<p>后4个空格
$str = file_get_contents("http://m.ts.cn/new/99cms_ts/api.php?s=/News/getNewsInfoTmp/Nid/51089");
$str = str_replace(chr(194) . chr(160), "-", $str);  // 解决方法
echo $str;  // OK

  实验下那个空格。

<?php

// utf-8无bom文件下,四个空格
$s1 = chr(194) . chr(160);
$s2 = chr(32);
$s3 = " ";
$s4 = " ";  // 全角空格
$s = $s1 . $s2 . $s3 . $s4;

// 判断
$r  = '';
if ($s1 == $s2) $r .= 1;
if ($s1 == $s3) $r .= 2;
if ($s1 == $s4) $r .= 3;
if ($s2 == $s3) $r .= 4;
if ($s2 == $s4) $r .= 5;
if ($s3 == $s4) $r .= 6;

// 结果
echo $s, "#####", $r, "####", str_replace(" ", "-", $s), "####", preg_replace("/s/", "-", $s);

  结果:为便利书写,|代表空格,|代表全角空格。

  ||||####4####|--|####|--|

  改下浏览器编码为gbk,结果:聽 銆€#####4####聽--銆€####聽--銆€

 

  难点的源点,在于UTF-8这种编码里面,存在八个非常的字符,其编码是“0xC2 0xA0”(194 160),调换来字符的时候,表现为叁个空格,跟平常的半角空格(ASCII 0x20)一样,独一的两样是它的宽窄不会被减去,由此比相当多的被用于网页排版(如首行缩进之类)。而其他的编码情势如GB2312、Unicode之类并从未如此的字符。

  总计下来正是:轮换不了的字符,打字与印刷出ASCII码来总能替换掉呢。

 

参考:缓慢解决搜罗UTF-8网页空格产生问号乱码  诡异的UTF8空格

本文由广东十一选五一定牛发布于动态资讯,转载请注明出处:php 空格不可能交替,utf-8空格惹的祸

关键词:

频道精选

最火资讯