详解PHP用mb_string处理windows中文字符

admin3年前PHP教程31

我们都知道windows中(当然是中文版),文件名和文件内容等编码都是gbk,而我们在开发过程中,IDE里的编码则是UTF-8,(这里不讨论为什么等等问题,只考虑怎么把编码转变成一样的)所以导致我写的UTF-8编码的正则模式字符串中的中文在gbk编码的文件中并不能正确匹配。

一开始,我并没有什么办法,试过把PHP脚本文件的编码也改成GBK,也可以用,但是想到这种方法太low了,所以找一找PHP中有没有函数可以满足我的需求。

这时,我想到了以前在处理windows中的文件名时用的函数iconv(),其函数原型如下:

stringiconv(string$in_charset,string$out_charset,string$str)

Performsacharactersetconversiononthestringstrfromin_charsettoout_charset.

我们常使用:


$out_charset='utf-8';
 
$fileName=iconv($fileName,$out_charset,'gbk');

来处理文件名,将文件名改从gbk改为UTF-8而内容不变。

手册翻译附加:

如果你在输出字符串$out_charset后面添加//TRANSLIT即$out_charset='utf-8//TRANSLIT',在遇到不能转换为UTF-8的字符时,程序会自动替换为一个相似字符的UTF-8字符;如果你在输出字符串$out_charset后面添加//IGNORE即$out_charset='utf-8//IGNORE',在遇到不能转换为UTF-8的字符时,程序会自动跳过这个字符。如果你什么都没加,就在遇到不能替换成UTF-8的字符时,替换会被中断。

但是,我在用这个函数处理时,结果却是这样:

意思是iconv()函数能处理的最大字符数只有64,一般的文件名大小,而我的文件内容很显然不止64个字符。

没有办法,我只好再次各种翻找别的函数。

直到我发现了mb_string函数库,这个函数库一般都在PHP环境里集成,我们可以在phpinfo()里找到它。

mb_string函数里有一个mb_convert_encoding()函数,可以将一个字符串的编码改变,其函数原型如下:

stringmb_convert_encoding(string$str,string$to_encoding[,mixed$from_encoding])

Convertsthecharacterencodingofstringstrtoto_encodingfromoptionallyfrom_encoding.

基原型跟iconv()函数差不多,只是它没有对输出函数的后缀修饰,它也没有对字符串长度的明确限制。

而且我们看到$from_encoding是可选的,它可以自动识别源编码。

因为找不到一个确切的无法转码的字符,也不知道它遇到无法转码的字符会怎么处理。

通过mb_convert_encoding()函数,将整个文件处理了一下,于是,问题顺利解决。

最后介绍一下mb_string函数库,它全名叫MultibyteString,它的很多方法都扩展自PHP自身的string函数库,函数名在原函数的前面加了"mb_",这些函数除了拥有原函数的作用外,还在可选参数的最后加入了一个$encoding的可选参数,这个参数可以规定函数以什么样的编码方式来处理字符串。

例如strpos()函数,找到一个字符串在另一个字符串中的位置。

strpos("欢迎来访问","问",0)返回的结果是12,因为脚本是UTF-8编码,而将字符串转为UTF-8编码后,每个中文字符会占用3个字节。

而在mb_strpos()函数中,mb_strpos("欢迎来访问","问",0,'utf-8')则会返回4,它会将字符串当作已经转UTF-8的状态执行。

而mb_strpos("欢迎来访问","问",0,'gbk')会返回6

以上就是详解PHP用mb_string处理windows中文字符的详细内容,更多关于PHP用mb_string处理windows中文字符的资料请关注其它相关文章!

免责声明:本文内容来自用户上传并发布,站点仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。请核实广告和内容真实性,谨慎使用。

相关文章

用到显卡服务器的场景有哪些租用泉州显卡服务器的用途

用到显卡服务器的场景有哪些?显卡服务器,又叫做GPU服务器(高性能处理器+大内存+高性能显卡=GPU服务器)。显卡服务器,简单来说,显卡服务器是基于GPU的应用于视频编解码、深度学习、科学计算等多种场...

显卡服务器可以应用在哪些方面泉州显卡服务器适合哪些行业购买

很多朋友一般都听说过云服务器、物理服务器、高防服务器,大带宽服务器,有没有听说过显卡服务器?对于我们一般的用户而言,选择虚拟主机、云服务器和VPS主机是比较常见的,但是对于显卡服务器应该使用的不多。那...

怎么解决游戏服务器被cc攻击的问题?国内100G高防服务器CC攻击防护?

怎么解决游戏服务器被cc攻击的问题?游戏网站的流量一般会高于普通网站,更非常容易成为cc攻击的目标。如果游戏服务器被cc攻击后,没有及时处理,则可能会导致服务不可用,不利于客户体验。那么游戏服务器被c...

国外多ip服务器有哪些地区的呢

世界各地都有许多可供选择的多IP服务器地区。以下列出了一些主要的国外多IP服务器地区:美国:美国是全球最大的互联网市场之一,拥有许多大型云服务提供商和数据中心。由于其地理位置、网络基础设施和技术发展,...

PHP8新特性之JIT案例讲解

PHP8 alpha1已经在昨天发布,相信关于JIT是大家最关心的,它到底怎么用,有什么要注意的,以及性能提升到底咋样?首先,我们来看一张图:左图是 PHP 8之前的Opcache流程示意图, 右图是...

日本多ip服务器如何选择合适的配置呢

日本多ip服务器如何选择合适的配置呢?选择日本多ip服务器,其也叫日本站群服务器,是企业网站获得流量的一大利器,主要是日本多ip服务器可以使用许多IP来建立大量的网站,并保证了网站的质量和服务器成本,...