网管程序员论坛

 找回密码
 注册

QQ登录

只需一步,快速开始

查看: 319|回复: 1

php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总

[复制链接]
发表于 2018-10-31 16:23:32 | 显示全部楼层 |阅读模式
这篇文章主要介绍了php5.4以上版本GBK编码下htmlspecialchars输出为空问题解决方法汇总,本文给出多种解决这个问题的方法,需要的朋友可以参考下

从旧版升级到php5.4,恐怕最麻烦的就是htmlspecialchars这个问题了!当然,htmlentities也会受影响,不过,对于中文站来说一般用htmlspecialchars比较常见,htmlentities非常少用到。

可能老外认为网页普遍应该是utf-8编码的,于是苦了那些用GB2312,GBK编码的中文站......!

具体表现:
  1. $str = "9enjoy.com的php版本是5.2.10";
  2. echo htmlspecialchars($str);
复制代码
gbk字符集下输出为空...utf-8下,输出正常。

为什么呢,原因在于5.4.0对这个函数的变化:
  1. 5.4.0   The default value for the encoding parameter was changed to UTF-8.
复制代码
原来是什么呢?
  1. string htmlspecialchars ( string $string [, int $flags = ENT_COMPAT | ENT_HTML401 [, string $encoding = 'UTF-8' [, bool $double_encode = true ]]] )
  2. Defines encoding used in conversion. If omitted, the default value for this argument is ISO-8859-1 in versions of PHP prior to 5.4.0, and UTF-8 from PHP 5.4.0 onwards.
复制代码
原来是ISO-8859-1,5.4后默认变成utf-8!然后中文使用这个函数就输出为空白了。
国内一堆开源程序在5.4下都会有这样的问题,DISCUZ官方也建议用户不要升级到5.4

解决方案:

1.苦逼的修改所有用到htmlspecialchars地方的程序
1.1 其第二个$flags参数,默认是ENT_COMPAT,因此改成
  1. htmlspecialchars($str,ENT_COMPAT,'GB2312');
复制代码
为什么不是GBK?因为没有GBK这个参数,如果强行使用GBK,则报错给你看:
  1. Warning: htmlspecialchars(): charset `gbk' not supported, assuming utf-8
复制代码
为了能使用GBK,则改成:
  1. htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');
复制代码
1.2.一样是改程序,但可以省略一个参数。
可以在网页头部加
  1. ini_set('default_charset','gbk');
复制代码
然后改成
  1. htmlspecialchars($str,ENT_COMPAT,'');
复制代码
文档中有写:An empty string activates detection from script encoding (Zend multibyte), default_charset and current locale (see nl_langinfo() and setlocale()), in this order. Not recommended.
大概意思就是:传入空字符串则使用default_charset的编码

1.3.封装一个函数吧...本来htmlspecialchars这个单词一直不好记。

  1. <font color="rgb(34, 34, 34)"><font face="tahoma, arial, &quot;">function htmlout($str) {
  2.     return htmlspecialchars($str,ENT_COMPAT,'ISO-8859-1');
  3. }</font></font>
复制代码
然后去批量替换。

2.直接修改源码,重编译!这也是目前我在线上做的方案。

修改ext/standard/html.c
大概在372行

  1. <font color="rgb(34, 34, 34)"><font face="tahoma, arial, &quot;">/* Default is now UTF-8 */
  2. if (charset_hint == NULL)
  3. return cs_utf_8;</font></font>
复制代码
把cs_utf_8改成 cs_8859_1
  1. /* Default is now UTF-8 */
  2. if (charset_hint == NULL)
  3. return cs_8859_1;
复制代码
编译后,原程序就不用做任何调整了。


 楼主| 发表于 2018-10-31 17:15:31 | 显示全部楼层
在php5.4中htmlspecialchars对中文如果不加参数的话,会输出空字符。处理方法为
  1. $str = htmlspecialchars($str, ENT_COMPAT ,'GB2312');
复制代码
您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|小黑屋|手机版|Archiver|最新更新|网管程序员社区 鄂ICP备11008024号-3

GMT+8, 2019-8-25 21:43 , Processed in 0.109200 second(s), 19 queries .

Powered by 网管论坛

© 2001-2018 www.027safe.com Inc.

快速回复 返回顶部 返回列表