utf-8编码文件中BOM产生的#65279空白清楚方法

企业谷 > 网站建设 > 阅读  ·  发布时间 2020-09-15 17:15  ·  发布者 企业谷
在utf-8编码文件中BOM在文件头部,占用三个字节,用来标示该文件属于utf-8编码,现在已经有很多软件识别bom头,但是还有些不能识别bom头,比如PHP就不能识别bom头,这也是用记事本编辑utf-8编码后执行就会出错的原因了。BOM只有在WINDOWS下采用“记事本”存储为UTF-8时才会有,这个可以用WINHEX把开始的2个字节删掉。在dreamweaver里面编码设置里面可以设置是否带BOM,一般只要php输出的不是图片(GDI Stream),BOM都不会导致问题。GDI Stream如果开头有了额外的 字符就会显示为 红叉。
去掉bom头的办法:
对于PHP程序需要去除Bom头可以使用目录下的bom.php程序去除。将下面的php代码放到新建的php文件里面,然后放在根目录下进行访问即可。

<?php
/**
* 清除BOM工具,将文件放到需要清除BOM文件头的目录即可
*/
 
//**************配置开始****************
@ini_set("max_execution_time", 60);
tool_bom_dir();
echo '企业谷恭喜你,本目录BOM已清除完毕,谢谢您的使用。';
//**************配置结束****************
 
function tool_bom_dir($basedir = '.'){
  if ($dh = opendir($basedir)) {
    $str='';
    while (($file = readdir($dh)) !== false) {
      if ($file != '.' && $file != '..'){
        if (!is_dir($basedir."/".$file)) {
          if(tool_bom_clear("$basedir/$file")){
              $str.= "文件 [$basedir/$file] 发现BOM并已清除<br>";
          }
        }else{
          $dirname = $basedir."/".$file;
          tool_bom_dir($dirname);
        }
      }
    }
    closedir($dh);
  }
  echo $str;
}
 
function tool_bom_clear($filename){
  $contents = file_get_contents($filename);
  $charset[1] = substr($contents, 0, 1);
  $charset[2] = substr($contents, 1, 1);
  $charset[3] = substr($contents, 2, 1);
  if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
    $rest = substr($contents, 3);
    rewrite ($filename, $rest);
    return true;
  }
}
 
function rewrite ($filename, $data) {
  $filenum = fopen($filename, "w");
  flock($filenum, LOCK_EX);
  fwrite($filenum, $data);
  fclose($filenum);
}