2023-12-01 分類: 網(wǎng)站建設(shè)
php字符編碼轉(zhuǎn)換類,支持ANSI、big、UTF-8、UTF-8+bom相互轉(zhuǎn)換。
四種常見的文本文件編碼方式
ANSI 編碼:
無文件頭(文件編碼開頭的有效字節(jié))
ANSI編碼的字母數(shù)字占一個(gè)字節(jié),漢字占兩個(gè)字節(jié)
回車換行,單字節(jié),十六進(jìn)制表示為0d 0a
編碼:
文件頭,十六進(jìn)制表示為FF FE
每個(gè)字符用兩個(gè)字節(jié)編碼
回車,換行,雙字節(jié),十六進(jìn)制表示為000d 000a
大編碼:
文件頭的十六進(jìn)制表示為FE FF
后面的編碼就是把字符的高位放在前面,低位放在后面,正好是編碼的逆過程
回車,換行php轉(zhuǎn)unicode編碼,雙字節(jié)php轉(zhuǎn)unicode編碼,十六進(jìn)制表示為 0d00 0a00
UTF-8 編碼:
文件頭,十六進(jìn)制表示為EF bb bF
UTF-8 是一種可變長(zhǎng)度的字符編碼。數(shù)字、字母、回車、換行都用1個(gè)字節(jié)表示,漢字占3個(gè)字節(jié)。
回車換行,單字節(jié),十六進(jìn)制表示為0d 0a
轉(zhuǎn)換原則:先將字符編碼轉(zhuǎn)換為UTF-8,再由UTF-8轉(zhuǎn)換為對(duì)應(yīng)的字符編碼。
..php
_allow_charset)){ $this->_in_charset = $in_charset; } // 檢查輸出編碼 if(in_array($out_charset, $this->_allow_charset)){ $this->_out_charset = $out_charset; } } /** 轉(zhuǎn)換 * @param String $str 要轉(zhuǎn)換的字符串 * @return String 轉(zhuǎn)換后的字符串 */ public function convert($str){ $str = $this->convToUtf8($str); // 先轉(zhuǎn)為utf8 $str = $this->convFromUtf8($str); // 從utf8轉(zhuǎn)為對(duì)應(yīng)的編碼 return $str; } /** 把編碼轉(zhuǎn)為UTF-8編碼 * @param String $str * @return String */ private function convToUtf8($str){ if($this->_in_charset=='utf-8'){ // 編碼已經(jīng)是utf-8,不用轉(zhuǎn) return $str; } switch($this->_in_charset){ case 'utf-8bom': $str = substr($str, 3); break; case 'ansi': $str = iconv('GbK', 'UTF-8//IGNORE', $str); break; case 'unicode': $str = iconv('UTF-16le', 'UTF-8//IGNORE', substr($str, 2)); break; case 'unicodebe': $str = iconv('UTF-16be', 'UTF-8//IGNORE', substr($str, 2)); break; default: break; } return $str; } /** 把UTF-8編碼轉(zhuǎn)換為輸出編碼 * @param String $str * @return String */ private function convFromUtf8($str){ if($this->_out_charset=='utf-8'){ // 輸出編碼已經(jīng)是utf-8,不用轉(zhuǎn) return $str; } switch($this->_out_charset){ case 'utf-8bom': $str = "\xef\xbb\xbf".$str; break; case 'ansi': $str = iconv('UTF-8', 'GbK//IGNORE', $str); break; case 'unicode': $str = "\xff\xfe".iconv('UTF-8', 'UTF-16le//IGNORE', $str); break; case 'unicodebe': $str = "\xfe\xff".iconv('UTF-8', 'UTF-16be//IGNORE', $str); break; default: break; } return $str; } } // class end ?>
演示:將 big 轉(zhuǎn)換為 utf-8+bom
convert($str); file_put_contents('response/utf-8bom.txt', $response, true); ?>
源碼下載地址:點(diǎn)擊查看
以上介紹了pHp字符編碼轉(zhuǎn)換類,支持ANSI、big、UTF-8、UTF-8+bom之間的轉(zhuǎn)換,包括內(nèi)容,希望對(duì)pHp教程感興趣的朋友有所幫助.
免責(zé)聲明:本文首發(fā)于php中文網(wǎng)。轉(zhuǎn)載請(qǐng)注明出處。感謝您的尊重!如果您有任何問題,請(qǐng)聯(lián)系我們
網(wǎng)頁(yè)題目:四種常見文本文件編碼方式ANSI編碼:無文件頭(文件編碼開頭標(biāo)志性)
當(dāng)前地址:http://m.newbst.com/news48/297848.html
成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供小程序開發(fā)、Google、網(wǎng)站建設(shè)、電子商務(wù)、面包屑導(dǎo)航、移動(dòng)網(wǎng)站建設(shè)
聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請(qǐng)盡快告知,我們將會(huì)在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如需處理請(qǐng)聯(lián)系客服。電話:028-86922220;郵箱:631063699@qq.com。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)
猜你還喜歡下面的內(nèi)容