javascript gb2312轉utf-8_關於JavaScript

javascript gb2312轉utf-8

編輯：關於JavaScript

漢字標准交換碼共分兩級。第一級為常用字，有3755字，按漢語拼音字母順序排列，第二級為次常用字，有3008字，按部首排列。GB2312的編碼范圍為2121H-777EH.

UNICODE 是兩字節的全編碼，對於ASCII字符它也使用兩字節表示。代碼頁是通過高字節的取值范圍來確定是ASCII字符，還是漢字的高字節。如果發生數據損壞，某處內容破壞，則會引起其後漢字的混亂。UNICODE則一律使用兩個字節表示一個字符，最明顯的好處是它簡化了漢字的處理過程。

關於編碼的文章可以參考：

百度的頁面是gb2312的，URL編碼自然也是從gb轉換而來，比如“一”這個字，百度轉換的結果是D2%BB，而從Utf-8轉換來的結果是%E4%B8%80比如google（gb是2字節編碼，utf-8是3字節變長編碼）

可以用javascript的encodeURI和decodeURI來得到這些結果，設置頁面編碼就可以看到不同結果了。

在網上找，也沒找到現成的轉換程序，只得自己寫。還好網上不缺gb-utf的對照表，修改了一下就可以用了:gb-utf.txt

這個對照表是將gb字節編碼轉到utf的16進制編碼，而不是字節編碼。

javascript中escape和unescape是轉換16進制編碼用的，因此gb漢字到utf漢字的轉換思路是：encodeURI("gb漢字")，到對照表中查找utf的16進制編碼，unescape("16進制utf編碼")，得到utf漢字。

中間那一步最關鍵，我的轉換只用到了這一步，其他兩步直接調用那兩個函數就可以了。下面是轉換程序：

利用Javascript仿Excel的數據透視分析功能: 什麼是數據透視分析？數據透視分析就是要在不同維度對數據進行匯總，過濾，分析，比較，作圖。用來發現數
兼容IE、FireFox、Chrome等浏覽器的xml處理函數js代碼: 在編寫處理xml的網頁時，經常為浏覽器兼容性頭疼。於是我將常用的xml操作封裝為函數。經過一段時間的
學習使用bootstrap3柵格系統: 一、bootstrap開發環境搭建1. 下載bootstrap, http://www.bootcs

DIV CSS 佈局教程網