用JavaScript計算在UTF-8下存儲字符串占用字節數

DIV+CSS佈局教程網 >> 網頁腳本 >> JavaScript入門知識 >> 關於JavaScript >> 用JavaScript計算在UTF-8下存儲字符串占用字節數

編輯：關於JavaScript

最近和JavaScript糾纏上了。

遇到這麼一個問題，數據庫的字符集為UTF-8的，要在頁面上使用JavaScript驗證輸入的文本用UTF-8存儲時占用字節長度。JavaScript的String對象有length屬性，但是這個計算的是字符數，不是字節數（問題總是翻來覆去的，記得當年玩Delphi的時候，還得寫程序計算字符串的字符數，因為Delphi中String的length是字節數...）。偷懶一點的辦法是將驗證代碼中最大長度設置為數據庫中對應字段的長度的1/3，但是這樣准確來說有點不合適。

所以想辦法在JavaScript中判斷在UTF-8下存儲的String的字節數，在網上找到很多關於Unicode介紹的文檔，最重要的是字符編碼數值對應的存儲長度：

UCS-2編碼(16進制) UTF-8 字節流(二進制)
0000 - 007F 0xxxxxxx （1字節）
0080 - 07FF 110xxxxx 10xxxxxx （2字節）
0800 - FFFF 1110xxxx 10xxxxxx 10xxxxxx （3字節）

於是代碼如下：
[復制代碼代碼如下:
function mbStringLength(s) {
var totalLength = 0;
var i;
var charCode;
for (i = 0; i < s.length; i++) {
charCode = s.charCodeAt(i);
if (charCode < 0x007f) {
totalLength = totalLength + 1;
} else if ((0x0080 <= charCode) && (charCode <= 0x07ff)) {
totalLength += 2;
} else if ((0x0800 <= charCode) && (charCode <= 0xffff)) {
totalLength += 3;
}
}
//alert(totalLength);
return totalLength;
}

實際上,0x0080到0x07ff之間的字符很少會在實際用戶輸入中用到。

上一頁:js獲取控件位置以及不同浏覽器中的差別介紹
下一頁:JS實現隨機數生成算法示例代碼

關於JavaScript

js去字符串前後空格5種實現方法及比較: 我們在項目中如果寫到注冊的時候，用戶輸入空格，我們怎麼來剔除空格呢? 下面是我經常用到的js與大家分
JavaScript獲取數組最小值和最大值的方法: 本文實例講述了JavaScript獲取數組最小值和最大值的方法。分享給大家供大家參考。具體如下：va
JS實現向表格行添加新單元格的方法教程: 本文實例講述了JS實現向表格行添加新單元格的方法。分享給大家供大家參考。具體如下：下面的JS代碼可以

DIV CSS 佈局教程網

相關文章