JavaScript统计GBK/UTF8字符串长度

大家都知道,在JavaScript中字符串的长度不分中英文字符, 每一个字符都算一个长度,这跟PHP里的strlen()函数就不太一样。PHP里的strlen()函数根据字符集把GBK的中文每个2累加,把UTF-8的中文字符每个按3累加。

var s = 'www.qttc.net'

console.log(s.length) // Output: 12

有些童鞋可能要问了,为什么要计算GBK/UTF8长度?

主要是为了匹配数据库的长度范围内,比如GBK的数据库某字段是varchar(10),那么就相当于5个汉字长度,一个汉字等于两个字母长度。如果是UTF8的数据库则是每个汉字长度为3。

知道了以上原理以后,我们就可以算出一个字符串的实际长度了,如果是GBK字符集遇到中文加2,如果是UTF8字符集遇到中文加3即可

GBK长度计算函数

// GBK字符集实际长度计算
function getStrLeng(str){
  var realLength = 0;
  var len = str.length;
  var charCode = -1;
  for(var i = 0; i < len; i++){
    charCode = str.charCodeAt(i);
    if (charCode >= 0 && charCode <= 128) { 
      realLength += 1;
    }else{ 
      // 如果是中文则长度加2
      realLength += 2;
    }
  } 
  return realLength;
}

console.log(getStrLeng('琼台博客')) // Output: 8

UTF8长度计算函数

// UTF8字符集实际长度计算
function getStrLeng(str){
  var realLength = 0;
  var len = str.length;
  var charCode = -1;
  for(var i = 0; i < len; i++){
    charCode = str.charCodeAt(i);
    if (charCode >= 0 && charCode <= 128) { 
      realLength += 1;
    }else{ 
      // 如果是中文则长度加3
      realLength += 3;
    }
  } 
  return realLength;
}

console.log(getStrLeng('琼台博客')) // Output: 12
分享

TITLE: JavaScript统计GBK/UTF8字符串长度

LINK: https://www.qttc.net/136-javascript-count-gbk-utf8-string-length.html

NOTE: 原创内容,转载请注明出自琼台博客