如何将字符位置转换为UTF中的字节位置

我有UTF-8编码的文本文件。 我可以通过字符读取它。 每个字符可以是一个字节或多个字节。 我怎么知道一个字节重新存放的地方,并且它重新存储了多于一个字节?


在读取char计算字节数。

对于每个char c

if(c<128)
  bytesCount++;
else if (c<2048)
  bytesCount+=2;
else
  bytesCount+=3;

另请参阅编码定义维基百科URF8

链接地址: http://www.djcxy.com/p/78433.html

上一篇: How to convert from character positions to byte postions in UTF

下一篇: 8 to base64 string