如何将字符位置转换为UTF中的字节位置
我有UTF-8编码的文本文件。 我可以通过字符读取它。 每个字符可以是一个字节或多个字节。 我怎么知道一个字节重新存放的地方,并且它重新存储了多于一个字节?
在读取char
计算字节数。
对于每个char c
:
if(c<128)
bytesCount++;
else if (c<2048)
bytesCount+=2;
else
bytesCount+=3;
另请参阅编码定义维基百科URF8
链接地址: http://www.djcxy.com/p/78433.html上一篇: How to convert from character positions to byte postions in UTF
下一篇: 8 to base64 string