编码为utf8(一个汉字3字节,一个英文1字节)
例:
- 一段文字:“我爱北京天安门”,我想从第12个字节的位置分隔,则字符串分割为:“我爱北京”,“天安门”,结果正确。
- 若一段文字为:“i爱北京天安门”,我想从第12个字节的位置分隔,则字符串分割为:“i爱北京??”,“??安门”,结果错误,有乱码。
我想达到的效果是,若碰到按字节无法分隔的字符,则向前移动到无乱码的情况。例如按12个字节分隔会出乱码,则尝试按11个字节分隔,若还出乱码则尝试按10个字节分隔,直到无乱码为止。
注:不能使用mb_xxx类函数直接按字符分割分隔,因为不符合需求,本需求是按字节分隔。
首先应该判断字节是否是 utf-8 的开头字节
参考,PHP 同理