编程开发 > JAVA > 文章内容

java基础知识总结(134)

2016-9-17编辑:ljnbset

UTF-8 编码方案 采用变长编码 1~N方案, 其中英文1个byte

  中文3个byte

  char[] = ['A','B','中']

  utf8 = [41 42 e4 b8 ad]

  utf-8: 是将unicode 编码为 byte 序列的方案

  中:  4e2d = 0100111000101101

  e4 b8 ad = 11100100 10111000 10101101

             1110XXXX 10XXXXXX 10XXXXXX

   以0为开头的是 英文!(0~127)

   110 表示连续2字节表示一个字符

   1110 表示连续3字节表示一个字符

   11110 表示连续4字节表示一个字符

   每个数据字节以 10开头

java基础知识总结(133)

热点推荐

登录注册
触屏版电脑版网站地图