广告
返回顶部
首页 > 资讯 > 后端开发 > JAVA >har[] 和 String 类型占用字节大小问题
  • 850
分享到

har[] 和 String 类型占用字节大小问题

java教程java 2022-03-26 15:03:32 850人浏览 猪猪侠
摘要

在 C 语言中char a[10] = {"China"} 中,这个 a 占用多少字节?答:占用 10 个字节。解析:上面代码对 a 做了赋值的操作,a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]=

在 C 语言中

char a[10] = {"China"} 中,这个 a 占用多少字节?

答:占用 10 个字节。

解析:上面代码对 a 做了赋值的操作,

a[0]='C' ,a[1]='h' ,a[2]='i' ,a[3]='n' ,a[4]='a' ,a[5]='',a[6]='',a[7]='',a[8]='',a[9]=''

所以,它占用的是 10 个字节。

如果单指 ”China“ ?

答:共 6 个字节。China 占 5 个字节,最后以 '' 结束,占 1 个字节。

在 Java 语言中

1、String s = "China"; 占多少字节?

答:占 5 个字节。

 System.out.println(Charset.defaultCharset());//获取ide默认编码类型
String s = new String("China".getBytes());
byte[] b = s.getBytes();
System.out.println("" + b.length);

以上代码,可以输出 "China" 所占的字节长度为 5

2、String s = "中国"; 占多少字节?

答:如果是 汉字 的情况需要考虑编码。

(1)GBK 编码(ide默认)时,每一个汉字占用 2 个字节,那么中国占 4 个字节。

(2)UTF-8 编码时,每一个汉字占用 3 个字节,那么中国占用 6 个字节。

3、转码问题,GBK 转 UTF-8 时,字节占用会变大吗?反过来呢?

//获取的是 UTF-8编码
System.out.println(Charset.defaultCharset());
String s;
try {
        s = new String("中国".getBytes(),"GBK");
        byte[] b = s.getBytes();
        System.out.println("" + b.length);
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
}

如上代码是:UTF-8 转 GBK 编码格式,s 长度从 6 字节变为 9 字节。

s 内容变化:中国 —> 涓浗

因为当前编码是 UTF-8,转码之后变成了 3 个文字,占用 9 个字节。然而,反过来的情况是这样的:

中国 (gbk) —> ?й? (utf-8)

s 长度从 4字节 变成了 4字节,虽然长度没发生改变,但是文字已经改变。这里的 ? 占用 1 个字节

--结束END--

本文标题: har[] 和 String 类型占用字节大小问题

本文链接: https://www.lsjlt.com/news/3185.html(转载时请注明来源链接)

有问题或投稿请发送至: 邮箱/279061341@qq.com    QQ/279061341

本篇文章演示代码以及资料文档资料下载

下载Word文档到电脑,方便收藏和打印~

下载Word文档
猜你喜欢
软考高级职称资格查询
编程网,编程工程师的家园,是目前国内优秀的开源技术社区之一,形成了由开源软件库、代码分享、资讯、协作翻译、讨论区和博客等几大频道内容,为IT开发者提供了一个发现、使用、并交流开源技术的平台。
  • 官方手机版

  • 微信公众号

  • 商务合作