微信公众号:爱问CTO
专业编程问答社区
www.askcto.com
开篇三个问题
作为Java的程序员,不知道在Java代码中定义了多少个字符串,可是看看下面3个问题。你是否认真思考过?是否动手实践过?
1.Java中的字符串String的最大长度是多少?
2.Eclipse使用哪种Java编译器?
3.为何Eclipse要出自己的编译器?
对于字符串可以承受的最大长度,要分为2个阶段,一个是编译时期(也就是你代码定义了一个String字符串,String s= "xiaohu"),一个是运行时期(指在程序运行过程中)
编译期String字符串的限制
我们都知道JVM里面是包含常量池的,(是一种对字符串的性能优化,不用反复创建新的字符串了)当我们使用字符串字面量直接定义String的时候,是会把字符串在常量池中存储一份的。常量池中的每一项常量都是一个表,都有自己对应的类型。Java中的UTF-8编码的Unicode字符串在常量池中以CONSTANT_Utf8_info类型表,结构如下:
CONSTANT_Utf8_info型常量的结构
类型 | 名称 | 数量 |
---|---|---|
u1 | tag | 1 |
u2 | length | 1 |
u1 | bytes | length |
u2类型的length的值就表明了这个UTF-8编码字符串长度是多少字节。所以CONSTANT_Utf8_info型常量对应的最大长度也就是java中UTF-8编码的字符串的长度,顺便提一下Class文件中的方法和字段也是引用CONSTANT_Utf8_info型常量来描述名称的。u2是无符号的16位整数,因此理论上允许的的最大长度是2^16-1=65535
编译器javac下String的长度
创建一个测试类
public class TestStr {
public static void main(String[] args) {
String LongStr ="aaaa..."//一共65535个a
System.out.println(LongStr.length());
}
}
使用javac命令编译它。编译报错。相应目录没有生成对应的TestStr.class文件
去除一个字符串,使用65534个字符串。
public class TestStr {
public static void main(String[] args) {
String LongStr ="aaaa..."//一共65534个a
System.out.println(LongStr.length());
}
}
javac命令编译它。编译正常。相应目录生成对应的TestStr.class文件
我们在看看Oracle JDK的编译工具Javac内部,javac也是java写的。
/** Check a constant value and report if it is a string that is
* too large.
*/
private void checkStringConstant(DiagnosticPosition pos, Object constValue) {
if (nerrs != 0 || // only complain about a long string once
constValue == null ||
!(constValue instanceof String) ||
((String)constValue).length() < Pool.MAX_STRING_LENGTH)
return;
log.error(pos, "limit.string");
nerrs++;
}
...
在看看Pool.MAX_STRING_LENGTH
public class Pool {
...
public static final int MAX_STRING_LENGTH = 0xFFFF;
...
}
通过上边代码可以看到 MAX_STRING_LENGTH = 0xFFFF 而 0xFFFF 是十进制的 65535。但是上面我们得出的结果是Javac编译下最大长度是65534,是因为 Javac 源码中做的限制是((String)constValue).length() < Pool.MAX_STRING_LENGTH) 注意是 < 而不是 <= , 小于65535那自然最多只能是65534了。
但是U2类型能表达的最大值是65535。上面65535个长度的字符串在javac下报错了是受到了javac编译器的限制了。如果你在上面65534长度生成的TestStr.class中手动在添加一个字符串(注意是在javac编译后的class文件中添加)是可以得到65535长度的结果。
总结一下:在Javac编译器下,字符串String的最大长度限制也即是U2类型所能表达的最大长度65534。避开javac最大长度是65535?
Eclise的JDT编译器下String的长度
Eclipse有自己的Java编译器,称为[JDT Core] [2](org.eclipse.jdt.core)。并不是用的javac编译器。
创建一个测试类
public class TestStr {
public static void main(String[] args) {
String LongStr ="aaaa..."//一共65540个a
System.out.println(LongStr.length());
}
}
发现Eclipse执行可正常执行。这肯定是Eclise的JDT编译器做了手脚。果然通过在Eclipse工作空间下找到了其编译生成的TestStr.class。使用javap命令查看
6: invokespecial #20; //Method java/lang/StringBuilder."<init>":(Ljava/la
ng/String;)V
9: ldc #23; //String QyNDAbAgIGqQIBAQ1
11: invokevirtual #25; //Method java/lang/StringBuilder.append:(Ljava/lang
/String;)Ljava/lang/StringBuilder;
14: invokevirtual #29; //Method java/lang/StringBuilder.toString:()Ljava/l
ang/String;
17: invokevirtual #33; //Method java/lang/String.intern:()Ljava/lang/Strin
g;
20: astore_1
21: getstatic #38; //Field java/lang/System.out:Ljava/io/PrintStream;
24: aload_1
25: invokevirtual #44; //Method java/lang/String.length:()I
28: invokevirtual #48; //Method java/io/PrintStream.println:(I)V
31: return
}
上面我们就明白了之所以JDT能编译过,只是因为JDT优化为了StringBuilder的append。
Eclipse编译器本身包含在org.eclipse.jdt.core插件中。Eclipse不会使用任何用户安装的JDK。相反,由于以下主要原因,它使用自己的JDT核心来编译Java程序:
主要原因是JDT核心具有渐进式编译的能力,这意味着它会逐步编译代码中的更改(这也是Eclipse不需要编译按钮的原因,因为它会在检测到更改时自动编译)。但Oracle的JDK不支持增量编译。
运行期String的字符串限制
String内部是以char数组的形式存储,数组的长度是int类型,那么String允许的最大长度就是Integer.MAX_VALUE了。又由于java中的字符是以16位存储的,因此大概需要4GB的内存才能存储最大长度的字符串。
总结一下
1.Java中的字符串String最大长度,编译期如果是javac编译就是65534。如果绕过javac编译的限制,其最大长度可以达到u2类型变达的最大值65535。
2.Java中的字符串String最大长度运行期大约4G。
3.Eclise编译超过65534长度的字符串不报错,是Eclipse有自己的Java编译器。JDT优化为了StringBuilder的append。
4.Eclise使用自己的编译器。主要原因是JDT核心具有渐进式编译的能力,这意味着它会逐步编译代码中的更改(这也是Eclipse不需要编译按钮的原因,因为它会在检测到更改时自动编译)。但Oracle的JDK不支持增量编译。
这篇文章特别感谢since1986、Holis
参考:https://since1986.github.io/d...
参考:https://juejin.im/post/5d5365...
若本文对你有用,有任何疑问,欢迎关注我。
**粗体** _斜体_ [链接](http://example.com) `代码` - 列表 > 引用
。你还可以使用@
来通知其他用户。