Java线程内存泄漏
我试图在我正在编写的程序中为某些任务并行性实现多线程。 该计划使用Spring框架并在Pivotal Cloud Foundry上运行。 它偶尔会崩溃,所以我进去查看了日志和性能指标; 这是当我发现它有内存泄漏。 在进行一些测试后,我将线人的实施范围缩小到了罪魁祸首。 我对JVM中的GC的理解是,它不会处理未死的线程,也不会处理任何仍在被另一个对象或后面的可执行代码行引用的对象。 然而,我并没有对线程进行任何引用,如果我这样做,它声称一旦它完成运行就将自己置于死亡状态,所以我不知道是什么导致了泄漏。
我写了一个干净的PoC来证明泄漏。 它使用了一个休息控制器,所以我可以控制线程的数量,一个可运行的类,因为我的真实程序需要参数,并且一个字符串占用了内存中的任意空间,这些空间将被真实程序中的其他字段占用(使得泄漏更多表观的)。
package com.example;
import org.springframework.web.bind.annotation.RequestMapping;
import org.springframework.web.bind.annotation.RequestParam;
import org.springframework.web.bind.annotation.RestController;
@RestController
public class LeakController {
@RequestMapping("/Run")
public String DoWork(@RequestParam("Amount") int amount, @RequestParam("Args") String args)
{
for(int i = 0; i < amount; i++)
new Thread(new MyRunnable(args)).start();
return "Workin' on it";
}
public class MyRunnable implements Runnable{
String args;
public MyRunnable(String args){ this.args = args; }
public void run()
{
int timeToSleep = Integer.valueOf(args);
String spaceWaster = "";
for (int i = 0; i < 10000; i ++)
spaceWaster += "W";
System.out.println(spaceWaster);
try {Thread.sleep(timeToSleep);} catch (InterruptedException e) {e.printStackTrace();}
System.out.println("Done");
}
}
}
任何人都可以解释为什么这个程序泄漏内存?
编辑:我已经收到了一些关于字符串赋值vs字符串构建和字符串池的响应,所以我将我的代码更改为以下内容
int[] spaceWaster = new int[10000];
for (int i = 0; i < 10000; i ++)
spaceWaster[i] = 512;
System.out.println(spaceWaster[1]);
它仍然泄漏。
编辑:在获取一些实际的数字来回应Voo与我注意到一些有趣的事情。 调用新线程开始吃内存,但只是一个点。 在永久增长大约60mb后,新的基于整数的程序停止增长,无论它被推动多么困难。 这是否与Spring框架分配内存的方式有关?
我也认为回到String示例是有好处的,因为它更接近我的真实用例; 这是对传入的JSON执行正则表达式操作,每秒数百个这样的JSON。 考虑到这一点,我已将代码更改为:
@RestController
public class LeakController {
public static String characters[] = {
"1","2","3","4","5","6","7","8","9","0",
"A","B","C","D","E","F","G","H","I","J","K","L","M",
"N","O","P","Q","R","S","T","U","V","W","X","Y","Z"};
public Random rng = new Random();
@RequestMapping("/Run")
public String GenerateAndSend(@RequestParam("Amount") int amount)
{
for(int i = 0; i < amount; i++)
{
StringBuilder sb = new StringBuilder(100);
for(int j = 0; j< 100; j++)
sb.append(characters[rng.nextInt(36)]);
new Thread(new MyRunnable(sb.toString())).start();
System.out.println("Thread " + i + " created");
}
System.out.println("Done making threads");
return "Workin' on it";
}
public class MyRunnable implements Runnable{
String args;
public MyRunnable(String args){ this.args = args; }
public void run()
{
System.out.println(args);
args = args.replaceAll("d+", "[Number was here]");
System.out.println(args);
}
}
}
这个新的应用程序表现出与整数示例类似的行为,因为它永久增长了大约50MB(在2000个线程之后),并且从那里逐渐减少,直到我无法注意到每个新的1000线程的线程(大约85mb的原始部署内存) 。
如果我改变它来删除stringbuilder:
String temp = "";
for(int j = 0; j< 100; j++)
temp += characters[rng.nextInt(36)];
new Thread(new MyRunnable(temp)).start();
它无限期地泄漏; 我假设所有36 ^ 100字符串一旦产生就会停止。
综合这些发现,我想我的真正问题可能是字符串池的问题,也是Spring如何分配内存的问题。 我仍然不明白的是,在我的真实应用程序中,如果我在主线程上创建一个runnable并调用run(),内存似乎不会突然增加,但如果我创建一个新线程并给它一个runnable,那么内存跳转。 下面是我正在构建的应用程序中可运行的内容:
public class MyRunnable implements Runnable{
String json;
public MyRunnable(String json){
this.json = new String(json);
}
public void run()
{
DocumentClient documentClient = new DocumentClient (END_POINT,
MASTER_KEY, ConnectionPolicy.GetDefault(),
ConsistencyLevel.Session);
System.out.println("JSON : " + json);
Document myDocument = new Document(json);
System.out.println(new DateTime().toString(DateTimeFormat.forPattern("MM-dd-yyyy>HH:mm:ss.SSS"))+">"+"Created JSON Document Locally");
// Create a new document
try {
//collectioncache is a variable in the parent restcontroller class that this class is declared inside of
System.out.println("CollectionExists:" + collectionCache != null);
System.out.println("CollectionLink:" + collectionCache.getSelfLink());
System.out.println(new DateTime().toString(DateTimeFormat.forPattern("MM-dd-yyyy>HH:mm:ss.SSS"))+">"+"Creating Document on DocDB");
documentClient.createDocument(collectionCache.getSelfLink(), myDocument, null, false);
System.out.println(new DateTime().toString(DateTimeFormat.forPattern("MM-dd-yyyy>HH:mm:ss.SSS"))+">"+"Document Creation Successful");
System.out.flush();
currentThreads.decrementAndGet();
} catch (DocumentClientException e) {
System.out.println("Failed to Upload Document");
e.printStackTrace();
}
}
}
任何想法,我真正的泄漏是? 有什么地方我需要一个字符串生成器? 字符串只是做有趣的记忆,我需要给它更高的天花板伸展到那么它会好吗?
编辑:我做了一些基准测试,所以我可以真实地描绘行为,以便更好地理解GC在做什么
00000 Threads - 457 MB
01000 Threads - 535 MB
02000 Threads - 545 MB
03000 Threads - 549 MB
04000 Threads - 551 MB
05000 Threads - 555 MB
2 hours later - 595 MB
06000 Threads - 598 MB
07000 Threads - 600 MB
08000 Threads - 602 MB
它似乎是渐近的,但我最感兴趣的是,当我参加会议和吃午餐时,它决定自己增加40mb。 我查看了我的团队,在此期间没有人使用该应用程序。 不知道该怎么做
这是因为你不断添加String。 Java不自动使用GC字符串池
Java字符串池
String spaceWaster = "";
for (int i = 0; i < 10000; i ++)
spaceWaster += "W";
改用StringBuilder
使用stringbuilder
是正确的
不要以为你需要2000线程。
更好的设计可能是一个Queue
的任务(串/文档)和thread pool
来处理字符串/文档。