10

log4j を a) 直接使用する場合と b) commons-logging を介して使用する場合で、ある種のクラスローディングのデッドロックが発生する状況を見つけたと思います。そのような状況が可能であるかどうか (JVM はそれを検出するべきではないでしょうか?) と、それに対して何をすべきかはわかりません。

問題

私たちのビルド システムでは、現在ユニット テストを順番に実行しています。ビルドを高速化するために、ユニット テストを並行して実行するように変更できます。ただし、そうすると、一部のビルドで実行タイムアウトが発生します。このような「ハング ビルド」のスレッド ダンプを分析すると、ほとんどの場合、さまざまなテストが含まれるさまざまなモジュールにいることがわかります。しかし、ロガーを初期化しようとするスレッドは常に 2 つに要約されLogger.getLoggerますLogFactory.getLog

私の分析

したがって、1 つのスレッド (log4j を直接使用するスレッド) がこの場所で待機しています。

"pool-1-thread-3" prio=10 tid=0x00007f6528ca6000 nid=0x6f8f in Object.wait() [0x00007f64d9ca6000]
  java.lang.Thread.State: RUNNABLE
at org.apache.log4j.LogManager.<clinit>(LogManager.java:82)
at org.apache.log4j.Logger.getLogger(Logger.java:117)
at de.is24.platform.contacts.domain.PhoneNumberFormat.<clinit>(PhoneNumberFormat.java:21)

残念ながら、これはかなり「混雑した」行です。

Hierarchy h = new Hierarchy(new RootLogger((Level) Level.DEBUG));

そして、ここで待機している別のスレッド (commons-logging を使用):

"pool-1-thread-2" prio=10 tid=0x00007f6528bf9800 nid=0x6f8e in Object.wait() [0x00007f64d9da7000]
  java.lang.Thread.State: RUNNABLE
at org.apache.log4j.Priority.<clinit>(Priority.java:45)
at java.lang.Class.forName0(Native Method)
at java.lang.Class.forName(Class.java:171)
at org.apache.commons.logging.impl.Log4JLogger.class$(Log4JLogger.java:37)
at org.apache.commons.logging.impl.Log4JLogger.<clinit>(Log4JLogger.java:45)
at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:39)
at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:27)
at java.lang.reflect.Constructor.newInstance(Constructor.java:513)
at org.apache.commons.logging.impl.LogFactoryImpl.newInstance(LogFactoryImpl.java:529)
at org.apache.commons.logging.impl.LogFactoryImpl.getInstance(LogFactoryImpl.java:235)
at org.apache.commons.logging.impl.LogFactoryImpl.getInstance(LogFactoryImpl.java:209)
at org.apache.commons.logging.LogFactory.getLog(LogFactory.java:351)

これは簡単です:

final static public Priority FATAL = new Level(FATAL_INT, "FATAL", 0);

だから私には、2番目のスレッドがクラスの初期化の過程にありPriority、クラスのロードを待っているようLevelです。最初のスレッドはおそらくクラスをロードしようとしLevel(その行の他の部分は無関係のようです)、Levelクラスが拡張されるPriorityと、クラスがロードされるのを待ちPriorityます。
ここでデッドロックが発生します。

では、この分析が正しいかどうか教えていただけますか? それとも私は何かを逃しましたか?

アップデート I

私はいくつかのテスト ケースを書きました

この問題を示すいくつかのテスト ケースがあります。

  1. TestLoadingByClassForNameデッドロックがかなり早く発生するはずです(私のマシンでは3回ごとに実行されます)
  2. TestLoadingMixed観測されたスタック トレースの最小値まで取り除かれた問題のバージョンを表します。これははるかにまれに失敗します(おおよそ4倍)
  3. TestMixedLoggerInstantiation動作を模倣します。1 つのクラスは log4j を使用してロガーをインスタンス化し、別のクラスは commons-logging を使用します。デッドロックはここでキャッチするのが難しいです。コードがはるかに多く含まれているためです。ランダムなスリープを追加する必要がありましたが、これはマシンに合わせて調整する必要があります。

TestMixedLoggerInstantiationこれは、ハングしたテスト ケースのスタック トレースです。

Full thread dump Java HotSpot(TM) 64-Bit Server VM (20.1-b02 mixed mode):

"UseLog4JLogger" prio=10 tid=0x00007fa1f017d800 nid=0x7bd8 in Object.wait() [0x00007fa1e5ba4000]
   java.lang.Thread.State: RUNNABLE
    at org.apache.log4j.LogManager.<clinit>(LogManager.java:82)
    at org.apache.log4j.Logger.getLogger(Logger.java:117)
    at net.tcc.classloading.UseLog4JLogger.run(UseLog4JLogger.java:23)

"UseCommonsLoggingLogFactory" prio=10 tid=0x00007fa1f00e5000 nid=0x7bd7 in Object.wait() [0x00007fa1e5ca4000]
   java.lang.Thread.State: RUNNABLE
    at org.apache.log4j.Priority.<clinit>(Priority.java:45)
    at java.lang.Class.forName0(Native Method)
    at java.lang.Class.forName(Class.java:169)
    at org.apache.commons.logging.impl.Log4JLogger.class$(Log4JLogger.java:37)
    at org.apache.commons.logging.impl.Log4JLogger.<clinit>(Log4JLogger.java:45)
    at sun.reflect.NativeConstructorAccessorImpl.newInstance0(Native Method)
    at sun.reflect.NativeConstructorAccessorImpl.newInstance(NativeConstructorAccessorImpl.java:39)
    at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:27)
    at java.lang.reflect.Constructor.newInstance(Constructor.java:513)
    at org.apache.commons.logging.impl.LogFactoryImpl.newInstance(LogFactoryImpl.java:529)
    at org.apache.commons.logging.impl.LogFactoryImpl.getInstance(LogFactoryImpl.java:235)
    at org.apache.commons.logging.impl.LogFactoryImpl.getInstance(LogFactoryImpl.java:209)
    at org.apache.commons.logging.LogFactory.getLog(LogFactory.java:351)
    at net.tcc.classloading.UseCommonsLoggingLogFactory.run(UseCommonsLoggingLogFactory.java:13)

"ReaderThread" prio=10 tid=0x00007fa1f00ed000 nid=0x7bd6 runnable [0x00007fa1e5da6000]
   java.lang.Thread.State: RUNNABLE
    at java.net.SocketInputStream.socketRead0(Native Method)
    at java.net.SocketInputStream.read(SocketInputStream.java:129)
    at sun.nio.cs.StreamDecoder.readBytes(StreamDecoder.java:264)
    at sun.nio.cs.StreamDecoder.implRead(StreamDecoder.java:306)
    at sun.nio.cs.StreamDecoder.read(StreamDecoder.java:158)
    - locked <0x00000007d7088a00> (a java.io.InputStreamReader)
    at java.io.InputStreamReader.read(InputStreamReader.java:167)
    at java.io.BufferedReader.fill(BufferedReader.java:136)
    at java.io.BufferedReader.readLine(BufferedReader.java:299)
    - locked <0x00000007d7088a00> (a java.io.InputStreamReader)
    at java.io.BufferedReader.readLine(BufferedReader.java:362)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner$ReaderThread.run(RemoteTestRunner.java:140)

"Low Memory Detector" daemon prio=10 tid=0x00007fa1f009d800 nid=0x7bd4 runnable [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"C2 CompilerThread1" daemon prio=10 tid=0x00007fa1f009b800 nid=0x7bd3 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"C2 CompilerThread0" daemon prio=10 tid=0x00007fa1f0098800 nid=0x7bd2 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"Signal Dispatcher" daemon prio=10 tid=0x00007fa1f0096800 nid=0x7bd1 waiting on condition [0x0000000000000000]
   java.lang.Thread.State: RUNNABLE

"Finalizer" daemon prio=10 tid=0x00007fa1f007a000 nid=0x7bd0 in Object.wait() [0x00007fa1e6c54000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x00000007d7001300> (a java.lang.ref.ReferenceQueue$Lock)
    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:118)
    - locked <0x00000007d7001300> (a java.lang.ref.ReferenceQueue$Lock)
    at java.lang.ref.ReferenceQueue.remove(ReferenceQueue.java:134)
    at java.lang.ref.Finalizer$FinalizerThread.run(Finalizer.java:159)

"Reference Handler" daemon prio=10 tid=0x00007fa1f0078000 nid=0x7bcf in Object.wait() [0x00007fa1e6d55000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x00000007d70011d8> (a java.lang.ref.Reference$Lock)
    at java.lang.Object.wait(Object.java:485)
    at java.lang.ref.Reference$ReferenceHandler.run(Reference.java:116)
    - locked <0x00000007d70011d8> (a java.lang.ref.Reference$Lock)

"main" prio=10 tid=0x00007fa1f000c000 nid=0x7bc5 in Object.wait() [0x00007fa1f50b0000]
   java.lang.Thread.State: WAITING (on object monitor)
    at java.lang.Object.wait(Native Method)
    - waiting on <0x00000007d730dfd8> (a net.tcc.classloading.UseCommonsLoggingLogFactory)
    at java.lang.Thread.join(Thread.java:1186)
    - locked <0x00000007d730dfd8> (a net.tcc.classloading.UseCommonsLoggingLogFactory)
    at java.lang.Thread.join(Thread.java:1239)
    at net.tcc.classloading.TestMixedLoggerInstantiation.test(TestMixedLoggerInstantiation.java:21)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.junit.runners.model.FrameworkMethod$1.runReflectiveCall(FrameworkMethod.java:47)
    at org.junit.internal.runners.model.ReflectiveCallable.run(ReflectiveCallable.java:12)
    at org.junit.runners.model.FrameworkMethod.invokeExplosively(FrameworkMethod.java:44)
    at org.junit.internal.runners.statements.InvokeMethod.evaluate(InvokeMethod.java:17)
    at org.junit.runners.ParentRunner.runLeaf(ParentRunner.java:271)
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:70)
    at org.junit.runners.BlockJUnit4ClassRunner.runChild(BlockJUnit4ClassRunner.java:50)
    at org.junit.runners.ParentRunner$3.run(ParentRunner.java:238)
    at org.junit.runners.ParentRunner$1.schedule(ParentRunner.java:63)
    at org.junit.runners.ParentRunner.runChildren(ParentRunner.java:236)
    at org.junit.runners.ParentRunner.access$000(ParentRunner.java:53)
    at org.junit.runners.ParentRunner$2.evaluate(ParentRunner.java:229)
    at org.junit.runners.ParentRunner.run(ParentRunner.java:309)
    at org.eclipse.jdt.internal.junit4.runner.JUnit4TestReference.run(JUnit4TestReference.java:50)
    at org.eclipse.jdt.internal.junit.runner.TestExecution.run(TestExecution.java:38)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:467)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.runTests(RemoteTestRunner.java:683)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.run(RemoteTestRunner.java:390)
    at org.eclipse.jdt.internal.junit.runner.RemoteTestRunner.main(RemoteTestRunner.java:197)

"VM Thread" prio=10 tid=0x00007fa1f0071800 nid=0x7bce runnable 

"GC task thread#0 (ParallelGC)" prio=10 tid=0x00007fa1f001f000 nid=0x7bc6 runnable 

"GC task thread#1 (ParallelGC)" prio=10 tid=0x00007fa1f0021000 nid=0x7bc7 runnable 

"GC task thread#2 (ParallelGC)" prio=10 tid=0x00007fa1f0022800 nid=0x7bc8 runnable 

"GC task thread#3 (ParallelGC)" prio=10 tid=0x00007fa1f0024800 nid=0x7bc9 runnable 

"GC task thread#4 (ParallelGC)" prio=10 tid=0x00007fa1f0026800 nid=0x7bca runnable 

"GC task thread#5 (ParallelGC)" prio=10 tid=0x00007fa1f0028000 nid=0x7bcb runnable 

"GC task thread#6 (ParallelGC)" prio=10 tid=0x00007fa1f002a000 nid=0x7bcc runnable 

"GC task thread#7 (ParallelGC)" prio=10 tid=0x00007fa1f002c000 nid=0x7bcd runnable 

"VM Periodic Task Thread" prio=10 tid=0x00007fa1f00a8800 nid=0x7bd5 waiting on condition 

JNI global references: 1168

デッドロックの再現

https://github.com/sebastiankirsch/classloadingからコードをダウンロードします。
TestLoadingByClassForNameこれは、複雑なシナリオでシステム/JVM が最終的にデッドロックに陥る前提条件です (数回実行するだけです)。

TestMixedLoggerInstantiationこれで数回実行します。平均実行時間をメモし、開いてUseLog4JLogger、スリープ タイマーの合計を平均実行時間より少し短く設定します。これにより最終的にデッドロックが発生しますが、まれにしか発生しません。

したがって、次のようにコマンド ラインで実行します。

for (( ; ; )) do
  testExectution
done

手動で組み立てる代わりtestExecutionに、テストでブレーク ボインを設定し、デバッグps -ef | grep TestMixedLoggerInstantiationし、シェルを入力して、IDE が使用するコマンドをコピーします。

4

2 に答える 2

7

最終的に、 Java 言語仕様、特に12.4.2 Detailed Initialization Procedureの章で答えを見つけました。
そこに書かれている

[...]
2) C の Class オブジェクトが、他のスレッドによって C の初期化が進行中であることを示している場合、[...]進行中の初期化が完了したことが通知されるまで、現在のスレッドをブロックします [.. .]
7) 次に、C がインターフェイスではなくクラスであり、そのスーパークラス SC がまだ初期化されていない場合、 SC に対してこの手順全体を再帰的に実行します
10) 初期化子の実行が正常に完了した場合、[...] C の Class オブジェクトに完全に初期化されたものとしてラベルを付け、待機中のすべてのスレッドに通知します [...]

したがって、観察された動作は、JLS で指定されたとおりです。このようなデッドロックを検出する手段がないことに、私はまだ少し戸惑っています。そして、スレッドがRUNNABLEとしてマークされている理由-しかし、これは実行される典型的なバイトコードではないと思うので、誰が知っていますか...

問題を解決する方法

問題の解決策は、を取り除くことでしcommons-loggingた。@Robert Johnsonが指摘したように、これは代わりに使用することで簡単org.slf4j:jcl-over-slf4jに実行できます。SLF コードもチェックしました。不運な log4j 設計を「利用」していません。

于 2013-03-26T08:33:50.617 に答える
1

あなたの分析は正しいです。
異なるクラスローダーで並行テストを実行することができます。その方法については、こちらの説明を参照してください。Surefireには未解決のバグがあり、この問題に関するJUnit グループでの議論があります。回避策として、上記のリンクで説明されているように、org.apache.myfaces.test.runners.TestPerClassLoaderRunner
を 使用できます。

于 2013-03-24T08:05:35.403 に答える