16

短縮版

何かがクリーンアップされる前に、最初のチャンスの StackOverflowException で完全なメモリ ダンプを実行し、他のすべての例外の種類を無視する ADPlus スクリプトが必要です。

ログバージョン

新しい ASP.NET コードのリリース後、断続的な StackOverflowExceptions が発生するようになりました。前回の既知の正常なインストール以降に追加されたリビジョンで、無限の再帰とすべての通常の疑わしいものを探しましたが、何も見つかりません。Web サイトは最大 1 時間実行された後、クラッシュします。

WinDbg と SOS を使用し、次のコマンドを使用して、ADPlus を使用してクラッシュ ログを取得しようとしました。

adplus -crash -o D:\Crash -NoDumpOnFirst -iis

-NoDumpOnFirst の理由は、ビジー状態のサーバー上でのみこのエラーを再現できるためです。最初の例外が発生するたびにミニダンプを実行するために (まあ、それは起こります)、デバッガーは IIS ワーカー プロセスを一時停止して 16 MB のファイルを書き出す必要があるため、要求がキューに入れられ、アプリケーションが不安定になります。エラーが頭をもたげるのに最大 1 時間かかる場合があるため、これは問題です。

したがって、-NoDumpOnFirst を使用すると、WinDbg がこれらのスレッドを出力するダンプ ファイルを取得します。

PDB symbol for mscorwks.dll not loaded
ThreadCount: 69
UnstartedThread: 0
BackgroundThread: 69
PendingThread: 0
DeadThread: 0
Hosted Runtime: no
                                      PreEmptive   GC Alloc           Lock
       ID OSID ThreadOBJ    State     GC       Context       Domain   Count APT Exception
XXXX    1  c6c 000fa758  11808221 Disabled 3b49ee4c:3b49efe8 00120888     1 Ukn (Threadpool Worker)
XXXX    2 1294 000fd258      b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Finalizer)
XXXX    3 1eb0 0011cdd0    80a220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Completion Port)
XXXX    4 1b3c 00120198      1220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX    5 1280 00138118   880a220 Enabled  2633de9c:2633ee08 000df4e0     0 Ukn (Threadpool Completion Port)
XXXX    6 1db8 00158a48  1180a221 Disabled 4b5a7e2c:4b5a82e8 00120888     1 Ukn (Threadpool Worker)
XXXX    9 141c 00162008   180a220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX    7 1574 00174008   180a220 Enabled  4d46b6a8:4d46c158 00120888     2 Ukn (Threadpool Worker)
XXXX    c 16c8 0016b7a8   180a220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX    8 1384 00162878   180a220 Enabled  284e26a4:284e45d8 000df4e0     0 Ukn (Threadpool Worker)
XXXX    b 1c10 0016b3d8   180a220 Enabled  3ed2dae0:3ed2dfe8 00120888     2 Ukn (Threadpool Worker)
XXXX    a 1814 0016b008   180a220 Disabled 28816384:28816638 00120888     1 Ukn (Threadpool Worker)
XXXX    d  1fc 1b4d1ff0       220 Enabled  319f89a4:319fa41c 000df4e0     0 Ukn
XXXX    e 1864 1b4e3d20   180b220 Enabled  4b2c5be0:4b2c6150 000df4e0     0 Ukn (Threadpool Worker)
XXXX    f 13bc 1b57caf8   200b220 Enabled  4cc71584:4cc73414 00120888     1 Ukn
XXXX   10  72c 1f5124a8   180b220 Enabled  3b4b3414:3b4b4fe8 00120888     2 Ukn (Threadpool Worker)
XXXX   11 1fd0 1f526398   180b220 Disabled 4d46f41c:4d470158 00120888     1 Ukn (Threadpool Worker)
XXXX   12 1f10 1f52f1c8   180b220 Enabled  28812c14:28814638 00120888     2 Ukn (Threadpool Worker)
XXXX   13 1b84 1f53a420       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   14 18a4 1f570978   180b220 Enabled  263e18b4:263e2e28 000df4e0     0 Ukn (Threadpool Worker)
XXXX   15 1a98 1f57f0a0   180b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX   16  1b4 1f583628   180b220 Enabled  495781ec:4957914c 00120888     2 Ukn (Threadpool Worker)
XXXX   17  b90 1f585dc8   180b220 Enabled  265cbe48:265ccba4 000df4e0     0 Ukn (Threadpool Worker)
XXXX   18 1590 1f613c60       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   19 1850 1f5fad90       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   1a  c78 1f60d3f0       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   1c 1bd8 2121f1b0       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   1d  494 1b4a8c10       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   1e  898 2120f120       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   1f 1820 21355ff8       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   20 15b0 3570e120       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   21 18b0 359ca008       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   22  75c 35a58948       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   25 1a18 213ac8f8   880b220 Disabled 3219a830:3219b450 00120888     1 Ukn (Threadpool Completion Port) System.StackOverflowException (0e3200a4)
XXXX   29 1b74 3598e620   180b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX   2a  9b8 3598dbe0   180b220 Enabled  2880ef2c:28810638 000df4e0     0 Ukn (Threadpool Worker)
XXXX   2b 1eac 1f6f6288   180b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX   2d  2f4 211759e8   180b220 Disabled 2634eacc:2634ee08 00120888     1 Ukn (Threadpool Worker)
XXXX   2e 1e3c 35c2eb60   880b220 Enabled  4b5a5758:4b5a62e8 000df4e0     0 Ukn (Threadpool Completion Port)
XXXX   30  394 35c394f8   180b220 Enabled  4cef7930:4cef90d4 000df4e0     0 Ukn (Threadpool Worker)
XXXX   31 1e64 35c39128   180b220 Disabled 288110b0:28812638 00120888     1 Ukn (Threadpool Worker)
XXXX   32 1af8 35a58578   180b220 Enabled  3b48e7cc:3b48efe8 000df4e0     0 Ukn (Threadpool Worker)
XXXX   34 1d44 1f6a6c88   180b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX   35 197c 212088e0   180b220 Enabled  49389ba8:4938af40 000df4e0     0 Ukn (Threadpool Worker)
XXXX   36 1e2c 35c1d980       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   38 1ddc 212d03d8       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   39  288 212d0008       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   3a 1694 212bf958       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   3b  be4 212ccc40       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   37  ccc 35c4d6d0       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   3c 14ec 35c55af0       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   41 1d94 35c38c08   180b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX   24  130 35746a50   180b220 Enabled  2670ae48:2670cc00 000df4e0     0 Ukn (Threadpool Worker)
XXXX   2f 1404 35c1d350   180b220 Enabled  00000000:00000000 000df4e0     0 Ukn (Threadpool Worker)
XXXX   43 1ae8 35c25cb8   180b220 Disabled 3b4c28e0:3b4c2fe8 00120888     1 Ukn (Threadpool Worker)
XXXX   44 18ac 212cc870   180b220 Disabled 4957e728:4957f14c 00120888     1 Ukn (Threadpool Worker)
XXXX   45 18b4 212bf588   180b220 Disabled 3b4c05dc:3b4c0fe8 00120888     1 Ukn (Threadpool Worker)
XXXX   46 1c0c 21239858       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   47  4fc 21188b68       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   48 1198 35caa2a8       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   49 1f9c 21147af8       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   4a 1adc 35cc6908       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   4b  ce8 35c60e30       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   4d  6f0 35d05aa0       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   4e 1ee8 35c1b6b0       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   42 1d7c 35d9a230       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   3d  7d8 212e1b28       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   23  c0c 503ea010       220 Enabled  00000000:00000000 000df4e0     0 Ukn
XXXX   27 1f44 503cdf08       220 Enabled  00000000:00000000 000df4e0     0 Ukn

例外を出力しようとすると、スタック トレースがないことが示され、他のメソッドはそれがアンマネージ コードであると不平を言います。私の推測では、プロセスの終了時にダンプが作成されるため、すべてのスレッドがガベージ コレクションされており、取得する情報は残っていません。

デバッガーが StackOverflowException の最初のチャンスで完全なダンプを実行し、他のすべての例外の種類を無視することを本当に望んでいます。ADPlus が構成ファイル ( http://msdn.microsoft.com/en-us/library/cc409304.aspx )を使用できることは知っていますが、形式はすべてギリシャ語です。これを行う ADPlus スクリプトの作成方法を教えてもらえますか?

...もちろん、上記のスレッド リストを見て何が問題なのかを正確に把握している場合、または私がさらに情報を提供すればそれを理解できる場合は、それも教えてください。

解決の試み 1

以下の答えをありがとうdeemok、それは完全には正しくありませんでしたが、それは私を正しい方向に押し上げました. スタック オーバーフローの例外コードが間違っていた (sbo ではなく sov である) (または、当時はそう思っていたので、以下の deemok の編集を参照)、次の構成でデバッグを試みました。

<ADPlus>
   <!-- Add log entry, log faulting thread stack and dump full on first chance StackOverflow -->
<Exceptions>
     <Config>
        <!-- This is for the StackOverflow exception -->
       <Code> sbo </Code>
       <Actions1> Log;Stack;FullDump </Actions1>
       <!-- Depending on what you intend - either stop the debugger (Q or QQ) or continue unhandled (GN) -->
       <ReturnAction1> GN </ReturnAction1>
     </Config>
  </Exceptions>
</ADPlus>

そして、次のコマンドを使用します。

adplus -crash -o D:\Crash -NoDumpOnFirst -c D:\Crash\stackoverflow.cfg -iis

出力されたログ ファイルが正しい構成を示していることを確認しました。秘訣は、adplus のコマンド ライン パラメータが順番に実行されることです。そのため、初回例外をトラップする構成から開始してから -NoDumpOnFirst を適用すると、構成設定が上書きされます。-c last を指定して構成を適用すると、その設定が優先されます。

しかし、最終的に、スタック オーバーフローはキャッチ不能であることが判明しました。スタック オーバーフローが発生し、メモリ ダンプが取得できず、2 回目のプロセス終了イベントでダンプが発生し、再びすべてがガベージ コレクションされて、有用な情報が得られませんでした。

スタック オーバーフローに関与してオーバーライドしている場合に備えて、プロセス終了例外を短絡しようとしましたが、例外が発生し、メモリ ダンプが得られませんでした。

幸いなことに、コードを調べて答えを見つけました。もちろん、これは循環メソッド呼び出しのケースでした。

実際の解像度

この問題はかなり前に解決されていましたが、スタック オーバーフローを引き起こす ASP.NET ページをすぐに作成しました。(結局のところ、それは難しいことではありません)そして、以下のAxlの応答を試しました.

XML が少しずれて</ADPlus>いました。Axl はタグを閉じるのを忘れていました (または、おそらくコピーと貼り付けで失われました)。しかし、それは簡単に修正でき、adplus は親切にも何が問題なのかを正確に教えてくれました。

そのスクリプトをテスト スタック オーバーフロー スローアーに対して設定し、結果を windbg にロードしました。!clrstack を呼び出すと、相互に循環的に呼び出しているメソッドの非常に明確な (そして長い) リストが得られました。これで問題が一瞬で見つかりました!次回スタック オーバーフローが発生したときのために、このページをブックマークしておきます。

4

2 に答える 2

12

これが他の誰かを助けるかもしれない場合に備えて、以下は私が思いついたADPlus構成ファイルです。今見ると、 !runaway に効果があるかどうかわかりません。StackOverflowException をスローする ASP.NET アプリが実行されているときにアタッチされ、指定された OutputDir に "1st chance StackOverflow full" および "1st chance Process Shut Down full" .dmp ファイルが生成されます。最初のファイルをWindbgで開き、「.loadby sos mscorwks」を実行してから「!clrstack」を実行し、スタック オーバーフローの原因を確認します。

<ADPlus>
<Settings>
    <RunMode>CRASH</RunMode>
    <OutputDir>C:\Dumps</OutputDir>
    <ProcessName>w3wp.exe</ProcessName> 
</Settings>
<Exceptions>
    <Option>FullDumpOnFirstChance</Option>
    <Option>MiniDumpOnSecondChance</Option>
    <Option>NoDumpOnFirstChance</Option>
    <Option>NoDumpOnSecondChance</Option>
    <Config>
        <Code>AllExceptions</Code>
        <Actions1>Void</Actions1>
        <Actions2>Void</Actions2>
        <ReturnAction1>GN</ReturnAction1>
        <ReturnAction2>GN</ReturnAction2>
    </Config>       
    <Config>
        <!--
        av = AccessViolation
        ch = InvalidHandle
        ii = IllegalInstruction
        dz =  IntegerDivide
        c000008e = FloatingDivide
        iov = IntegerOverflow
        lsq = InvalidLockSequence
        sov = StackOverflowException
        eh = CPlusPlusEH
        * = UnknownException
        clr = NET_CLR
        bpe = CONTRL_C_OR_Debug_Break
        ld = DLL_Load
        ud = DLL_UnLoad
        epr = Process_Shut_Down
        sbo = Stack_buffer_overflow
        -->
        <Code>sov;sbo</Code>
        <Actions1>Log;Time;Stack;FullDump;EventLog</Actions1>
        <CustomActions1>!runaway</CustomActions1>
        <Actions2>Log;Time;Stack;FullDump;EventLog</Actions2>
        <CustomActions2>!runaway</CustomActions2>
        <!--
        G = go
        GN = go unhandled exception
        GH = go handled exception
        Q = quit
        QD = quit and detach
        -->
        <ReturnAction1>GN</ReturnAction1>
        <ReturnAction2>GN</ReturnAction2>
    </Config>
    <Config>
        <Code>clr</Code>
        <Actions1>Void</Actions1>
        <Actions2>Log;Time;Stack;FullDump;EventLog</Actions2>
        <ReturnAction1>GN</ReturnAction1>
        <ReturnAction2>GN</ReturnAction2>
    </Config>
    <Config>
        <Code>epr</Code>
        <Actions1>Log;Time;Stack;FullDump;EventLog</Actions1>
        <Actions2>Void</Actions2>
        <ReturnAction1>GN</ReturnAction1>
        <ReturnAction2>GN</ReturnAction2>
    </Config>
</Exceptions>
</ADPlus>
于 2009-06-24T21:38:39.163 に答える
3
<ADPlus>
   <!-ログエントリを追加し、障害のあるスレッドスタックをログに記録し、最初のチャンスで完全にダンプしますStackOverflow->
<例外>
     <構成>
        <!-これはスタックバッファオーバーフロー例外用です->
        <!-スタックオーバーフロー例外にsovを使用->
       <コード>sbo</コード>
       <Actions1> Log; Stack; FullDump </ Actions1>
       <!-目的に応じて-デバッガーを停止するか(QまたはQQ)、未処理のまま続行します(GN)->
       <ReturnAction1> GN </ ReturnAction1>
     <構成>
  </例外>
</ ADPlus>

それをstackoverflow.cfgに保存すると、次の
ことができます。

adplus -c stackoverflow.cfg

編集:sovsboはどちらもスタックオーバーフローの例外です。両者の違いがはっきりしないので、両方を試してみる必要があると思います。(sboは無効なalloca()呼び出しを示している可能性がありますか?)

于 2009-05-07T07:40:54.620 に答える