STモナド内での実行中に最大280Mのログテキストデータを生成するHaskellプログラムがあります。これは、事実上すべてのメモリ消費が発生する場所です (ロギングを無効にすると、プログラムは合計 3MB の実メモリを割り当てます)。
問題は、メモリが不足していることです。プログラムの実行中にメモリ消費量が 1.5GB を超え、ログ文字列をファイルに書き込もうとすると、最終的にメモリが不足します。
ログ関数は文字列を受け取り、環境内の STRef に格納されている文字列ビルダーにログ データを蓄積します。
import qualified Data.ByteString.Lazy.Builder as BB
...
myLogFunction s = do
...
lift $ modifySTRef myStringBuilderRef (<> BB.stringUtf8 s)
強打パターンやmodifySTRef'を使って厳密性を導入してみましたが、メモリ消費がさらに悪化しました。
次のように、hPutBuilder のドキュメントで推奨されているように、ログ文字列を書き込みます。
hSetBinaryMode h True
hSetBuffering h $ BlockBuffering Nothing
BB.hPutBuilder h trace
これにより、さらに数 GB のメモリが消費されます。さまざまなバッファリング設定を試し、最初に遅延 ByteString に変換しました (少し改善されました)。
質問:
プログラムの実行中にメモリ消費を最小限に抑えるにはどうすればよいですか? 厳密な ByteString 表現と適切な量の厳密さを考えると、保存している実際のログ データの ~280M よりも少し多くのメモリが必要になると予想されます。
メモリを割り当てずに結果をファイルに書き込むにはどうすればよいですか? 常駐データをファイルにストリーミングするだけで、Haskell が何 GB ものメモリを必要とする理由がわかりません。
編集:
小規模な実行 (最大 42 MB のログ データ) のメモリ プロファイルを次に示します。ロギングを無効にした場合、合計メモリ使用量は 3MB です。
15,632,058,700 bytes allocated in the heap
4,168,127,708 bytes copied during GC
343,530,916 bytes maximum residency (42 sample(s))
7,149,352 bytes maximum slop
931 MB total memory in use (0 MB lost due to fragmentation)
Tot time (elapsed) Avg pause Max pause
Gen 0 29975 colls, 0 par 5.96s 6.15s 0.0002s 0.0104s
Gen 1 42 colls, 0 par 6.01s 7.16s 0.1705s 1.5604s
TASKS: 3 (1 bound, 2 peak workers (2 total), using -N1)
SPARKS: 0 (0 converted, 0 overflowed, 0 dud, 0 GC'd, 0 fizzled)
INIT time 0.00s ( 0.00s elapsed)
MUT time 32.38s ( 33.87s elapsed)
GC time 11.97s ( 13.31s elapsed)
RP time 0.00s ( 0.00s elapsed)
PROF time 0.00s ( 0.00s elapsed)
EXIT time 0.00s ( 0.00s elapsed)
Total time 44.35s ( 47.18s elapsed)
Alloc rate 482,749,347 bytes per MUT second
Productivity 73.0% of total user, 68.6% of total elapsed
編集:
求められたように、小さなログを実行してメモリ プロファイルを実行しました。
プロフィール http://imageshack.us/a/img14/9778/6a5o.png
該当箇所にバンパターン、$!、deepseq/$!!、force などを入れてみましたが、あまり変わらないようです。これらすべての [Char] リストと未評価のサンクを保持する代わりに、Haskell に実際に文字列/printf 式などを取得させ、それをタイトな ByteString に入れるにはどうすればよいですか?
編集:
これが実際の完全なトレース機能です
trace s = do
enable <- asks envTraceEnable
when (enable) $ do
envtrace <- asks envTrace
let b = B8.pack s
lift $ b `seq` modifySTRef' envtrace (<> BB.byteString b)
これは「厳密」で十分ですか?ReaderT/ST モナド内でこの型クラス関数を呼び出す場合、何か注意する必要がありますか? 実際に呼び出され、決して延期されないようにするためです。
do
trace $ printf "%i" myint
結構です?
ありがとう!