sed - 何千ものxmlファイルをawkで解析します

Question

私は数千のファイルを持っていますが、それぞれに非常に長い行が1つしか含まれていません。

IDフィールドで1行に1つのエントリを分割して、すべてを1つのファイルに変換したいのですが、これはいくつかのファイルで機能しますが、数百のファイルでは時間がかかりすぎ、数千のファイルではクラッシュするようです。無制限のより速い方法を探しています。

(find -type f -name '*.xml' -exec cat {} \;) | awk '{gsub("ID","\nID");printf"%s",$0}'

私もこれを試しました。

(find -type f -name '*.xml' -exec cat {} \;) | sed 's/ID/\nID/g'

問題は、挿入の代わりに置換を使用しようとしていること、またはメモリを使いすぎていることだと思います。

ありがとう

score 2 · Accepted Answer

cat何千ものファイルでテストすることはできませんが、で処理する前にすべてのデータをメモリに保存する代わりに、次のように、一度にいくつかのファイルでawk実行してみてください。awk

find . -type f -name "*.xml*" -exec awk '{gsub("ID","\nID");printf"%s",$0}' {} +

score 1 · Accepted Answer

2 に答える 2