多くのソリューションが存在しますが、ここでの特異性は、ライン内で分割できるようにする必要があることです。カットはパターンの直前に発生する必要があります。元:
インファイル:
<?xml 1><blabla1>
<blabla><blabla2><blabla>
<blabla><blabla>
<blabla><blabla3><blabla><blabla>
<blabla><blabla><blabla><?xml 4>
<blabla>
<blabla><blabla><blabla>
<blabla><?xml 2><blabla><blabla>
パターンでなる必要があります<?xml
出力ファイル 1:
<?xml 1><blabla1>
<blabla><blabla2><blabla>
<blabla><blabla>
<blabla><blabla3><blabla><blabla>
<blabla><blabla><blabla>
アウトファイル 2:
<?xml 4>
<blabla>
<blabla><blabla><blabla>
<blabla>
Outfile3:
<?xml 2><blabla><blabla>
実際、ここperl
で検証された回答のスクリプトは、私の小さな例ではうまく機能します。しかし、より大きな (約 6GB) 実際のファイルに対してエラーが発生します。エラーは次のとおりです。
panic: sv_setpvn called with negative strlen at /home/.../split.pl line 7, <> chunk 1.
コメントする権限がないので、新しい投稿を開始しました。そして最後に、Python
私はそれをよりよく理解しているので、解決策はさらに高く評価されます.