非常に大きなxmlファイル(1.25 GB)があり、それらを処理できるようにするには、小さなファイルに分割する必要があります。このファイルには、タグが先頭と末尾にある言語データが含まれています。
<text id = "www.example.com>
と
</ text>
これらのタグで大きなファイルを分割したいと思います。たとえば、
<text id = "www.example.com>
こんにちは
</ text>
<text id = "www.example.com>
これは
</ text>
<text id = "www.example.com>
例
</ text>
基本的に3つの異なるファイルになります。開始と終了は「テキスト」タグでマークされます。例えば:
ファイル1
<text id = "www.example.com>
こんにちは
</ text>
ファイル2
<text id = "www.example.com>
これは
</ text>
ファイル3
<text id = "www.example.com>
例
</ text>
たとえば、これはPerlでスクリプトを作成することで実行できると思いますが、UNIXを使用してこのファイルを分割する「ワンストップショップ」の方法があるかどうか疑問に思っています。
splittingコマンドは、行やファイルサイズに応じて、大きなファイルを小さなファイルに分割するのに便利です。ただし、xmlタグによる分割を許可する同様のコマンドはありますか?
助けてくれてありがとう!