Python マルチプロセッシングを使用して、プロセスごとに一時出力ファイルを生成しています。それらのサイズは数 GB になる可能性があり、私はこれらを数十個作成します。これらの一時ファイルは、目的の出力を形成するために連結する必要があり、これがボトルネック (および並列処理キラー) であることが証明されているステップです。ファイルシステムのメタデータを変更して連結ファイルを作成し、実際にはコンテンツをコピーしない Linux ツールはありますか? 私が受け入れられるLinuxシステムで動作する限り。しかし、ファイル システム固有のソリューションはあまり役に立ちません。
私はOSまたはCSのトレーニングを受けていませんが、理論的には、新しいiノードを作成し、コピー元のファイルのiノードからiノードポインター構造をコピーして、それらのiノードのリンクを解除できるはずです。これを行うユーティリティはありますか?十分に考え抜かれた UNIX ユーティリティが豊富にあることを考えると、そうなることを完全に期待していましたが、何も見つかりませんでした。したがって、SOに関する私の質問。この情報が重要な場合に備えて、ファイルシステムは実際にはハードディスクであるブロックデバイス上にあります。これまでにシステム レベルのプログラミングを行ったことがないので、これを自分で書く自信はありません。そのため、(C/Python コード スニペットへの) ポインタは非常に役立ちます。