Sphinx Search Serverを使用して、非常に大きなファイル (約 14 GB) のインデックスを作成しようとしています。ファイルは空白で区切られ、1 行に 1 エントリです。
Sphinx で使用できるようにするには、xml ファイルを Sphinx サーバーに提供する必要があります。コンピューターを殺さずにそれを行うにはどうすればよいですか?
最善の戦略は何ですか?メインファイルをいくつかの小さなファイルに分割しようとする必要がありますか? それを行う最良の方法は何ですか?
注: 私は Ruby でそれを行っていますが、他のヒントに対しては完全にオープンです。
御時間ありがとうございます。