java - Buffered RandomAccessFile java

Question

RandomAccessFile は、ファイルへのランダムアクセスでは非常に低速です。その上にバッファリングされたレイヤーを実装することについてよく読んでいますが、これを行うコードはオンラインで見つけることができません。

私の質問は、このクラスのオープンソース実装を知っている皆さんは、ポインタを共有したり、独自の実装を共有したりできますか?

この質問が、この問題に関する有用なリンクとコードのコレクションとして判明するとよいでしょう。これは、多くの人が共有し、SUN によって適切に対処されることはないと確信しています。

ファイルは Integer.MAX_VALUE よりも大きくなる可能性があるため、MemoryMapping を参照しないでください。

score 13 · Accepted Answer

次のようなコードを使用して、RandomAccessFile から BufferedInputStream を作成できます。

 RandomAccessFile raf = ...
 FileInputStream fis = new FileInputStream(raf.getFD());
 BufferedInputStream bis = new BufferedInputStream(fis);

注意事項

FileInputStream を閉じると RandomAccessFile が閉じられ、その逆も同様です。
RandomAccessFile と FileInputStream は同じ位置を指しているため、FileInputStream から読み取ると RandomAccessFile のファイルポインターが進み、その逆も同様です。

おそらく、これを使用したい方法は次のようになります。

RandomAccessFile raf = ...
FileInputStream fis = new FileInputStream(raf.getFD());
BufferedInputStream bis = new BufferedInputStream(fis);

//do some reads with buffer
bis.read(...);
bis.read(...);

//seek to a a different section of the file, so discard the previous buffer
raf.seek(...);
bis = new BufferedInputStream(fis);
bis.read(...);
bis.read(...);

score 12 · Accepted Answer

ファイルが Integer.MAX_VALUE より大きい場合でも、java.nio.MappedByteBuffer を使用しない理由はわかりません。

明らかに、ファイル全体に対して単一の MappedByteBuffer を定義することは許可されません。ただし、ファイルの異なる領域にアクセスする複数の MappedByteBuffers を持つことができます。

FileChannel.map の位置とサイズの定義は long 型です。これは、Integer.MAX_VALUE を超える値を指定できることを意味します。注意しなければならないことは、バッファーのサイズがInteger.MAX_VALUE より大きくならないようにすることだけです。 .

したがって、次のようにいくつかのマップを定義できます。

buffer[0] = fileChannel.map(FileChannel.MapMode.READ_WRITE,0,2147483647L);
buffer[1] = fileChannel.map(FileChannel.MapMode.READ_WRITE,2147483647L, Integer.MAX_VALUE);
buffer[2] = fileChannel.map(FileChannel.MapMode.READ_WRITE, 4294967294L, Integer.MAX_VALUE);
...

要約すると、サイズを Integer.MAX_VALUE より大きくすることはできませんが、開始位置はファイル内のどこにでも置くことができます。

Book Java NIOで、著者の Ron Hitchens は次のように述べています。

メモリマッピングメカニズムを介してファイルにアクセスすると、チャネルを使用している場合でも、従来の方法でデータを読み書きするよりもはるかに効率的です。時間のかかる明示的なシステムコールを行う必要はありません。さらに重要なことは、オペレーティングシステムの仮想メモリシステムがメモリページを自動的にキャッシュすることです。これらのページはシステムメモリを使用してキャッシュされ、JVM のメモリヒープのスペースを消費しません。

メモリページが有効になると (ディスクから取り込まれると)、データを取得するために別のシステムコールを行う必要なく、フルハードウェアスピードで再度アクセスできます。頻繁に参照または更新されるインデックスまたはその他のセクションを含む大規模な構造化ファイルは、メモリマッピングから大きなメリットを得ることができます。クリティカルセクションを保護し、トランザクションの原子性を制御するためにファイルロックと組み合わせると、メモリマップトバッファを有効に活用できることがわかります。

サードパーティの API がそれよりも優れた機能を提供しているとは思えません。おそらく、作業を簡素化するために、このアーキテクチャの上に書かれた API を見つけるかもしれません。

このアプローチはあなたのために働くべきだと思いませんか?

score 2 · Accepted Answer

RandomAccessFileは、ファイルへのランダムアクセスには非常に時間がかかります。バッファリングされたレイヤーをその上に実装することについてよく読んでいますが、これを行うコードをオンラインで見つけることはできません。

さて、オンラインで見つけることは可能です。
1つは、jpeg2000のJAIソースコードに実装があり、さらに邪魔にならないimplが http://www.unidata.ucar.edu/software/netcdf-java/にあります。

javadocs：

http://www.unidata.ucar.edu/software/thredds/v4.3/netcdf-java/v4.0/javadoc/ucar/unidata/io/RandomAccessFile.html

score 1 · Accepted Answer

64 ビットマシンで実行している場合は、メモリマップトファイルが最適な方法です。ファイル全体を同じサイズのバッファーの配列にマップし、必要に応じて各レコードのバッファーを選択するだけです (つまり、edalorzoの答えですが、境界にまたがるレコードがないように、オーバーラップバッファーが必要です)。

32 ビット JVM で実行している場合は、RandomAccessFile. ただし、これを使用してbyte[]レコード全体を含むを読み取り、次に a を使用ByteBufferしてその配列から個々の値を取得できます。最悪の場合、2 つのファイルアクセスを行う必要があります。1 つはレコードの位置/サイズを取得するため、もう 1 つはレコード自体を取得するためです。

ただし、大量のを作成すると、ガベージコレクターに負荷がかかり始める可能性があることに注意してくださいbyte[]。また、ファイル全体をバウンスすると、IO バウンドのままになることに注意してください。

score 1 · Accepted Answer

Apache PDFBox プロジェクトには、優れたテスト済みBufferedRandomAccessFileのクラスがあります。
Apache ライセンス、バージョン 2.0 の下でライセンス供与

JavaWorld.comで Nick Zhang が説明しているように、これはjava.io.RandomAccessFileクラスの最適化されたバージョンです。jmzreader実装に基づいており、符号なしバイトを処理するように拡張されています。

ここのソースコードを参照してください：

java - Buffered RandomAccessFile java

6 に答える 6

Related

Reference