java - Scannerクラスは、ファイル全体を一度にメモリにロードしますか？

Question

とても便利なので、Scannerクラスを使ってファイルを読み取ることがよくあります。

      String inputFileName;
      Scanner fileScanner;

      inputFileName = "input.txt";
      fileScanner = new Scanner (new File(inputFileName));

私の質問は、上記のステートメントはファイル全体を一度にメモリにロードしますか？または、fileScannerで次のような後続の呼び出しを行います

      fileScanner.nextLine();

ファイルから（つまり、メモリからではなく外部ストレージから）読み取りますか？ファイルが大きすぎて一度にメモリに読み込めない場合にどうなるか心配なので、質問します。ありがとう。

score 16 · Accepted Answer

ソースコードを読めば、自分で質問に答えることができます。

問題のScannerコンストラクターの実装は次のことを示しているようです。

public Scanner(File source) throws FileNotFoundException {
        this((ReadableByteChannel)(new FileInputStream(source).getChannel()));
}

後でこれはリーダーにラップされます：

private static Readable makeReadable(ReadableByteChannel source, CharsetDecoder dec) {
    return Channels.newReader(source, dec, -1);
}

そして、それはバッファサイズを使用して読み取られます

private static final int BUFFER_SIZE = 1024; // change to 1024;

構築チェーンの最後のコンストラクターでわかるように、次のようになります。

private Scanner(Readable source, Pattern pattern) {
        assert source != null : "source should not be null";
        assert pattern != null : "pattern should not be null";
        this.source = source;
        delimPattern = pattern;
        buf = CharBuffer.allocate(BUFFER_SIZE);
        buf.limit(0);
        matcher = delimPattern.matcher(buf);
        matcher.useTransparentBounds(true);
        matcher.useAnchoringBounds(false);
        useLocale(Locale.getDefault(Locale.Category.FORMAT));
    }

したがって、スキャナーはファイル全体を一度に読み取らないようです。

score 2 · Accepted Answer

コードを読むと、デフォルトで一度に1KBをロードしているように見えます。長いテキスト行の場合、バッファのサイズが大きくなる可能性があります。（テキストの最長行のサイズに）

score 1 · Accepted Answer

ACMコンテストでは、高速読み取りが非常に重要です。Javaでは、そのようなものを使用すると非常に高速であることがわかりました...

    FileInputStream inputStream = new FileInputStream("input.txt");
    InputStreamReader streamReader = new InputStreamReader(inputStream, "UTF-8");
    BufferedReader in = new BufferedReader(streamReader);
    Map<String, Integer> map = new HashMap<String, Integer>();
    int trees = 0;
    for (String s; (s = in.readLine()) != null; trees++) {
        Integer n = map.get(s);
        if (n != null) {
            map.put(s, n + 1);
        } else {
            map.put(s, 1);
        }
    }

その場合、ファイルにはツリー名が含まれます...

Red Alder
Ash
Aspen
Basswood
Ash
Beech
Yellow Birch
Ash
Cherry
Cottonwood

forを使用してStringTokenizer、必要な行の任意の部分をキャッチできます。

Scanner大きなファイルに使用すると、エラーが発生します。10000行のファイルから100行を読み取ってください！

スキャナーは、Readableインターフェースを実装する任意のオブジェクトからテキストを読み取ることができます。基になるreadableのReadable.read（java.nio.CharBuffer）メソッドの呼び出しがIOExceptionをスローした場合、スキャナーは入力の終わりに到達したと見なします。基になる読み取り可能オブジェクトによってスローされた最新のIOExceptionは、ioException（）メソッドを介して取得できます。

APIで通知します

幸運を！

score 0 · Accepted Answer

大きなファイルには、 BufferedReaderとFileReaderのようなものを使用することをお勧めします。基本的な例はここにあります。

java - Scannerクラスは、ファイル全体を一度にメモリにロードしますか？

4 に答える 4

Related

Reference