私は現在、シングル スレッド モードでファイル (非常に巨大) を読み取り、検索インデックスを作成するプログラムを持っていますが、シングル スレッド環境ではインデックス作成に時間がかかりすぎます。
現在、マルチスレッドモードで動作させようとしていますが、それを達成するための最良の方法はわかりません.
私のメイン プログラムはバッファリングされたリーダーを作成し、そのインスタンスをスレッドに渡します。スレッドはバッファリングされたリーダー インスタンスを使用してファイルを読み取ります。
各スレッドが同じ行を何度も読んでいるのではなく、これが期待どおりに機能するとは思いません。
他のスレッドが読み取らない行のみをスレッドに読み取らせる方法はありますか? ファイルを分割する必要がありますか? ファイルを分割せずにこれを実装する方法はありますか?
サンプルメインプログラム:
import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.util.ArrayList;
public class TestMTFile {
public static void main(String args[]) {
BufferedReader reader = null;
ArrayList<Thread> threads = new ArrayList<Thread>();
try {
reader = new BufferedReader(new FileReader(
"test.tsv"));
} catch (FileNotFoundException e1) {
e1.printStackTrace();
}
for (int i = 0; i <= 10; i++) {
Runnable task = new ReadFileMT(reader);
Thread worker = new Thread(task);
// We can set the name of the thread
worker.setName(String.valueOf(i));
// Start the thread, never call method run() direct
worker.start();
// Remember the thread for later usage
threads.add(worker);
}
int running = 0;
int runner1 = 0;
int runner2 = 0;
do {
running = 0;
for (Thread thread : threads) {
if (thread.isAlive()) {
runner1 = running++;
}
}
if (runner2 != runner1) {
runner2 = runner1;
System.out.println("We have " + runner2 + " running threads. ");
}
} while (running > 0);
if (running == 0) {
System.out.println("Ended");
}
}
}
スレッド:
import java.io.BufferedReader;
import java.io.IOException;
public class ReadFileMT implements Runnable {
BufferedReader bReader = null;
ReadFileMT(BufferedReader reader) {
this.bReader = reader;
}
public synchronized void run() {
String line;
try {
while ((line = bReader.readLine()) != null) {
try {
System.out.println(line);
} catch (Exception e) {
}
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}