-2

Java用のpdfboxを使用してpdfからファイルをスクレイピングしました。出力は次のとおりです。

Tribhuvan University

Institute of Engineering

Entrance Examination Board

BE/BArch Entrance Examination 2070

Pass List

ROLLNO NAME GENDER DISTRICT Percent Rank

1001 AADARSH        DEO MALE Saptari 51.429 3442

1002 AADARSH        MALLA MALE Bajhang 43.429 5714

1003 AADARSHA        KHANAL MALE Rupandehi 40.571 6709

リストは、各ページ [150 ページ] の最初の 6 行の繰り返しで続きます。私がする必要があるのは、Java の整数値で始まる行を選択し、整数値で始まるリストを含む新しいファイルを作成することです。

4

1 に答える 1

1

出力を別々の行に分割し、各行に .startsWith("[0-9]") を使用できます。

例えば:

// let's presume that you've loaded the lines into "List<String> lines"..

// empty ArrayList for storing the selected lines
List<String> linesToWrite = new ArrayList<>();

for(String line : lines)
{
    if(line.startsWith("[0-9]"))
    {
        linesToWrite.add(line);
    }
}
// and now write it to the other file
于 2013-10-01T10:28:07.850 に答える