区切りファイルに変換する必要のあるテキストファイルダンプがあります。このファイルには、次のようにフォーマットされた一連の「レコード」(より適切な単語がないため)が含まれています。
User: abc123
Date: 7/3/12
Subject: the foo is bar
Project: 123456
Problem: foo bar in multiple lines of text
Resolution: foo un-barred in multiple lines of text
User: abc123
Date: 7/3/12
Subject: the foo is bar
Project: 234567
Problem: foo bar in multiple lines of text
Resolution: foo un-barred in multiple lines of text
...
私の最終結果は、区切られた値のフラットファイルを取得することです。上記のレコードを使用すると、次のようになります。
abc123;7/3/12;the foo is bar;123456;foo bar in multiple lines of text;foo un-barred in multiple lines of text
abc123;7/3/12;the foo is bar;234567;foo bar in multiple lines of text;foo un-barred in multiple lines of text
コードが下に表示され、その後、私が経験している問題が発生します。
import java.util.*;
import java.io.*;
import java.nio.file.*;
//
public class ParseOutlookFolderForSE
{
public static void main(String args[])
{
String user = "";
String PDLDate = "";
String name = "";
String PDLNum = "";
String problemDesc = "test";
String resolutionDesc = "test";
String delim = ";";
int recordCounter = 0;
//
try
{
Path file = Paths.get("testfile2.txt");
FileInputStream fstream = new FileInputStream("testfile2.txt");
// Get the object of DataInputStream
/* DataInputStream in = new DataInputStream(fstream); */
BufferedReader br = new BufferedReader(new InputStreamReader(fstream)); //Buffered Reader
String inputLine = null; //String
StringBuffer theText = new StringBuffer(); //StringBuffer
// problem: output contains last record ONLY. program is cycling through the entire file, overwriting records until the end.
// add a for loop based on recordCounter
for(recordCounter=0;recordCounter<10;recordCounter++)
{
while((inputLine=br.readLine())!=null)
{
if(inputLine.toLowerCase().startsWith("from:"))
{
/* recordCounter = recordCounter++; */ // commented out when I added recordCounter++ to the for loop
user = inputLine.trim().substring(5).trim();
}
else
if(inputLine.toLowerCase().startsWith("effective date"))
{
PDLDate = inputLine.trim().substring(15).trim();
}
else
if(inputLine.toLowerCase().startsWith("to:"))
{
name = inputLine.trim().substring(3).trim();
}
else
if(inputLine.toLowerCase().startsWith("sir number"))
{
PDLNum = inputLine.trim().substring(12).trim();
}
} //close for loop
} // close while
System.out.println(recordCounter + "\n" + user + "\n" + name + "\n" + PDLNum + "\n" + PDLDate + "\n" + problemDesc + "\n" + resolutionDesc);
System.out.println(recordCounter + ";" + user + ";" + name + ";" + PDLNum + ";" + PDLDate + ";" + problemDesc + ";" + resolutionDesc);
String lineForFile = (recordCounter + ";" + user + ";" + name + ";" + PDLNum + ";" + PDLDate + ";" + problemDesc + ";" + resolutionDesc + System.getProperty("line.separator"));
System.out.println(lineForFile);
try
{
BufferedWriter out = new BufferedWriter(new FileWriter("testfileoutput.txt"));
out.write(lineForFile);
out.close();
}
catch (IOException e)
{
System.out.println("Exception ");
}
} //close try
catch (Exception e)
{
System.err.println("Error: " + e.getMessage());
}
}
}
私の最終的な出力は最後のレコードだけです。何が起こっているのかというと、プログラムはすべての行を読み取っていますが、最後の行だけが次のレコードで上書きされないということだと思います。理にかなっています。そこで、FOR
ループを追加し、1ずつインクリメントif(inputLine.toLowerCase().startsWith("user:"))
し、データとともにカウンター変数を出力して、何が起こっているかを検証しました。
私のループは、擬似コードのステップ3の後、ステートメントのFOR
後BufferedReader
、前に始まります。IF
手順6でファイルに書き込んだ後、終了します。使用してfor(recCounter=0;recCounter<10;recCounter++)
おり、出力ファイルに10個のレコードがありますが、これらはすべて、0〜9の番号が付けられた入力ファイルの最後のレコードのインスタンスです。
forループを同じ場所に残して、ステートメント内に'増分を読み取りfor(recCounter=0;recCounter<10;)
、配置するように変更しました。行が。で始まるたびに増分します。この場合、出力ファイルにも10個のレコードがあり、それらは入力ファイルの最後のレコードの10個のインスタンスであり、すべてのカウンターは0です。recCounter
IF
User:
編集:ファイルがどのようにフォーマットされているかを考えると、次からw = oneレコードを決定する唯一の方法は、行の先頭にある「User:」という単語の後続のインスタンスです。発生するたびに、次に発生するまで、単一のレコードを構成します。
「recCounter」を適切に設定していないか、「新しいレコードを開始」として設定されている結果を解釈していないように見えます。
このファイルを複数のレコードとして読み取る方法について誰か提案がありますか?