java - Javaでフラットファイルから複数のレコードを読み取る

Question

区切りファイルに変換する必要のあるテキストファイルダンプがあります。このファイルには、次のようにフォーマットされた一連の「レコード」（より適切な単語がないため）が含まれています。

User: abc123 
Date: 7/3/12
Subject: the foo is bar
Project: 123456
Problem: foo bar in multiple lines of text
Resolution: foo un-barred in multiple lines of text

User: abc123 
Date: 7/3/12
Subject: the foo is bar
Project: 234567
Problem: foo bar in multiple lines of text
Resolution: foo un-barred in multiple lines of text

...

私の最終結果は、区切られた値のフラットファイルを取得することです。上記のレコードを使用すると、次のようになります。

abc123;7/3/12;the foo is bar;123456;foo bar in multiple lines of text;foo un-barred in multiple lines of text
abc123;7/3/12;the foo is bar;234567;foo bar in multiple lines of text;foo un-barred in multiple lines of text

コードが下に表示され、その後、私が経験している問題が発生します。

    import java.util.*;
import java.io.*;
import java.nio.file.*;
//
public class ParseOutlookFolderForSE
{
        public static void main(String args[])
        {
            String user = "";
            String PDLDate = "";
            String name = "";
            String PDLNum = "";
            String problemDesc = "test";
            String resolutionDesc = "test";
            String delim = ";";
            int recordCounter = 0;
            //
            try
            {
                Path file = Paths.get("testfile2.txt");
                FileInputStream fstream = new FileInputStream("testfile2.txt");
               // Get the object of DataInputStream
                /* DataInputStream in = new DataInputStream(fstream);  */
                BufferedReader br = new BufferedReader(new InputStreamReader(fstream));  //Buffered Reader
                String inputLine = null;     //String
                StringBuffer theText = new StringBuffer();  //StringBuffer
// problem: output contains last record ONLY. program is cycling through the entire file, overwriting records until the end.
// add a for loop based on recordCounter
                for(recordCounter=0;recordCounter<10;recordCounter++)
                {
                while((inputLine=br.readLine())!=null)
                {
                    if(inputLine.toLowerCase().startsWith("from:"))
                    {

                /*      recordCounter = recordCounter++;    */  // commented out when I added recordCounter++ to the for loop
                        user = inputLine.trim().substring(5).trim();
                    }
                    else
                    if(inputLine.toLowerCase().startsWith("effective date"))
                    {

                        PDLDate = inputLine.trim().substring(15).trim();
                    }
                    else
                    if(inputLine.toLowerCase().startsWith("to:"))
                    {

                        name = inputLine.trim().substring(3).trim();
                    }
                    else
                    if(inputLine.toLowerCase().startsWith("sir number"))
                    {

                        PDLNum = inputLine.trim().substring(12).trim();
                    }
                }      //close for loop
                }   // close while
                System.out.println(recordCounter + "\n" + user + "\n" + name + "\n" + PDLNum + "\n" + PDLDate + "\n" + problemDesc + "\n" + resolutionDesc);
                System.out.println(recordCounter + ";" + user + ";" + name + ";" + PDLNum + ";" + PDLDate + ";" + problemDesc + ";" + resolutionDesc);
                String lineForFile = (recordCounter + ";" + user + ";" + name + ";" + PDLNum + ";" + PDLDate + ";" + problemDesc + ";" + resolutionDesc + System.getProperty("line.separator"));
                System.out.println(lineForFile);
                try
                {
                    BufferedWriter out = new BufferedWriter(new FileWriter("testfileoutput.txt"));
                    out.write(lineForFile);
                    out.close();
                }
                catch (IOException e)
                {
                    System.out.println("Exception ");
                }
            } //close try
            catch (Exception e)
            {
                System.err.println("Error: " + e.getMessage());
            }
        }

    }

私の最終的な出力は最後のレコードだけです。何が起こっているのかというと、プログラムはすべての行を読み取っていますが、最後の行だけが次のレコードで上書きされないということだと思います。理にかなっています。そこで、FORループを追加し、1ずつインクリメントif(inputLine.toLowerCase().startsWith("user:"))し、データとともにカウンター変数を出力して、何が起こっているかを検証しました。

私のループは、擬似コードのステップ3の後、ステートメントのFOR後BufferedReader、前に始まります。IF手順6でファイルに書き込んだ後、終了します。使用してfor(recCounter=0;recCounter<10;recCounter++)おり、出力ファイルに10個のレコードがありますが、これらはすべて、0〜9の番号が付けられた入力ファイルの最後のレコードのインスタンスです。

forループを同じ場所に残して、ステートメント内に'増分を読み取りfor(recCounter=0;recCounter<10;)、配置するように変更しました。行が。で始まるたびに増分します。この場合、出力ファイルにも10個のレコードがあり、それらは入力ファイルの最後のレコードの10個のインスタンスであり、すべてのカウンターは0です。recCounterIFUser:

編集：ファイルがどのようにフォーマットされているかを考えると、次からw = oneレコードを決定する唯一の方法は、行の先頭にある「User：」という単語の後続のインスタンスです。発生するたびに、次に発生するまで、単一のレコードを構成します。

「recCounter」を適切に設定していないか、「新しいレコードを開始」として設定されている結果を解釈していないように見えます。

このファイルを複数のレコードとして読み取る方法について誰か提案がありますか？

score 3 · Accepted Answer

さて、あなたの擬似コードは次のようになるはずです：

declare variables
open file
while not eof
  read input
  if end of set
    format output
    write output
    clear variables
  figure out which variable
  store in correct variable
end-while

1つのセットを終了して、次のセットを開始できるようになる時期を把握するためのトリックがあるかもしれません。例からわかるように、セットが空白行で終了することになっている場合は、空白行を確認するだけで済みます。そうでなければ、どうやって知っていますか？セットは常に「ユーザー」で始まりますか？

また、最後のレコードを書くことを忘れないでください。バッファ/テーブルに未書き込みのものを残したくない。

score 1 · Accepted Answer

あなたの説明から、次のように聞こえます：あなたは実際にそれらを完了するときに出力文字列を書いているのではなく、代わりに最後にすべての書き込みを行っています。ループの外側に出力文字列を保存しているようには聞こえないため、レコードを見つけるたびに、以前に計算した出力文字列を上書きしています。

各レコードが見つかり、その出力文字列が作成された後、実際にファイルに書き込んでいることをテストする必要があります。

あなたのコードを投稿せずに、私はあなたをもっと助けることができるかどうかわかりません。

java - Javaでフラットファイルから複数のレコードを読み取る

2 に答える 2

Related

Reference