0

非構造化データでいっぱいのテキスト ファイルがあります。

そのデータの中には、抽出して新しいテキスト ファイルに入れたい電話番号があります。

ファイル内の数字だけが重要です。

これを行う方法が C# または VB にあるかどうか疑問に思っていましたか?

IBM がデータ分析を行うための Omnifind というソフトウェア パッケージを持っていることは承知していますが、前述のトピックを実行するだけのアプリケーションを作成したいと考えていました。

PS データの例 -

John Smith London 123456 
Hayley Smith Manchester 234567 
Mike Smith Birmingham 345678

だから私はちょうど持っている新しいファイルを作成したい -

123456 
234567 
345678
4

3 に答える 3

3

運が悪い - そのような方法はありません。私はそのようなことを提案します -

List<string> result = new List<string>();
      using(StreamReader content = File.OpenText("text"))
      {
        while(!content.EndOfStream)
        {
          string line = content.ReadLine();
          var substrings = line.Split(' ');
          result.Add(substrings[substrings.Length-1]);
        }
      }
于 2011-04-08T10:47:04.930 に答える
1

正規表現のようなものを使用することもできますし、この場合は基本的な文字列操作を行うこともできます。

using (StreamReader reader = new StreamReader("infile.txt"))
{
    using (StreamWriter writer = new StreamWriter("outfile.txt"))
    {
        string line;
        while ((line = reader.ReadLine()) != null)
        {
            int index = line.LastIndexOf(' ');
            if (index > 0 && index + 1 < line.Length)
            {
                writer.WriteLine(line.Substring(index + 1));
            }
        }
    }
}
于 2011-04-08T10:51:18.403 に答える