正規表現分割を使用してファイルを解析しようとしています。これは文字でうまく機能します'\t'
が、一部の行'\t'
では区切り文字として機能する代わりにフィールド内にあります。
好き :
G2226 TEST 1 C 29 Internal Head Office D Head Office ZZZ Unassigned 10910 10/10/2011 11/10/2011 10/10/2011 11/10/2011 "Test call Sort the customer out some data. See the customer again tomorrow to talk about Prod " Mr ABC Mr ABC Mr ABC Mr ABC Credit Requested BDM Call Internal Note 10
この部分には2つのタブがあります。無視してください。
"Test call Sort the customer out some data. See the customer again tomorrow to talk about Prod\t\t"
良いことは、それらが二重引用符で囲まれていることですが、それらを無視する方法を理解することはできません、何かアイデアはありますか?
編集:
私の目標は36列を取得することです。一部のフィールドには文字が含まれているため、Regex.Split(lineString,'\t')
使用後に一部の列がより多く表示される可能性があります。それらは無視したいと思います。上記のものは38colsになりますが、ヘッダーが36 colsしかないため、データテーブルによって拒否されます。この問題を解決したいと思います。'\t'
'\t'