この質問は、以前の投稿から続いています。この投稿は、問題を再提示し、別のアプローチを試みることです。
以前の投稿:
問題:
大きなテキスト ファイルには、パイプ (|) で区切られたレコードが含まれています。
1 つのフィールドにはフリー テキストが含まれます。一部のレコードには、キャリッジ リターンまたは改行 (これらの特殊な特性の 1 つまたは多く) が含まれています。
さまざまな特殊文字の組み合わせを削除する提案された方法は、すべての問題を削除することに成功しませんでした。
提案された解決策:
VB スクリプトを実行して、レコードごとにファイルにアクセスします。各フィールドを配列に格納します。問題のあるフィールドをきれいにします。次に、新しいファイルに出力します。
フィールド 1 の場合 - 単純に配列に格納します。(開始位置は最後のレコードから最初のパイプまで +1 です)
フィールド 2 の場合 - 出現する特殊文字をすべて削除します。(開始位置は、最後のフィールドから次のパイプまで +1 です)。場合によっては、このフィールドにパイプが含まれる場合があります。そのため、解決策として回避策が必要になる場合があります。
フィールド 3 の場合 - 配列に格納します。(開始位置は最後のフィールドから (キャリッジ リターン) まで +1 です)
サンプル ファイル: (角括弧は特殊文字を表します - 改行または改行)
FIELD_NAME1 | FREE_TEXT1 | FIELD_NAME3
John | He likes food | 1002
Jake | He eats food and [][] likes swimming| 1003
Jake | He eats food and [][] likes swimming| 1003
Jake | He eats food and | 1006
John | He likes [] food | 1007
.