0

この質問は、以前の投稿から続いています。この投稿は、問題を再提示し、別のアプローチを試みることです。

以前の投稿:

大きなテキスト ファイルのクリーニング

問題:

大きなテキスト ファイルには、パイプ (|) で区切られたレコードが含まれています。

1 つのフィールドにはフリー テキストが含まれます。一部のレコードには、キャリッジ リターンまたは改行 (これらの特殊な特性の 1 つまたは多く) が含まれています。

さまざまな特殊文字の組み合わせを削除する提案された方法は、すべての問題を削除することに成功しませんでした。

提案された解決策:

VB スクリプトを実行して、レコードごとにファイルにアクセスします。各フィールドを配列に格納します。問題のあるフィールドをきれいにします。次に、新しいファイルに出力します。

フィールド 1 の場合 - 単純に配列に格納します。(開始位置は最後のレコードから最初のパイプまで +1 です)

フィールド 2 の場合 - 出現する特殊文字をすべて削除します。(開始位置は、最後のフィールドから次のパイプまで +1 です)。場合によっては、このフィールドにパイプが含まれる場合があります。そのため、解決策として回避策が必要になる場合があります。

フィールド 3 の場合 - 配列に格納します。(開始位置は最後のフィールドから (キャリッジ リターン) まで +1 です)

サンプル ファイル: (角括弧は特殊文字を表します - 改行または改行)

FIELD_NAME1 |    FREE_TEXT1                          |    FIELD_NAME3
 John       |    He likes food                       |    1002
 Jake       |    He eats food and [][] likes swimming|    1003
 Jake       |    He eats food and [][] likes swimming|    1003
 Jake       |    He eats food and                    |    1006
 John       |    He likes [] food                    |    1007

.

4

0 に答える 0