バックストーリー: 1 列に 300 ページを超える単語の情報ドキュメントを受け取りました。VBA と Excel を使用して、区切り記号を使用してデータを転置しました (文字列の先頭にあるすべての大文字は姓のみです)。
これで、行データができました。理想的には、列を次のようにする必要があります。
名前 v1 v2 v3 v1 v2 v3 v1 v2 v3 v1 v2 v3
すべてのトリプレットについても同様です。
問題が発生するのは、v1 が常にすべてのインスタンスにあるとは限らないことです。最初のサイクルの v1 が 2 番目のサイクルの v1 と同じ場合、元のデータは v1 の再入力をスキップしただけです。
例:
John v1 v2 v3 v1 v2 v3 v1 v2 v3
(理想!)
Jimm v1 v2 v3 v2 v3 v2 v3 v1 v2 v3
(理想的ではありません!)
最後に、Jimm が John の列を法廷の列の空白または if(offense、法廷が満足したかどうかを確認し、そうでない場合は前の法廷を使用) と一致させたいと考えています。
幸いなことに、私の v1、v2、および v3 では、文字列の先頭に一貫した区切り文字があります (v1= Court: ; v2= Offense ; v3= Sentence)。データの反復リストを作成する方法に関するヒントやアドバイスはありますか?
サンプルデータ:
名前、名、姓
裁判所: テスト情報 1
オフェンス: テストオフェンス1
文: テスト文1
オフェンス: テストオフェンス2
文: テスト文 2
コート: テストコート3
オフェンス: テストオフェンス3
文: テスト文 3
注: 2 番目のサイクルには Court1 と同じであるため、コートは含まれません。これは、データの収集方法に問題があります。
必要なのは、余分な裁判所を挿入するリストか、すべての列を一列に並べた転置リストだけです。