特定のパターンで 3 つの行を入力し、列を一番下までドラッグすると、Excel の機能がわかります。Excel はパターンを続行しようとします。
例えば
タイプ...
- テスト-1
- テスト-2
- テスト-3
Excel は次のように続けます。
- テスト-4
- テスト-5
- テスト...
日付などの他のパターンでも同じように機能します。
同様のことを達成しようとしていますが、次のようなより例外的なケースも処理したいと考えています。
- テストブルーサムシングエルス
- テスト-黄色-何か他のもの
- テストレッドサムシングエルス
このエントリに基づいて、パターンは次のようになります。
- テスト-[動的]-何か
[DYNAMIC] を他の色で継続するのはまったく別の取引です。今はあまり気にしません。パターン内の [DYNAMIC] 部分を検出することに主に関心があります。
多数のプール エントリからこれを検出する必要があります。この種のパターンを持つ 10,000 個の文字列があり、類似性に基づいてこれらの文字列をグループ化し、テキストのどの部分が常に変化しているかを検出したいとします ([DYNAMIC])。
このシナリオではドキュメントの分類が役立ちますが、どこから始めればよいかわかりません。
アップデート:
複数の[DYNAMIC]パターンを持つことも可能であることを忘れていました。
そのような:
- test_[動的] 12 [動的2]
重要ではないと思いますが、これを .NET に実装する予定ですが、使用するアルゴリズムに関するヒントは非常に役立ちます。