0

2 つの列 (ID1、名前) を持つ 2 つの Excel ファイルと、2 つの列 (ID2、名前) を持つもう 1 つの Excel ファイルがあり、3 つの列 (ID1、ID2、名前) を持つ 1 つのファイルをエクスポートする必要があります。

そして問題は、他のファイルにはない名前がそれぞれのファイルにあることです。より大きな問題は、2 つのファイルに同じ名前を書くことにいくつかの違いがあることです。これは、ファイルの言語の共通の違いです。アラビア語の文字 'أ' は、ハムザ 'ا' なしで書くことができます (つまり、あるファイルの名前が別のファイルの名前と同じであることを指定するために、2 つの文字列間で標準的な等価演算を使用できないということです)。

私の質問は、コードを書かなくても役立つツールがあるということです。SQL Integration Services について聞いたことがありますが、それについては何も知りません。解決に役立つ参考文献を教えてください。私の問題。

リンク、提案、またはその他のヘルプをいただければ幸いです。

よろしくお願いします

4

1 に答える 1

2

あなたは興味深い問題を抱えていますが、残念ながらこの状況では興味深い=難しいです。英語のタイプ名では、多くの名前マッチング アルゴリズム (Double Metaphone、最小編集距離、Damerau-Levenshtein 距離など) を使用できますが、それらがアラビア語のような豊富な言語でどの程度うまく機能するかはわかりません。SU https://superuser.com/questions/480133/record-matching-software-to-compare-two-tables-and-match-on-based/481592でやや似た質問に答えました

SSIS の Fuzzy 機能であるFuzzy LookupFuzzy Groupingを試してみても損はありません。あなたの場合、あいまいなグループ化は、実験したいものです。これらは Enterprise Edition の機能であるため、ライセンスの観点から注意してください。Development Edition では問題なく動作しますが、SQL Server の Standard Edition にデプロイして実行しようとすると失敗します。

于 2013-01-15T15:11:07.907 に答える