3

BigQuery を提供してくれた Google に感謝します。すばらしい!
BigQuery で近似文字列一致 / あいまい文字列検索は可能ですか?
この機能を BigQuery に追加する予定はありますか?

確かに、Google 独自の近似文字列マッチング アルゴリズムを使用して、Google の知的財産を維持しながら、この機能を BigQuery に提供できます。すべての BigQuery ドキュメントと Stack Overflow の質問を検索しました。もちろん、これを行うアルゴリズムはたくさんありますが、BigQuery と統合するにはどうすればよいでしょうか?

わずかに異なる可能性がありますが、ほとんど同じである 2 つの文字列を比較する必要があります。例えば:

"Rhodes USA" vs. "Rhodes USA, LLC", vs. "Rhodes USA LLC".  

BigQuery のテストから、BigQuery が JOIN するには、2 つの文字列が正確に一致する必要があることがわかりました。各文字列の末尾のスペースの数までもです。BigQuery との統合に関するこの機能またはガイダンスの追加を歓迎します。これは、ウィスコンシン州ミルウォーキーにある地域の革新的な部分所有ジェット会社であるミルウォーキー ジェッツを支援するものです。BigQuery を提供してくださった Google に改めて感謝いたします。

どうもありがとうございました。Andrew Paullin (414) 212-5372

4

1 に答える 1

5

残念ながら、おおよその文字列一致はサポートされていません。最も近い方法は、正規表現を使用することです。最善の策は、データが BigQuery に到達する前にデータを正規化することです。つまり、「Rhodes USA」と「Rhodes, USA.」を同じ文字列に変換します。ただし、このサポートのために機能リクエスト バグを追加します。

于 2012-05-11T15:22:22.267 に答える