unicode - SQL Server 2008 R2 : nvarchar フィールドのエンコードを検出する

翻译自：https://stackoverflow.com/questions/12646030 2012-09-28T19:16:21.193

1112 次

2

1,000,000 行と文字列テーブルがあり、エンコードエラーのために内部にガベージが含まれています。

ごみは最小限ですが、見つける必要があります。

問題の列はNVARCHAR、通常 11 の言語のいずれかでテキストを含む列です。

すべてのテキストは Unicode である必要があります (アプリケーション側で処理する場合は utf-8)。

破損した列には、?文字や非常に限られた珍しいグリフセットが含まれており、有効な言語ではないことが容易にわかります。これらの列は逆方向および順方向にエンコードされて総ガベージになっている可能性があります。

速度の名の下に、SQL Serverで不正なエンコーディング/文字列のゴミを検出するためにできることはありますか?

ありがとう。

ゴミの例を追加する編集：

これはロシア語のÐ¸Ð»Ð¸Ð~Ð¼ÑÐ£Ñ‡Ð°ÑÑ‚Ð½Ð¸ÐºÐ°でした</p>

0 に答える 0