1

34 の正規化されていないデータ ソースからのデータを 1 つの正規化された SQL Server 2008 データベースに集約するプロジェクトを完了しました。

唯一の問題は、これらのデータ ソースからの大きなテキスト フィールドが忠実度を失い、全体に Unicode 制御文字が表示されていることです (多くの文字)。

これは、タブ区切りの *.txt ファイルの 1 つからデータをインポートするために使用したコードです。

BULK INSERT MyTabeNameHere
        FROM 'C:\FILE\PATH\HERE\FileNameHere.txt'       
        WITH
        (
            FIELDTERMINATOR = '\t',
            ROWTERMINATOR = '\n',
            FIRSTROW = 2
        )

データの例は次のとおりです。

Lorem ipsum ò dolor sit amet
ááá Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet
Lorem ipsumû dolor sit amet
Lorem ipsum dolor sit aÆmet

そのデータを SQL 関数で実行し、これを出力したいと思います...

望ましい出力は次のようになります。

Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet    
Lorem ipsum dolor sit amet
Lorem ipsum dolor sit amet

前もって感謝します!

4

1 に答える 1

0

このような状況で役立つ可能性のある他の一括挿入オプションがあります。

DATAFILETYPE = 'widechar' -- and others

また

CODEPAGE = 'ACP' -- and others

一括操作を SQL 2000 から 2008 に移行するとき、適切な出力を得るために、フォーマット ファイルの使用をやめ、オプションとして widechar を含める必要がありました。ただし、それがあなたにとってうまくいくかどうかを知るには、私はあなたの苦境に十分に精通していません.

[...] 34 の正規化されていないデータ ソース [...]

大量のドキュメントに記載されているように、読み取るファイルの種類 (ascii、ansi など) を知ることが重要です。

于 2012-09-20T14:51:32.920 に答える