1

テキストファイルから多くの行のデータをインポートしている状況があります。インポートプロセスはSqlBulkCopyを使用して実行され、最初にステージングテーブルにロードされます。

このデータに対していくつかの検証を実行し、検証が失敗した場合にファイルのどの行がエラーになっているのかをユーザーに報告できるようにしたいと思います。ステージングテーブルでのSELECTのデフォルトの順序と一緒にROW_NUMBER()を使用することを望んでいましたが、SOに関するいくつかの 質問があり、これを実行できないことを示唆しています。

入力ファイルの元の順序を保持できるようにする方法として、何を提案しますか?入力ファイル形式はTSVです。ファイル行を示すモック値を作成する必要がありますか?

元の挿入順にクエリの結果を報告する方法はありますか?SqlBulkCopyを使用して日付をまとめてロードした場合、これを信頼できますか?

4

1 に答える 1

0

BULK INSERTソーステーブルの順序をファイルに保存し、続いて ID を追加できることがわかりました。

タブ区切りのテーブル が与えられた場合、C:\MyTable.txt意図的に行の順序を変更しました。

FileName    FileType
wmsetup log
bar txt
wmsetup10   log
WMSysPr9    prx
WMSysPrx    prx
Wudf01000Inst   log
xpsp1hfm    log
_default    pif
0   log
002391_ tmp
005766_ tmp

以下を実行し、SQL Server でテキスト ファイルの順序を保持しました。

IF EXISTS(
    SELECT 1
    FROM sys.tables t
    INNER JOIN sys.schemas s on s.schema_id=t.schema_id
    WHERE t.name='myTable'
    AND t.[type]='U'
    AND s.name='dbo'
)
DROP TABLE myTable
GO

CREATE TABLE dbo.myTable(FileName VARCHAR(80), FileType VARCHAR(30))
GO

BULK INSERT myTable FROM 'C:\MyTable.txt' WITH (
firstrow=2
, fieldterminator='\t'
, rowterminator='\n'
)
GO

ALTER TABLE myTable ADD ID INT IDENTITY(1,1)
GO

SELECT * FROM myTable
GO

結果:

FileName        FileType ID
--------------- -------- -----------
wmsetup         log      1
bar             txt      2
wmsetup10       log      3
WMSysPr9        prx      4
WMSysPrx        prx      5
Wudf01000Inst   log      6
xpsp1hfm        log      7
_default        pif      8
0               log      9
002391_         tmp      10
005766_         tmp      11
于 2012-05-27T17:34:23.750 に答える