SQL に解析する必要がある 4MB の XML ファイルがあり、型指定されていない XML を使用すると大きな処理に時間がかかりすぎるため、最初の XSD を作成しています (あきらめて、1 時間後にクエリをキャンセルしました)。
私が持っている XML ファイルの形式は次のとおりです (各製品にはさらに多くの要素がありますが、正しくなるまで短くしてテスト用の XML ファイルを作成しました)。
<ITEMS>
<CREATED value="Wed May 2 9:40:38 BST 2012">
<PRODUCT ITEM="0001">
<MODEL>MODELNO1</MODEL>
<BARCODE>5550204425</BARCODE>
<TITLE>Item 1 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0002">
<MODEL>MODELNO2</MODEL>
<BARCODE>52614343433</BARCODE>
<TITLE>Item 2 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0003">
<MODEL>MODELNO3</MODEL>
<BARCODE>32563533</BARCODE>
<TITLE>Item 3 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0004">
<MODEL>MODELNO4</MODEL>
<BARCODE>65135647582</BARCODE>
<TITLE>Item 4 Title</TITLE>
</PRODUCT>
<PRODUCT ITEM="0005">
<MODEL>MODELNO5</MODEL>
<BARCODE>65874112</BARCODE>
<TITLE>Item 4 Title</TITLE>
</PRODUCT>
</CREATED>
</ITEMS>
この XML ファイルは、外部のサプライヤー システムによって自動生成されたものであり、現在の形式で作業するしかありません。
このスキーマを作成しました:
<?xml version="1.0"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema">
<xs:element name="ITEMS">
<xs:complexType>
<xs:sequence>
<xs:element name="CREATED">
<xs:complexType>
<xs:sequence>
<xs:element name="PRODUCT" maxOccurs="unbounded">
<xs:complexType>
<xs:sequence>
<xs:element name="MODEL" type="xs:string" maxOccurs="unbounded" />
<xs:element name="BARCODE" type="xs:string" maxOccurs="unbounded" />
<xs:element name="TITLE" type="xs:string" maxOccurs="unbounded" />
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:sequence>
</xs:complexType>
</xs:element>
</xs:schema>
SQL では、最初に次のようにスキーマ コレクションを作成しました。
IF EXISTS ( SELECT * FROM sys.xml_schema_collections where [name] = 'MyXmlSchema')
DROP XML SCHEMA COLLECTION [MyXmlSchema]
GO
DECLARE @MySchema XML
SET @MySchema =
(
SELECT * FROM OPENROWSET
(
BULK 'C:\test\schema2.xsd', SINGLE_CLOB
) AS xmlData
)
CREATE XML SCHEMA COLLECTION [MyXmlSchema] AS @MySchema
GO
次に、スキーマに基づいてテーブルを作成しました。
CREATE TABLE [dbo].[XMLProds] (
[MODEL] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL,
[EAN] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL,
[NAME] xml(CONTENT dbo.[MyXmlSchema]) NOT NULL
)
最後に、XML を検証しました。
DECLARE @x2 XML ([MyXmlSchema])
SELECT @x2 = '<copied the code from the test XML file and pasted here>'
検証では、「CREATED」フィールドの日付値が気に入らなかった.1回しか宣言されておらず、簡単に削除できるため、これはなくてもかまわない. しかし、各商品フィールドの「ITEM」値も気に入らなかったので、問題はありません。2. これはすべてのアイテム (2 ~ 3,000 個のアイテムすべて) に現れるため、無視することはできません。これを回避する方法はありますか?
試しに、不要な値をテスト XML から削除したところ、検証に合格しました。次に、テーブルにデータを入力するために次のステートメントを実行しました。
INSERT INTO XMLProds (MODEL, BARCODE, TITLE)
SELECT X.product.query('MODEL').value('.', 'VARCHAR(20)'),
X.product.query('BARCODE').value('.', 'VARCHAR(50)'),
X.product.query('TITLE').value('.', 'VARCHAR(150)')
FROM (
SELECT CAST(x AS XML)
FROM OPENROWSET(BULK 'C:\test\Products2test.xml', SINGLE_BLOB) AS T(x)) AS T(x)
CROSS APPLY x.nodes('/ITEMS/CREATED/PRODUCT') AS X(product);
..しかし、次のエラーが発生しました:
メッセージ 6909、レベル 16、状態 1、行 21 XML 検証: この場所ではテキスト ノードを使用できません。型は要素のみのコンテンツまたは単純なコンテンツで定義されています。位置: /
ここで私が間違っているところを助けていただければ幸いです。前もって感謝します。