0

次の構造のXMLがあります。

<table name="tblsiccodes">
    <row>
        <sSICCode>0888</sSICCode>
    </row>
    <row>
        <sSICCode>0900</sSICCode>
    </row>
    <row>
        <sSICCode>1000</sSICCode>
    </row>
    <row>
        <sSICCode>1040</sSICCode>
    </row>
    <row>
        <sSICCode>1044</sSICCode>
    </row>
    <row>
        <sSICCode>1090</sSICCode>
    </row>
    <row>
        <sSICCode>1220</sSICCode>
    </row>
    <row>
        <sSICCode>1221</sSICCode>
    </row>
</table>

このサイトから各SICコードの説明を選択する必要があります

http://www.epa.gov/enviro/html/sic_lkup.html

またはこのサイト

http://www.sec.gov/info/edgar/siccodes.htm

vb.netを使用してWebサイトから各SICの説明を取得する最も簡単な方法は何ですか?このXMLファイルを変更できません。SICコードと説明を手動でコピーしてコレクションを作成し、SICコードをコレクションと照合してXMlでSICコードの説明を取得する必要がありますか?最終コレクションは、SICコードと業界名を持つ各アイテム/行をリピーターに入力するために使用されます。

スクリーンスクレイピングを行う必要がありますか?これらのWebサイトには、業界名を取得できるAPI/サービスがあるとは思いません。

HTMlアジリティパックまたはJquery以外の他のサードパーティライブラリを使用できません。

提案してください。

4

1 に答える 1

0

最初のページのソースを見ると、次の選択が含まれています。

<select>
   <option value=''> NO SIC CODE SELECTED </option>
   <option value='3291'> ABRASIVE PRODUCTS (SIC Code: 3291) </option>
   (...)
</select>

そしてそれは続きます。
選択のすべてのオプションを別のxmlファイルとして保存してから、XDocumentまたは.netの他のXml読み込み機能(c#またはvb.net)を使用してurドキュメントをトラバースし、値で各SICコードを見つけることができます。すべてのオプトインを含むxmlのvalue属性の。
もちろん、これは最速の方法ではないかもしれませんが、実装するのが最も簡単です。

于 2012-05-19T19:49:55.800 に答える