0

現在、数十万のxmlエントリを含む巨大なファイルを処理しています。それらを変更した後、新しいデータベースとして特定のシステムにアップロードする必要があります。ファイルの内容は次のようになります。

   <Row ss:AutoFitHeight="0">
    <Cell><Data ss:Type="String">Product</Data></Cell>
    <Cell><Data ss:Type="String">Home &gt; Connectors &gt; Power Entry</Data></Cell>
    <Cell><Data ss:Type="Number">10430</Data></Cell>
    <Cell><Data ss:Type="String">CAMDEN-BOSS CONTACT, 6AWG, 75A CBCAG14</Data></Cell>
    <Cell><Data ss:Type="String">CONTACT, 6AWG, 75A; Connector Mounting:Cable; Contact Termination:Crimp; Current Rating:75A; SVHC:No SVHC (18-Jun-2012); Series:CBC; Voltage Rating:600V; Flammability Rating:UL94 V0; Wire Area Size Max:11mm; Wire Size AWG Max:6AWG; Wire Size AWG Min:6AWG&lt;br /&gt;&lt;br /&gt;&lt;strong&gt;Price for pack of: 1&lt;/strong&gt;&lt;br /&gt;&lt;br /&gt;&lt;strong&gt;Country Of Origin: CN&lt;/strong&gt;&lt;br /&gt;&lt;br /&gt;&lt;a href=&quot;http://LALA.co.uk/datasheets/1508502.pdf&quot;&gt;&lt;img alt=&quot;&quot; src=&quot;/ekmps/shops/LALA/resources/Design/icon-pdf.gif&quot; style=&quot;width: 16px; height: 16px;&quot; /&gt;&amp;nbsp;Technical Data Sheet&lt;/a&gt;&lt;br /&gt;</Data></Cell>
   </Row>

私の仕事は、.pdfファイルへのリンクがないすべてのエントリを削除することです。上記の例では、そのように残されていますが、「http://LALA.co.uk/datasheets/1508502.pdf」がない場合は説明では、削除する必要があります(すべての行)。C#から..まで、さまざまなものを処理できます。ソリューションの種類は重要ではありません。誰かが私に何かを提案できますか?

4

1 に答える 1

1

Notepad++ で検索 (Ctrl+F)

<Row[^>]*>((?!\.pdf).)*?</Row>

と置換する

(leave blank)

「正規表現」および「. 改行に一致」ボックスをチェックする必要があります

于 2012-12-21T11:26:09.537 に答える