0

HTMLテーブルから適切なCSVを作成するという考えに固執しています。HTMLAgilityPackを使用して、文字列から html を読み取り、HTMLDocument を作成しています。次に、XPATH を使用して行と列をループします。

問題は、特定のセルの正しい行とセル (x,y) を特定できないことです。

HTML の例:

<html>
<body>
    <table border="1">
        <tr>
            <td rowspan="2">
                100
            </td>
            <td>
                200
            </td>
            <td colspan="2">
                300
            </td>
        </tr>
        <tr>
            <td colspan="2">
                400
            </td>
            <td>
                600
            </td>
        </tr>
        <tr>
            <td>
                400
            </td>
            <td>
                500
            </td>
            <td>
                600
            </td>
        </tr>
    </table>
</body>
</html>

テーブルのイメージ

Excelで開いてCSVとして保存すると、次のような目的の出力が得られます。

100,200,300,
,400,,600
400,500,600,

誰かがrowpanとcolspanを尊重して.Netで同じ出力を作成するのを手伝ってくれますか?

ありがとう!デックス

4

1 に答える 1

2

どの行と列にいるのかを知る必要はありません。必要なのは、見つかった新しい列ごとに「,」を追加し、行の終わりに到達するたびにブレークラインを追加することだけです。

ドキュメントを xml ドキュメントと見なしてナビゲートする場合は、すべての TR ノードを調べて、子ノード リストの最後に到達したときにブレークラインを追加するだけです。そして、必要に応じて「,」を追加して、各 TR ノードのすべての TD ノードを反復処理します。

于 2011-05-18T17:59:10.277 に答える