.net - html テーブルから CSV へ、csv の書式設定の問題

Question

HTMLテーブルから適切なCSVを作成するという考えに固執しています。HTMLAgilityPackを使用して、文字列から html を読み取り、HTMLDocument を作成しています。次に、XPATH を使用して行と列をループします。

問題は、特定のセルの正しい行とセル (x,y) を特定できないことです。

HTML の例:

<html>
<body>
    <table border="1">
        <tr>
            <td rowspan="2">
                100
            </td>
            <td>
                200
            </td>
            <td colspan="2">
                300
            </td>
        </tr>
        <tr>
            <td colspan="2">
                400
            </td>
            <td>
                600
            </td>
        </tr>
        <tr>
            <td>
                400
            </td>
            <td>
                500
            </td>
            <td>
                600
            </td>
        </tr>
    </table>
</body>
</html>

テーブルのイメージ

Excelで開いてCSVとして保存すると、次のような目的の出力が得られます。

100,200,300,
,400,,600
400,500,600,

誰かがrowpanとcolspanを尊重して.Netで同じ出力を作成するのを手伝ってくれますか?

ありがとう！デックス

score 2 · Accepted Answer

どの行と列にいるのかを知る必要はありません。必要なのは、見つかった新しい列ごとに「,」を追加し、行の終わりに到達するたびにブレークラインを追加することだけです。

ドキュメントを xml ドキュメントと見なしてナビゲートする場合は、すべての TR ノードを調べて、子ノードリストの最後に到達したときにブレークラインを追加するだけです。そして、必要に応じて「,」を追加して、各 TR ノードのすべての TD ノードを反復処理します。

.net - html テーブルから CSV へ、csv の書式設定の問題

1 に答える 1

Related

Reference