0

YQLを使用してページを解析しようとしています。HTMLテーブルが解析されています。問題は、YQLがHTMLの「p」タグを単独で追加するのに対し、元のHTMLには含まれていないことです。YQLがHTMLを返さないようにするために何をすべきか。

YQLクエリはここで見ることができます

以下のようなtdタグを見ると、apタグが含まれていますが、元のhtmlのように、ここではテーブルhtmlにapタグがありません。

<tr>
    <td class="ttl">
        <a href="#" onclick="helpW('h_weight.htm');">Weight</a>
    </td>
    <td class="nfo">
        <p>169 g</p>
    </td>
</tr>
4

1 に答える 1

0

これを行うのはYQLではなく、HTML5エンジン自体です。HTML5の哲学の一部は、無効なHTMLを指定すると、見逃した要素を追加して修復し、クエリに表示されるのは修復されたコンテンツを表すツリーであるということです。(はい、これはクエリを書くのを難しくします。しかし、これは責任を配分する場所ではありません...)

于 2012-08-13T20:59:57.807 に答える