1

私はpyqueryを使ってウェブページを構築していました:

> page = PyQuery('<html><head><script type="text/javascript" src="jquery-1.4.min.js"></script><script type="text/javascript" src="tools.min.js"></script></head><body></body></html>')
> print page
Output: <html><head><script type="text/javascript" src="jquery-1.4.min.js"/><script type="text/javascript" src="tools.min.js"/></head><body/></html>

ただし、スクリプト (および本文) タグは、そのように終了することは想定されていません。Firefox はヘッダーの残りを無視します。

上記を単一の要素に分割しようとしました(つまり、一度に1つのスクリプトタグを追加しました)が、役に立ちませんでした:

> page = PyQuery('<html><head></head></html>')
> page.find('head').append('<script type="text/javascript" src="jquery-1.4.min.js"/></script>')
> page.find('head').append('<script type="text/javascript" src="tools.min.js"></script>')
Output: <html><head><script type="text/javascript" src="jquery-1.4.min.js"/><script type="text/javascript" src="tools.min.js"/></head><body/></html>

タグでも同じことが起こり<iframe/>(YouTube のためにこれらを使用することを余儀なくされています)、それらは Firefox によって閉じられず、進行中のすべてのコードは無視されます。

私が信じているように、別の終了タグを使用して pyquery にこれらを強制的に終了させるにはどうすればよいですか?

ああ、誰かが不思議に思っているなら、私はすべてをbeautifulsoupでやっていない.

4

2 に答える 2

1

試す:

page = PyQuery('<html><head><script type="text/javascript" src="jquery-1.4.min.js">\n</script><script type="text/javascript" src="tools.min.js">\n</script></head><body></body></html>')

iframeでも動作します。

于 2011-08-02T01:30:54.427 に答える
1

print page.__html__()HTMLをダンプするために使用する必要があります。print page.html(method='html')

于 2012-11-02T13:08:29.890 に答える