私はこれで非常に新しいです。私はPyQt4でEclipse SDKを使用しています(javascriptによって隠されているものを発掘するため)。サイトから結果へのリンクを見つけようとしています。例: http://www.mrtzcmp3.net/billy_jean_Bs.html
import sys
from PyQt4 import QtWebKit
from PyQt4 import QtCore
from PyQt4 import QtGui
class Render(QtWebKit.QWebPage):
def __init__(self, url):
self.app = QtGui.QApplication(sys.argv)
QtWebKit.QWebPage.__init__(self)
self.loadFinished.connect(self._loadFinished)
self.mainFrame().load(QtCore.QUrl(url))
self.app.exec_()
def _loadFinished(self, result):
self.frame = self.mainFrame()
self.app.quit()
url = "http://www.mrtzcmp3.net/billy_jean_Bs.html"
r = Render(url)
content = unicode(r.frame.toHtml())
print content.encode('utf-8')
編集: この取得されたページ ソースは、上記の URL のダウンロード ボタン リンクを明らかにしていません ... 上記のコードから抽出されたページ ソースは次のとおりです: http://pastebin.com/HyKnPUER