パイソン初心者。
Python に画面の一部を選択させようとしています。この場合、これは Firefox ウィンドウ内の小さなウィンドウであり、Firebug のソース コードです。次に、適切な領域を選択したら、control-A を押してすべてを選択し、次に control-C を押してコピーします。これを理解できたら、同じことをして、すべてのコピーを .txt ファイルに貼り付けます。
どこから始めればいいのかよくわかりません。この種のライブラリはありますか? それは可能ですか?
パイソン初心者。
Python に画面の一部を選択させようとしています。この場合、これは Firefox ウィンドウ内の小さなウィンドウであり、Firebug のソース コードです。次に、適切な領域を選択したら、control-A を押してすべてを選択し、次に control-C を押してコピーします。これを理解できたら、同じことをして、すべてのコピーを .txt ファイルに貼り付けます。
どこから始めればいいのかよくわかりません。この種のライブラリはありますか? それは可能ですか?
Qtの上にあるPythonラッパーであるPyQtまたはPySideを調べます。Qt は大きな怪物ですが、非常によく文書化されており、スクリーン セクションをつかめば、プロジェクトをさらに進めるのに役立つと確信しています。
コメントで述べたように、データはすべて最初から HTML にあります (非表示の要素であるため、Firebug のスクリーンショットではグレー表示されていると思います)。このアプローチにより、ブラウザを自動化しようとする複雑さを回避できます。データを取得する方法の大まかな概要は次のとおりです。
ページ全体の HTML をダウンロードします。最初は手動で行います (つまり、ブラウザから [ファイル] > [保存])。処理したいページがたくさんある場合は、必要なすべてのページを後でダウンロードする方法を見つけます。 . この部分に python を使用する場合は、urllib2をお勧めします。各ページの URL はおそらくかなり構造化されているので、簡単にリストに保存し、それぞれをダウンロードしてローカルに保存できます。.
HTML を解析するスクリプトを作成します。正規表現は使用しないでください。Python を使用しているので、Beautiful Soupのようなものを使用すると、ページの適切なオブジェクト表現が作成され、必要な要素を取得できます。
Python は初めてだとおっしゃっていたので、これには間違いなく学習曲線が必要ですが、これは実際には、Python をさらに学習するために使用するかなり実行可能なプロジェクトのように思えます。
各ステップで特定の障害に遭遇した場合は、サンプル コードを使用して新しい質問を開始し、何を達成しようとしているのかを示してください。人々は喜んで助けてくれるでしょう。