Google App Engine で Python lxml を使用できますか? (または、美しいスープを使用する必要がありますか?)
Beautiful Soup を使い始めましたが、遅いようです。他の Web サイトからデータを「スクリーン スクレイピング」して、ある種の「マッシュアップ」を作成するというアイデアを試し始めたところです。
Google App Engine で Python lxml を使用できますか? (または、美しいスープを使用する必要がありますか?)
Beautiful Soup を使い始めましたが、遅いようです。他の Web サイトからデータを「スクリーン スクレイピング」して、ある種の「マッシュアップ」を作成するというアイデアを試し始めたところです。
編集:lxml
ライブラリがサポートされるようになりました。
簡単な答え:できません。
AppEngine のドキュメントから: 「Python 環境用に記述されたアプリケーション コードは、Python のみで記述される必要があります。C 言語で記述された拡張機能はサポートされていません」
BeautifulSoup を使用する必要があるかどうかは、実際にどのように使用するかによって異なります。質問を詳細で更新してください。可能であれば、ここで他の提案を更新してみます。
Caio の改訂版の回答に追加するには、次のlxml
方法を使用できます。
app.yaml
ファイルに次を追加します。
libraries:
- name: lxml
version: "2.3" # or "latest"
import lxml
これで、Python スクリプトで動作します。