現在、NLP プロジェクトに取り組んでおり、tripadvisor.com から抽出することを目的としたコーパスが必要です。出力は、コメントとそのコメントの評価の 2 つのタイプとして期待されます。私の質問は:
この目的に最適なクロール ツールはありますか? 使いやすい必要があり、python が推奨されます。美しいスープは私が見つけたものですが、他の推奨事項についてここで尋ねたかった.
この目的のためだけの完全なツールはありますか? tripadvisor.com 用に作成されたプログラムのことですか?
巨大な Web サイトからのデータ (コメント/評価) クロールに関するその他の推奨事項は、高く評価されます。
コーパスは大学の研究でセンチメント分析に使用されるため、できるだけ早くクロールする必要があります。