ある特定のものの検索サービスを構築したいと思います。データは、無料の求人サービスや他の多くのサイトを介して、自由に利用できます。
ゼロから構築するのではなく、カスタマイズするオープンソースクローラーなどのビルディングブロックはありますか?
そのような製品を作るためのアドバイスはありますか?技術的なだけでなく、私が考慮に入れる必要があるかもしれないプライバシー/法律上の事柄。
たとえば、結果がどこから来たのかを「クレジットを与える」必要があり、元の場所へのリンクを配置する必要があります-多くの場所からそれらを取得する場合はどうなりますか?
編集:ちなみに、私はフロントエンドにJSでGWTを使用していますが、バックエンドの言語は決定していません。PHPまたはPythonのいずれか。考え?