0

今、私は興味深い状況にあります...私の目標は、人の氏名、生年月日、およびその他の資格情報(議論の余地がある)を受け入れ、インターネットからその人に関する多くの情報を抽出するソフトウェアを用意することです。できるだけ...

今、私はいくつかの調査を行い、Googleの検索APIとScrapyなどのWebクローラーを使用することで、この目標をある程度達成できることがわかりました...しかし、Googleで人の名前を二重引用符で検索するだけでは、必ずしも正しい結果が得られるとは限りません。 ..。。

ここで2つの質問が思い浮かびます...精度を上げる方法、そして次に、私は車輪の再発明をしていますか(人を見つける能力を持つサイトがいくつかあるので...)?もしそうなら、これまたはそれに類似した何かを行うオープンソースコード(または使用可能なもの)がすでにそこにありますか?

4

1 に答える 1

1

この回答は、大量の URL でスクレイパーを使用する方法に関連しています。たとえば、SmokeDoc から始めることができます。

于 2013-02-28T19:02:19.833 に答える