4

非常に単純です。特定の Web サイトまたは Web サイトのセクションから単語の頻度を抽出する簡単な方法を探しているだけです。

また、Web サイト全体で特定の 2 つの単語間の平均距離を計算することにも関心があります。距離の単位は単語です。

私がこの質問をしているのは、率直に言って、そのようなタスクを実行する直感につながる多くの情報を見つけることができなかったからです. Webスパイダーやスクレイピングの経験はありません。

ありがとう(以前にこの質問をしましたが、形式が適切ではありませんでした)

4

1 に答える 1

1

Scrapyを使用してみることができます 。Web サイトをスクラップするための非常に強力なツールですが、正規表現と XPath の知識が必要になる場合があります。チュートリアルに従ってみてください。

于 2013-06-18T14:10:47.013 に答える