1

特定の国における特定のフレーズの重要性を視覚化しようとしています。私が収集するデータは、さまざまな国でのさまざまな用語に対する Google での結果の数です。たとえば、英国の「赤ずきんちゃん」をエジプトと比較したり、そのようなものです。検索用語には英語のみを使用するため (12 か国、オンザフライ検索、Google 翻訳を無料で使用しない)、ローカルの英語 Web サイトの量に応じて結果を正規化する必要があります。

たとえば、エジプトで "American Pie" の結果が 10000 件得られ、米国では 100 万件の結果が得られたが、エジプトには英語の Web サイトが約 100000 件ある場合、"American Pie" はエジプトでより人気があると結論付けます。アメリカ。

各国に英語のウェブサイトがいくつあるかを推定する良い方法が必要です. 何か案は?
これまで、「the」を正規化用語として使用して正規化しようとしましたが、結果は歪んでいるようです。

4

0 に答える 0